為什么選擇 MapR Data Science Refinery?
可以訪問所有數(shù)據(jù)因而有更準(zhǔn)確的見解
MapR Data Science Refinery是唯一可以安全訪問所有數(shù)據(jù)的數(shù)據(jù)科學(xué)產(chǎn)品。它用以下東西連接盒子:
MapR-XD: 用于文件和容器
• 全球分布式數(shù)據(jù)存儲
• 高規(guī)模,且可靠
MapR-DB:高度可擴(kuò)展的多模型NoSQL數(shù)據(jù)庫管理系統(tǒng)
• 支持多種數(shù)據(jù)模型,包括寬列,文檔,鍵值和時(shí)間序列。
MapR-ES: 全球發(fā)布 - 訂閱事件流媒體系統(tǒng)
• 融合數(shù)據(jù)平臺內(nèi)置的第一個(gè)大數(shù)據(jù)規(guī)模流媒體系統(tǒng)
• 唯一可以在物聯(lián)網(wǎng)規(guī)模上可靠地支持全球事件復(fù)制的大數(shù)據(jù)流系統(tǒng)
創(chuàng)建實(shí)時(shí)機(jī)器學(xué)習(xí)管道
MapR平臺的核心組件是MapR-ES,它是一個(gè)針對大數(shù)據(jù)的全球發(fā)布 - 訂閱事件流媒體系統(tǒng)。通過MapR-ES和機(jī)器學(xué)習(xí)庫的本地集成,企業(yè)現(xiàn)在可以創(chuàng)建實(shí)時(shí)機(jī)器學(xué)習(xí)管線,使他們能夠?qū)L模型應(yīng)用于實(shí)時(shí)數(shù)據(jù)。
通過廣泛的語言和圖書館支持提高數(shù)據(jù)科學(xué)的生產(chǎn)力
MapR數(shù)據(jù)科學(xué)精煉廠提供了Apache Zeppelin數(shù)據(jù)科學(xué)筆記本,可以在一個(gè)視覺空間中跨越多個(gè)引擎工作:
• 使用Apache Spark和Python進(jìn)行分布式計(jì)算和ML編程
• 使用Apache Hive和Drill的批處理和交互式SQL
• Apache Pig的腳本支持
• Shell 訪問 MapR-FS
• 使用Spark編程訪問MapR-DB和MapR-ES
使用持久和有狀態(tài)的容器輕松部署
容易部署
• Docker Hub上有Docker鏡像。
• Image包含了所有必要的功能,不再需要使用MapR作為集裝箱化應(yīng)用程序的持久數(shù)據(jù)存儲。
安全
• 身份驗(yàn)證發(fā)生在容器級別,以確保容器化的應(yīng)用程序只能訪問授權(quán)的數(shù)據(jù)。
• 加密通信以確保在訪問MapR中的數(shù)據(jù)時(shí)的隱私.
可擴(kuò)展
• Dockerfile也將在GitHub上提供,允許您根據(jù)需要進(jìn)一步自定義圖像以支持您的特定應(yīng)用程序需求。
持久
• 容器可以輕松地利用所有的MapR平臺服務(wù)(MapR-FS,MapR-DB,MapR流)作為持久數(shù)據(jù)存儲。
為數(shù)據(jù)科學(xué)家提供強(qiáng)大的可視化支持
MapR數(shù)據(jù)科學(xué)精煉廠配備了8個(gè)開箱即用的可視化庫,包括MatPlotLib和GGPlot2。Apache Zeppelin提供了一個(gè)可插入的可視化框架使得:
• NPM注冊表中提供常見的可視化庫
• 輕松創(chuàng)建和加載自定義可視化的功能
啟用筆記本/模型協(xié)作,共享和鏡像
MapR融合數(shù)據(jù)平臺非常適合存儲模型和筆記本存儲庫。組織可以利用MapR平臺的全局名稱空間和卓越的復(fù)制功能。MapR平臺還提供了不變的快照,以保存和部署相同模型的各種版本,從而使數(shù)據(jù)科學(xué)家能夠比較每個(gè)版本模型的性能和準(zhǔn)確性。
京ICP備09015132號-996 | 違法和不良信息舉報(bào)電話:4006561155
© Copyright 2000-2026 北京哲想軟件有限公司版權(quán)所有 | 地址:北京市海淀區(qū)西三環(huán)北路50號豪柏大廈C2座11層1105室
北京哲想軟件集團(tuán)旗下網(wǎng)站:哲想軟件 | 哲想動畫