一本清日本在线视频精品,亚洲日本va午夜在线影院,国产精品麻花传媒二三区别,色屁屁www免费看欧美激情

010-68421378
當(dāng)前您所在的位置:首頁(yè)>新聞中心>行業(yè)動(dòng)態(tài)

Open Source Engines and Tools:MapR融合數(shù)據(jù)平臺(tái)監(jiān)控和管理系統(tǒng)

發(fā)布時(shí)間:2018/05/15 瀏覽量:5313
Open Source Engines MapR打包了大量的Apache開源生態(tài)系統(tǒng)項(xiàng)目,可以啟用大數(shù)據(jù)應(yīng)用程序。我們的目標(biāo)是為您提供一個(gè)開放的平臺(tái),讓...

Open Source Engines

MapR打包了大量的Apache開源生態(tài)系統(tǒng)項(xiàng)目,可以啟用大數(shù)據(jù)應(yīng)用程序。我們的目標(biāo)是為您提供一個(gè)開放的平臺(tái),讓您選擇正確的工具。 MapR測(cè)試并集成開源生態(tài)系統(tǒng)項(xiàng)目,如Hive™,Pig™,Apache™HBase™和Mahout等等。MapR融合數(shù)據(jù)平臺(tái)和開源項(xiàng)目通過(guò)高級(jí)管理控制臺(tái)連接在一起,以監(jiān)控和管理系統(tǒng)。

MapR生態(tài)系統(tǒng)包(MEP)使客戶能夠快速訪問(wèn)開源社區(qū)的最新創(chuàng)新成果,同時(shí)確保在給定的MEP版本中所有生態(tài)系統(tǒng)項(xiàng)目的互操作性。 MapR率先將平臺(tái)版本從項(xiàng)目版本中分離出來(lái),而MEP則是該過(guò)程的下一個(gè)演進(jìn)。這種解耦使客戶能夠靈活地升級(jí)其環(huán)境,而MEP將確??蛻艟哂型耆嫒莸牟渴?。

MapR還提供開發(fā)人員預(yù)覽,以查看尚在開發(fā)中的新功能和新技術(shù)。

Core Hadoop

Apache Hadoop誕生于處理大量數(shù)據(jù)的需求。網(wǎng)絡(luò)每天都會(huì)產(chǎn)生越來(lái)越多的信息,索引超過(guò)10億頁(yè)的內(nèi)容變得非常困難。 Hadoop已經(jīng)遠(yuǎn)遠(yuǎn)超出了網(wǎng)絡(luò)索引的起點(diǎn),現(xiàn)在已經(jīng)在許多行業(yè)中用于各種各樣的任務(wù),這些任務(wù)都具有結(jié)構(gòu)化和非結(jié)構(gòu)化的多種多樣,數(shù)量和速度的共同主題。

Batch

Apache MapReduce是一個(gè)強(qiáng)大的框架,用于在Hadoop集群上處理大型,分布式的結(jié)構(gòu)化或非結(jié)構(gòu)化數(shù)據(jù)集。MapReduce的關(guān)鍵特性是它能夠在整個(gè)節(jié)點(diǎn)集群上執(zhí)行處理,每個(gè)節(jié)點(diǎn)都處理本地?cái)?shù)據(jù)。這一特性使得MapReduce比傳統(tǒng)的處理大數(shù)據(jù)的方法快幾個(gè)數(shù)量級(jí),這些數(shù)據(jù)通常由訪問(wèn)和處理遠(yuǎn)程SAN或NAS設(shè)備中的數(shù)據(jù)的單個(gè)節(jié)點(diǎn)組成。

Interactive SQL

Apache Drill是一個(gè)用于大規(guī)模數(shù)據(jù)集交互式分析的分布式系統(tǒng)。 Drill與Google的Dremel類似,具有更大的靈活性,可以支持更廣泛的查詢語(yǔ)言,數(shù)據(jù)源和數(shù)據(jù)格式,包括嵌套的自描述數(shù)據(jù)。

NoSQL

Apache HBase是一個(gè)在Hadoop集群上運(yùn)行的數(shù)據(jù)庫(kù)。 客戶端可以通過(guò)本地Java API或通過(guò)Thrift或REST網(wǎng)關(guān)訪問(wèn)HBase數(shù)據(jù),使其可以通過(guò)任何語(yǔ)言訪問(wèn)。

Graph

 

GraphX是一個(gè)在Apache Spark上運(yùn)行的圖形庫(kù)。 開發(fā)人員可以使用他們熟悉的語(yǔ)言和工具來(lái)使用Spark來(lái)實(shí)現(xiàn)需要建模對(duì)象之間關(guān)系的新類型的算法。

機(jī)器學(xué)習(xí)

 

Apache Mahout是一個(gè)功能強(qiáng)大的可伸縮機(jī)器學(xué)習(xí)庫(kù),可以在Hadoop MapReduce之上運(yùn)行。機(jī)器學(xué)習(xí)是一個(gè)人工智能學(xué)科,它使系統(tǒng)能夠僅基于數(shù)據(jù)進(jìn)行學(xué)習(xí),隨著更多數(shù)據(jù)的處理不斷提高性能。機(jī)器學(xué)習(xí)是我們?nèi)粘I钪性S多技術(shù)的基礎(chǔ)。

 

Spark Streaming:當(dāng)Hadoop第一次出現(xiàn)時(shí),它提供了一個(gè)存儲(chǔ)PB級(jí)數(shù)據(jù)的平臺(tái),并對(duì)這些數(shù)據(jù)執(zhí)行批量查詢來(lái)收集洞察力。這種模式適用于許多事例,例如分析大量客戶數(shù)據(jù)以獲取有趣的模式。但是,并非所有數(shù)據(jù)都可以等待批量查詢執(zhí)行。

數(shù)據(jù)工具

 

HttpFS是可用于與MapR分布式文件系統(tǒng)交互的幾個(gè)工具之一。 HttpFS的一些差異化功能包括編程訪問(wèn),版本獨(dú)立性和遠(yuǎn)程訪問(wèn)。

協(xié)調(diào)

 

Apache Oozie是Hadoop用戶有價(jià)值的工具,可以自動(dòng)執(zhí)行常用任務(wù),以節(jié)省時(shí)間并防止用戶錯(cuò)誤。借助Oozie,用戶可以描述在Hadoop集群上執(zhí)行的工作流程,安排這些工作流程在指定條件下執(zhí)行,甚至將多個(gè)工作流程和計(jì)劃組合在一起,以管理整個(gè)生命周期。

圖形用戶界面配置監(jiān)視

 

色調(diào)(Hadoop用戶體驗(yàn))為Hadoop用戶提供了一個(gè)Web GUI,以簡(jiǎn)化創(chuàng)建,維護(hù)和運(yùn)行多種類型的Hadoop作業(yè)的過(guò)程。Hue由多個(gè)與Hadoop組件交互的應(yīng)用程序組成,并且具有開放的SDK以允許創(chuàng)建新的應(yīng)用程序。

管理員

當(dāng)應(yīng)用程序從想法變?yōu)楝F(xiàn)實(shí)時(shí),MapR為Hadoop,Spark和相關(guān)技術(shù)提供了唯一的生產(chǎn)就緒平臺(tái)。

企業(yè)架構(gòu)師

擁有專利的MapR融合數(shù)據(jù)平臺(tái)的設(shè)計(jì)直接向最了解架構(gòu)的企業(yè)架構(gòu)師直言。

開發(fā)人員

MapR為開發(fā)人員提供了用于開發(fā)數(shù)據(jù)應(yīng)用程序的各種流行的開源項(xiàng)目。

下一篇:The MapR Data Science Refinery:可擴(kuò)展的數(shù)據(jù)科學(xué)工具包
上一篇:The MapR Converged Data Platform: 業(yè)界領(lǐng)先的統(tǒng)一數(shù)據(jù)平臺(tái)

                               

 京ICP備09015132號(hào)-996 | 違法和不良信息舉報(bào)電話:4006561155

                                   © Copyright 2000-2026 北京哲想軟件有限公司版權(quán)所有 | 地址:北京市海淀區(qū)西三環(huán)北路50號(hào)豪柏大廈C2座11層1105室

                         北京哲想軟件集團(tuán)旗下網(wǎng)站:哲想軟件 | 哲想動(dòng)畫

                            華滋生物