轉(zhuǎn)帖|大數(shù)據(jù)新聞|編輯:蔣永|2019-01-25 13:39:27.000|閱讀 452 次
概述:與不斷發(fā)展的數(shù)據(jù)生態(tài)系統(tǒng)相結(jié)合,企業(yè)需要可靠,可信任,現(xiàn)時的數(shù)據(jù),以實現(xiàn)實時可操作的洞察力。 面向當(dāng)今企業(yè)面臨的現(xiàn)代數(shù)據(jù)生態(tài)系統(tǒng)挑戰(zhàn),出現(xiàn)了大數(shù)據(jù)結(jié)構(gòu) (Big Data Fabric)。
# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
相關(guān)鏈接:
今天的數(shù)據(jù)格局以指數(shù)級增長的數(shù)據(jù)為特征,包括各種結(jié)構(gòu)化,非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)類型,這些數(shù)據(jù)類型源自位于本地,云端和邊緣的不斷增加的不同數(shù)據(jù)源。與不斷發(fā)展的數(shù)據(jù)生態(tài)系統(tǒng)相結(jié)合,企業(yè)需要可靠,可信任,現(xiàn)時的數(shù)據(jù),以實現(xiàn)實時可操作的洞察力。面向當(dāng)今企業(yè)面臨的現(xiàn)代數(shù)據(jù)生態(tài)系統(tǒng)挑戰(zhàn),出現(xiàn)了大數(shù)據(jù)結(jié)構(gòu)(Big Data Fabric)。
大數(shù)據(jù)結(jié)構(gòu)提供了一種全面的方法論來克服快速增長的數(shù)據(jù),不斷變化的應(yīng)用程序需求和分布式處理需求的挑戰(zhàn)。 Forrester將大數(shù)據(jù)結(jié)構(gòu)描述為“通過自動,智能,安全地編排業(yè)務(wù)數(shù)據(jù)源,然后在Hadoop和Apache Spark等大數(shù)據(jù)平臺,數(shù)據(jù)湖,內(nèi)存和NoSQL中準備和處理業(yè)務(wù)數(shù)據(jù)之統(tǒng)一、可信和全面的視圖。”
在實際使用中大數(shù)據(jù)結(jié)構(gòu)包含以下6個層,它們協(xié)調(diào)工作,提供大數(shù)據(jù)的無縫,實時集成:
大數(shù)據(jù)結(jié)構(gòu)可以涵蓋各種數(shù)據(jù)位置和來源。 它可以處理,管理,分析和存儲來自眾多來源的幾乎任何數(shù)量的數(shù)據(jù),以及通過采用各種接口的應(yīng)用程序和工具訪問這些數(shù)據(jù)。
對于數(shù)據(jù)至關(guān)重要但卻因為傳統(tǒng)系統(tǒng)過于緩慢,過于隔離且效率低下而難以及時收集公司和外部數(shù)據(jù)組合,因而難以得到可靠,可操作的洞察力的企業(yè)應(yīng)該關(guān)注大數(shù)據(jù)結(jié)構(gòu)。
同樣,業(yè)務(wù)部門以不同格式存儲來自不同系統(tǒng)的大量數(shù)據(jù)的大公司,因此造成大數(shù)據(jù)孤島,導(dǎo)致必須手動集成大型數(shù)據(jù)集,從而侵蝕企業(yè)大數(shù)據(jù)投資,也應(yīng)該關(guān)注大數(shù)據(jù)結(jié)構(gòu)。
大數(shù)據(jù)結(jié)構(gòu)為企業(yè)提供了一種永久性和可擴展的機制,可以在一個統(tǒng)一平臺中整合其所有數(shù)據(jù)。大數(shù)據(jù)結(jié)構(gòu)利用來自多個異構(gòu)節(jié)點的存儲和處理能力,實現(xiàn)企業(yè)范圍內(nèi)對企業(yè)所有數(shù)據(jù)資產(chǎn)的訪問。根據(jù)Forrester的說法,大數(shù)據(jù)結(jié)構(gòu)幫助企業(yè)“......快速攝取,轉(zhuǎn)換,編排和準備流式和批量數(shù)據(jù),以支持客戶和業(yè)務(wù)的實時可信視圖。”
此外,大數(shù)據(jù)結(jié)構(gòu)使公司能夠:
從解決問題的角度來看,大數(shù)據(jù)結(jié)構(gòu)克服了數(shù)據(jù)可用性不足,數(shù)據(jù)存儲和安全性不可靠,孤立數(shù)據(jù),可擴展性差以及對表現(xiàn)不佳的傳統(tǒng)系統(tǒng)的依賴等挑戰(zhàn)。
大數(shù)據(jù)結(jié)構(gòu)支持的各種用例包括實時洞察和機器學(xué)習(xí),以及流式和高級分析。 它支持跨各種大數(shù)據(jù)平臺(如數(shù)據(jù)湖,Hadoop和NoSQL)編排數(shù)據(jù)流和數(shù)據(jù)整理,以支持單一版本的事實,客戶個性化和高級大數(shù)據(jù)分析。 Forrester認可的頂級大數(shù)據(jù)結(jié)構(gòu)用例包括客戶360度視圖,物聯(lián)網(wǎng)(IoT)分析以及實時和高級分析。
Forrester認為Cloudera(以及2019年1月與Cloudera合并的Hortonworks)是大數(shù)據(jù)結(jié)構(gòu)的前15大廠商之一。 Cloudera的年收入超過1億美元,被定位為大數(shù)據(jù)結(jié)構(gòu)的“大型參與者”。其理念見Forrester以下圖1。
下面的圖2描述了Cloudera企業(yè)平臺如何實現(xiàn)六層大數(shù)據(jù)結(jié)構(gòu)體系結(jié)構(gòu)。 Cloudera企業(yè)平臺作為大數(shù)據(jù)結(jié)構(gòu)的四個主要優(yōu)點將在后面段落中介紹。
企業(yè)尋求高價值,敏捷的分析。組織需要一個可以支持其業(yè)務(wù)目標的統(tǒng)一數(shù)據(jù)管理和分析平臺。企業(yè)正在尋求更高的靈活性來檢測變化并主動響應(yīng)。 Cloudera 企業(yè)版是一站式方案,可跨內(nèi)部部署和云,有時是實時數(shù)據(jù)源,運行針對多個數(shù)據(jù)源的分析模型和算法。
Cloudera支持從邊緣到AI的高價值分析用例,包括主動和預(yù)測性維護,針對通信的基于使用情況的分析,推薦引擎,企業(yè)風(fēng)險管理,反洗錢,欺詐檢測/預(yù)防,網(wǎng)絡(luò)安全和機器模型。
數(shù)據(jù)目錄對于分享有關(guān)分布式數(shù)據(jù)的知識以及改進數(shù)據(jù)質(zhì)量,信任和治理至關(guān)重要。
數(shù)據(jù)目錄提供:
(a)統(tǒng)一的數(shù)據(jù)和元數(shù)據(jù)視圖,以便于搜索和發(fā)現(xiàn)數(shù)據(jù)資產(chǎn)。
(b)跟蹤和管理數(shù)據(jù)使用和共享的能力。
(c)跨分析生命周期的一致數(shù)據(jù)上下文。
Cloudera的共享數(shù)據(jù)目錄定義并保留跨分析生命周期的分布式異構(gòu)數(shù)據(jù)的結(jié)構(gòu)和業(yè)務(wù)環(huán)境,使數(shù)據(jù)使用者能夠提取業(yè)務(wù)價值。此共享數(shù)據(jù)目錄強制遵守數(shù)據(jù)安全性,隱私,保留策略和流程,以確保使用者的持續(xù)信任,并促進遵守法規(guī)和法律要求。
傳統(tǒng)數(shù)據(jù)平臺無法滿足現(xiàn)代數(shù)據(jù)生態(tài)系統(tǒng)眾多需求所需的規(guī)模,多樣性和速度。此外,分析工作負載變得越來越大,越來越復(fù)雜,因此對高性能分析的交付更具挑戰(zhàn)性。 Cloudera 企業(yè)版以經(jīng)濟高效的方式為各種分析工作負載提供按需彈性規(guī)模和多租戶功能。它在單一平臺上提供全方位的功能,包括數(shù)據(jù)攝取,數(shù)據(jù)處理,數(shù)據(jù)發(fā)現(xiàn)以及描述性,規(guī)范性和預(yù)測性分析。
企業(yè)尋求地點透明性。因此,他們需要靈活的基礎(chǔ)架構(gòu)來隨處運行分析,包括云中,所有設(shè)備和多個不同云平臺上的更多應(yīng)用程序。 Cloudera支持邊緣,數(shù)據(jù)中心,公共云或其任何組合的應(yīng)用程序和業(yè)務(wù)解決方案。
慧都大數(shù)據(jù)專業(yè)團隊為企業(yè)提供Cloudera大數(shù)據(jù)平臺搭建,免費業(yè)務(wù)咨詢,定制開發(fā)等完整服務(wù),快速、輕松、低成本將任何Hadoop集群從試用階段轉(zhuǎn)移到生產(chǎn)階段。
大數(shù)據(jù)結(jié)構(gòu)為企業(yè)提供了一個機會,可以用可行的解決方案替換原有系統(tǒng),以滿足業(yè)務(wù)需求,統(tǒng)一數(shù)據(jù),簡化和加速當(dāng)今復(fù)雜數(shù)據(jù)環(huán)境中的工作負載。 Cloudera 企業(yè)版作為大數(shù)據(jù)結(jié)構(gòu),是創(chuàng)建統(tǒng)一數(shù)據(jù)環(huán)境以實現(xiàn)現(xiàn)代化和加速復(fù)雜數(shù)據(jù)管理和分析工作負載的理想選擇。
//本文轉(zhuǎn)載自Cloudera中國
本站文章除注明轉(zhuǎn)載外,均為本站原創(chuàng)或翻譯。歡迎任何形式的轉(zhuǎn)載,但請務(wù)必注明出處、不得修改原文相關(guān)鏈接,如果存在內(nèi)容上的異議請郵件反饋至chenjj@fc6vip.cn
文章轉(zhuǎn)載自: