轉(zhuǎn)帖|行業(yè)資訊|編輯:陳俊吉|2016-06-01 11:10:21.000|閱讀 353 次
概述:本期主要講解如何使用Watson Analytics獲取更優(yōu)質(zhì)的數(shù)據(jù),以及介紹Watson Analytics的具體功能。
# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
相關(guān)鏈接:
上期文章《互聯(lián)網(wǎng)時代,人人均可開啟自助分析之旅》給大家簡單介紹了Watson Analytics及其相關(guān)特點。接下來幾期文章將為大家一一介紹Watson Analytics的具體功能。
我們知道,Watson Analytics能夠提供自動數(shù)據(jù)獲取、數(shù)據(jù)探索、講故事及向?qū)降念A測分析功能,它能幫助無IT經(jīng)驗的業(yè)務(wù)用戶不論何時何地,都可以從自己的數(shù)據(jù)集中找到業(yè)務(wù)問題的答案。
Watson Analytics的確是大數(shù)據(jù)分析領(lǐng)域的一次革命:
使用Watson Analytics進行數(shù)據(jù)分析的過程如下圖所示。
Watson Analytics嵌入式的數(shù)據(jù)管理服務(wù)包括數(shù)據(jù)訪問、數(shù)據(jù)優(yōu)化和數(shù)據(jù)管理。基于云平臺的數(shù)據(jù)管理服務(wù)能夠自動搜索、獲取并優(yōu)化數(shù)據(jù)集,完成所有這些工作僅僅需要您點擊按鈕即可實現(xiàn)。并且,它使用了最新的列式存儲、內(nèi)存計算的技術(shù)來輕松應(yīng)對海量的數(shù)據(jù)集。Watson Analytics也能夠?qū)σ鸭虞d數(shù)據(jù)的數(shù)據(jù)質(zhì)量進行評分,突出顯示那些可能危害分析結(jié)果的潛在的數(shù)據(jù)問題。這些能力對您意味著什么呢?基本上您不再需要擔心數(shù)據(jù)質(zhì)量問題了。實際上,Watson Analytics就是用來分析那些您認為已經(jīng)準備好的數(shù)據(jù)。依靠自動化處理與內(nèi)置的數(shù)據(jù)優(yōu)化服務(wù),您可以得到最佳狀態(tài)的數(shù)據(jù)并更好的理解它們。不論您身處市場、銷售、IT、運營、人力資源,或者財務(wù)等部門,有了高質(zhì)量可信的數(shù)據(jù),接下來的數(shù)據(jù)分析工作就將得心應(yīng)手了。
示例體驗
下面我們通過一個實際的例子體會Watson Analytics的這一能力。
1. 登錄Watson Analytics(您可以通過本文最后章節(jié)的試用鏈接注冊,并得到免費試用版本)。
2. 加載數(shù)據(jù)。
單擊下圖中的“Add”圖標添加需要分析的數(shù)據(jù)。
在出現(xiàn)的窗口中,有三種方式添加數(shù)據(jù)。分別是通過拖拽方式、選擇上傳文件、選擇示例數(shù)據(jù)。如下圖所示。如果您使用的是個人版、專業(yè)版等其它版本的Watson Analytics,您還可以連接其它數(shù)據(jù)源獲取數(shù)據(jù),如:關(guān)系型數(shù)據(jù)庫、Cognos報表、Twitter、DropBox、Box、OneDrive等等。
這里我們選擇第3項Sample data,我們選擇了American Time Use Survey data set。這是來自美國勞工部的關(guān)于美國勞工時間使用統(tǒng)計的一個數(shù)據(jù)集。單擊上傳按鈕“Upload”。如下圖所示。
接下來,Watson Analytics會選取對應(yīng)的數(shù)據(jù)文件加載到云端的數(shù)據(jù)庫,并進行轉(zhuǎn)換、數(shù)據(jù)質(zhì)量評分,完成后以圖標方式列在主頁面上。如下圖所示紅框中的圖標即是已經(jīng)加載的數(shù)據(jù)。我們可以看到系統(tǒng)對這個數(shù)據(jù)集的綜合評分為62分。
3. 優(yōu)化數(shù)據(jù)。
單擊上圖紅框中的數(shù)據(jù)集,將出現(xiàn)下圖中的浮動窗口,單擊“Refine”圖標。
您將看到剛剛加載的數(shù)據(jù)集的詳細數(shù)據(jù)質(zhì)量情況。如下圖所示。
您可以單擊左側(cè)菜單欄里的“Action”圖標對數(shù)據(jù)集中的已有的數(shù)據(jù)列進行篩選;對某個數(shù)據(jù)列也可以編輯它的類型,并進行數(shù)據(jù)過濾,數(shù)據(jù)清洗,數(shù)值類型數(shù)據(jù)可以修改匯總的方法;也可以通過計算、分組、建立層級的方式創(chuàng)建新的數(shù)據(jù)列。如下圖所示。
您也可以單擊左側(cè)菜單欄里的“Data Metrics”圖標來查看數(shù)據(jù)集中的數(shù)據(jù)列的數(shù)據(jù)質(zhì)量評分。系統(tǒng)將以圖形方式顯示數(shù)據(jù)列的評分及該列的數(shù)據(jù)分布情況。您可以通過點擊“Action”按鈕來調(diào)整優(yōu)化數(shù)據(jù),來提高數(shù)據(jù)質(zhì)量。如下圖所示。
最后,您可以單擊頁面左上方的保存圖標保存已經(jīng)修改的數(shù)據(jù)。如下圖所示。
可想而知,接下來的數(shù)據(jù)探索和預測分析結(jié)果就將更加準確了。
心動不如行動!現(xiàn)在就來體驗一下Watson Analytics的魅力吧:
via:華南IBM大數(shù)據(jù)支持團隊
本站文章除注明轉(zhuǎn)載外,均為本站原創(chuàng)或翻譯。歡迎任何形式的轉(zhuǎn)載,但請務(wù)必注明出處、不得修改原文相關(guān)鏈接,如果存在內(nèi)容上的異議請郵件反饋至chenjj@fc6vip.cn