數據分析工具,你選對了嗎?
一個數據分析項目,通常數據處理時間占70%以上,使用先進的工具有利于提升效率。那么,哪款數據分析工具深受數據分析師們的青睞呢?
當然是 IBM 數據分析大家族里的 Data Sets。
Data Sets是提供的一種新的數據門戶,用于創建一個定制的、用戶經常使用的items的集合。Data Sets從packages或data modules中創建。當Data Sets更新后,下次在儀表板或storytelling中使用的也將是最新的Data Sets版本。
通過從一個package或者一個data module中選擇一個或多個列的方式定義Data Sets,并且可以使用過濾來減少記錄數量。相當于對數據做了一個行和列的過濾,取得數據的子集。數據被提取出來存放在系統中。由于數據被緩存了,Data Sets可以提高查詢效率,減少數據庫的工作負載。也可以用Data Sets為數據保留一個特定時間的版本。

一起來看一下在儀表板中使用Data Sets的基本方法
首先,打開儀表板,選擇FM package。

在下面的界面中定義Data Sets的行和列。

接下來,我們將介紹進階的使用方法。
匯總明細值,抑制重復
當從package或者data module中創建Data Sets時,可以選擇是否匯總明細值,抑制重復。當勾選了這個選項時,測量值會以顯式包含在這個Data Sets中的最小粒度做一個匯總。例如,您的數據倉庫中可能有一張數百萬條記錄的銷售表,里面記錄了各個銷售商的銷售數量,但是您只想對每個區域的銷售數量進行分析。假設您的數據集中只包含了“區域”和“銷售數量”這兩列,并且您勾選了“匯總明細值,抑制重復”,那么這個Data Sets中將只包含和您的“區域”數量相當的記錄數。
請注意觀察比較下面的兩張圖,勾選了匯總的圖中“Quantity”列的數值比沒有勾選匯總的圖中的“Quantity”列的數值大得多,這是因為前者做了一個Group by的匯總計算。


使用這個選項的好處是,它可以將數據集壓縮到更少的行,這可以帶來更好的性能。但是,當您需要在分析中關注信息細節的時候就不要使用這個選項。
刷新Data Sets
通過Cognos Analytics門戶,您可以隨時改變數據集的列和過濾器。您也可以隨時更新它的數據,或者定義一張時間表自動刷新數據,例如每周、每天、每小時或每X分鐘。

從Data Sets中創建Data Sets
通常我們是從data module中創建 Data Sets的,但其實也可以從Data Sets中創建Data Sets。每個Data Sets都允許您進一步的連接、匯總和預計算數據。使用這種方法您可以在匯總數據的基礎上進一步匯總。您可以將數億條記錄通過匯總削減成更適合專題探索的信息。
Data Sets的控制
DataSets和包括底層數據庫在內的所有系統都是分隔的,因此數據庫管理員不必擔心對Data Sets的查詢會消耗數據庫系統的運算資源。通過使用過濾器非常容易控制Data Sets 的大小。Cognos管理員可以限定單個Data Sets的大小和系統上任何一個用戶可以占用的總量。Cognos管理員也可以控制誰可以創建Data Sets。如果儀表板使用的Data Sets比較小,那么響應速度就非??臁?/p>
在Cognos 環境之間移動Data Sets
可以把Data Sets從一個Cognos Analytics環境轉移到另一個環境。如果您需要把開發環境中經過測試的Data Sets發布到生產環境中,首先要在開發環境中創建一個包含了有Data Sets的那些文件夾的“Deployment”。如果希望包含提取的數據,需要勾選“Include reportoutput versions”,否則只有Data Sets 的元數據信息。之后再將這個“Deployment”導入到生產環境中。
Data Sets替換Data Modules的快照模式
Cognos Analytics的先前版本在Data Modules中提供了一個快照模式選項,這種方式會提取所有數據。在11.0.4 中此快照模式不再可用,它已經被Data Sets 替代。在先前版本中設置為快照模式的Data Modules將升級到11.0.4及更高版本中的“live”/“regular” data modules。與現在已棄用的快照模式相比,數據集具有以下優點:
- Data Sets提供了提取匯總值或詳細值的選項。
- Data Sets將數據存儲為單個表,而快照模塊為模塊中的每個表存儲單獨的文件。 在其他條件相同的情況下,不要求Join的查詢將更快。
- 可以將Data Modules的子集提取到Data Sets中。
- Data Sets可以按照計劃定時刷新。
看完以上的對于Data Sets的深度介紹,作為數據分析師的你,有沒有躍躍一試的感覺?不想每天加班做數據分析的你,快來使用Data Sets來提高你的工作效率。
慧都控件網2017開年鉅惠,全場6折起,限時讓利,過時不候?。。?gt;>>
截止時間:2017年1月31日
詳情請咨詢!
客服熱線:023-66090381