轉帖|使用教程|編輯:況魚杰|2020-05-21 17:42:34.477|閱讀 562 次
概述:現(xiàn)在可使用新的采樣算法來改進散點圖表示高密度數(shù)據(jù)的方式 。Power BI 改進了高密度數(shù)據(jù)的采樣,本文詳細介紹了相關信息。
# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
相關鏈接:
使用 Power BI Desktop 從數(shù)據(jù)獲得見解,然后進行相關操作利用可視化分析免費創(chuàng)建內容豐富的交互式報表,一切盡在指尖。
現(xiàn)在可使用新的采樣算法來改進散點圖表示高密度數(shù)據(jù)的方式 。
例如,可以通過組織的銷售活動創(chuàng)建一個散點圖,其中每個商店每年都有成千上萬個數(shù)據(jù)點。此類信息的散點圖將對可用數(shù)據(jù)進行數(shù)據(jù)采樣(選擇數(shù)據(jù)中有意義的代表,以展示銷售情況如何隨時間變化),并創(chuàng)建一個散點圖表示基礎數(shù)據(jù)。這是高密度散點圖中的常見做法。 Power BI 改進了高密度數(shù)據(jù)的采樣,本文詳細介紹了相關信息。
高密度散點圖的工作方式
以前,Power BI 以確定性方式在所有基礎數(shù)據(jù)中選擇采樣數(shù)據(jù)點的集合來創(chuàng)建散點圖。具體而言,Power BI 會在散點圖系列中選擇第一行和最后一行數(shù)據(jù),然后將剩余的行平均分配,以便在散點圖上繪制總共 3,500 個數(shù)據(jù)點。 例如,如果示例有 35,000 行,則選擇第一行和最后一行進行繪制,然后每 10 行繪制一個數(shù)據(jù)點(35,000/10 = 每 10 行 = 3,500 個數(shù)據(jù)點)。
另外,在此之前,在數(shù)據(jù)系列中無法繪制的 null 值或點(如文本值)不會顯示出來,因此在生成視覺對象時不會加以考慮。通過此類采樣,散點圖的感知密度同樣會基于代表性數(shù)據(jù)點,因此隱含的可視化密度屬于采樣點,而不是基礎數(shù)據(jù)的完整集合。
啟用“高密度采樣” 時,Power BI 會執(zhí)行一種算法來消除重疊點,并確保與視覺對象交互時可以訪問視覺對象上的點。此外,該算法還可確保數(shù)據(jù)集中的所有點都會顯示在視覺對象中,從而為所選點的含義提供上下文,而不是僅僅繪制一個代表性的樣本。
根據(jù)定義,對高密度數(shù)據(jù)進行采樣,以快速合理地創(chuàng)建能響應交互操作的視覺對象。視覺對象上過多的數(shù)據(jù)點可能會阻礙它并降低趨勢的可見性。因此,如何對數(shù)據(jù)進行采樣才能提供最佳的視覺對象體驗并確保表示所有數(shù)據(jù)這一疑問推動了采樣算法的創(chuàng)建。Power BI 中現(xiàn)對該算法進行了改進,將整體數(shù)據(jù)集中重要點的響應、表示和清楚保存以最佳方式組合。
新的散點圖采樣算法的工作方式
適用于散點圖的“高密度采樣”的新算法采用能夠更有效地捕獲和表示基礎數(shù)據(jù)的方法,此類方法還可以消除重疊點 。具體操作方法為:首先為每個數(shù)據(jù)點繪制一個小型半徑(可視化效果上給定點的可視圓圈大小)。然后增加所有數(shù)據(jù)點的半徑大小;當兩個(或多個)數(shù)據(jù)點重疊時,用一個(增加了半徑大小的)圓圈表示這些重疊的數(shù)據(jù)點。 該算法繼續(xù)增加數(shù)據(jù)點的半徑,直到半徑值產生的合理數(shù)量的數(shù)據(jù)點(3,500)顯示在散點圖中。
此算法中的方法可確保在生成的視覺對象中顯示離群值。該算法在確定重疊的同時還會設置比例,完全按照基礎可視化點直觀顯示指數(shù)比例。該算法還將保留散點圖的整體形狀。
注意:將高密度采樣算法用于散點圖時,目標是準確分發(fā)數(shù)據(jù),而不是隱含的可視化密度。例如,你可能會看到一個散點圖,其中有許多圓圈在某個區(qū)域重疊(密度),并想像肯定有許多數(shù)據(jù)點聚集在那里;由于高密度采樣算法可以使用一個圓圈來表示許多數(shù)據(jù)點,因此隱含的可視化密度(或“群集”)將不會出現(xiàn)。
此外,會忽略不能繪制的數(shù)據(jù)點(例如 null 或文本值),因此選擇另一個可以繪制的值,從而進一步確保散點圖的真實形狀保持不變。
使用散點圖的標準算法時
在一些情況下,高密度采樣不能應用于散點圖,而是使用原始算法 。 這些情況如下所示:
如何為散點圖啟用高密度采樣
要啟用“高密度采樣”,請選擇散點圖,轉到“格式設置”窗格,展開“常規(guī)”卡,然后在卡片的底部附近,將“高密度采樣”切換滑塊切換為“開” 。
注意:啟用滑塊后,Power BI 將在可能的情況下嘗試使用“高密度采樣” 算法。如果該算法無法使用(例如,在“播放” 軸添加一個值),滑塊將停留在“打開” 位置,即使圖表已恢復為標準算法也是如此。如果之后你從“播放”軸刪除一個值(或者情況變為允許使用高密度采樣算法),由于功能處于活動狀態(tài),圖表將自動為該圖表使用高密度采樣 。
注意事項和限制
高密度采樣算法是 Power BI 的一個重要改進,但在使用高密度值和散點圖時需要了解以下注意事項。
本文內容就到這里了,本教程后面會持續(xù)更新,感興趣的朋友可以多多關注,如果您能在評論區(qū)留言提出問題或者解決問題,我們將會很高興!
相關內容推薦:
想要購買Power BI Desktop正版授權,或了解更多產品信息請點擊在線客服
也歡迎撥打慧都熱線023-68661681,我們有專業(yè)的大數(shù)據(jù)團隊,為您提供免費大數(shù)據(jù)相關業(yè)務咨詢!
本站文章除注明轉載外,均為本站原創(chuàng)或翻譯。歡迎任何形式的轉載,但請務必注明出處、不得修改原文相關鏈接,如果存在內容上的異議請郵件反饋至chenjj@fc6vip.cn
文章轉載自: