Tableau——樹狀圖(桑基圖)

blank

Tableau——樹狀圖(桑基圖)

本期主題:

利用可視化工具Tableau繪製桑基圖(Sankey Diagram),採用2021年最新QS世界大學排名數據。

什麼是桑基圖?

桑基圖(Sankey diagram),即桑基能量分流圖,也叫桑基能量平衡圖。它是一種特定類型的流程圖,圖中延伸的分支的寬度對應數據流量的大小,通常應用於能源、材料成分、 金融等數據的可視化分析。因1898年Matthew Henry Phineas Riall Sankey繪製的“ 蒸汽機的能源效率圖”而聞名,此後便以其名字命名為“桑基圖”。 (來源:百度百科)

blankblank

桑基圖最明顯的特徵就是,始末端的分支寬度總和相等,即所有主支寬度的總和應與所有分出去的分支寬度的總和相等,保持能量的平衡。

採用什麼源數據?

2021年最新QS世界大學排名數據,詳情請戳

blankblank

今年的QS世界大學排名揭曉了來自世界各地的前10,00所大學,覆蓋了80個不同的國家和地區。

從中提取部分數據,作為源數據。

繪製成什麼樣子?

blankblank

本篇通過Talbeau工具,把TOP50的大學繪製成大學排名樹,如上圖所示。

該圖由兩部分組成:

1.樹枝(對應大學排名)

2.樹幹(對應大學所在的國家)

在Tableau中,分別繪製兩部分後,即可完成。

如何繪製?

第一步:回顧S型曲線

在這之前,我們先穿越到高中時代,學習下Logistic函數(Sigmoid函數),該函數的公式定義如下:

繪製出來的函數如下,形狀為S型,故也稱S型曲線

blankblank

該函數有如下特徵:

1.連續,光滑,嚴格單調

2.當x趨近於負無窮時,y趨近於0;當x趨近於正無窮時,y趨近於1;當x=0時,y=0.5

3.關於(0,0.5)中心對稱

4.值域為(0,1)

在繪製桑基圖的過程中,利用該曲線的計算,完成圖表字段中,“位置1”指向“位置2”,可以理解為能量的流動指向。

第二步:數據預處理

準備2個excel表格數據

1.在第一個表格中,新增“ID”字段,範圍為1~50,等差數控制為1;新增“From”字段,值為“country”;新增一列“link”字段,值為“link”。

blankblank

2.在第二個表格中,新建兩個字段,一個為“link”字段,值為“link”;另一個為“t”字段,值為-6到6的等差數列,差值為0.25 (t值即作為後續繪製S型曲線的變量)

第三步:開啟Tableau工具

1.繪製樹枝

1)新建數據源,連接sheet1與sheet2,選擇“內部”聯接方式,連接字段為“link”

blankblank

2)在工作表上,創建五個計算字段。

第一個計算字段為logistics函數:

第二、三、四計算字段如下:

blankblank
blankblank

第五個字段為:

blankblank

3)將度量中的T拖拽到行,將度量中的f(x)country-university拖拽到列,在工具欄“分析”中將“聚合度量”取消

4)標記選擇“線”。

5)把“From”和“University”拖拽至詳細訊息,“Country”拖拽到顏色以區分不同的國家。

至此,完成樹枝的繪製。

3.繪製樹幹

1)創建計算字段

blankblank

在新工作表上參照“繪製樹枝”的方式進行設置,不再贅述。

blankblank

第四步:儀表板拼接工作表

1、新建儀表板,把樹枝、樹幹的圖表進行垂直拼接

2、新建儀表板標題

3、進行最後的保存操作

blankblank

完工! ! !

What do you think?

Written by marketer

blank

我們為什麼放棄Tableau和Powerbi而選擇Qlik

blank

Tableau|可視化報表設計和應用