Tableau——樹狀圖(桑基圖)
本期主題:
利用可視化工具Tableau繪製桑基圖(Sankey Diagram),採用2021年最新QS世界大學排名數據。
什麼是桑基圖?
桑基圖(Sankey diagram),即桑基能量分流圖,也叫桑基能量平衡圖。它是一種特定類型的流程圖,圖中延伸的分支的寬度對應數據流量的大小,通常應用於能源、材料成分、 金融等數據的可視化分析。因1898年Matthew Henry Phineas Riall Sankey繪製的“ 蒸汽機的能源效率圖”而聞名,此後便以其名字命名為“桑基圖”。 (來源:百度百科)
桑基圖最明顯的特徵就是,始末端的分支寬度總和相等,即所有主支寬度的總和應與所有分出去的分支寬度的總和相等,保持能量的平衡。
採用什麼源數據?
2021年最新QS世界大學排名數據,詳情請戳
今年的QS世界大學排名揭曉了來自世界各地的前10,00所大學,覆蓋了80個不同的國家和地區。
從中提取部分數據,作為源數據。
繪製成什麼樣子?
本篇通過Talbeau工具,把TOP50的大學繪製成大學排名樹,如上圖所示。
該圖由兩部分組成:
1.樹枝(對應大學排名)
2.樹幹(對應大學所在的國家)
在Tableau中,分別繪製兩部分後,即可完成。
如何繪製?
第一步:回顧S型曲線
在這之前,我們先穿越到高中時代,學習下Logistic函數(Sigmoid函數),該函數的公式定義如下:
繪製出來的函數如下,形狀為S型,故也稱S型曲線
該函數有如下特徵:
1.連續,光滑,嚴格單調
2.當x趨近於負無窮時,y趨近於0;當x趨近於正無窮時,y趨近於1;當x=0時,y=0.5
3.關於(0,0.5)中心對稱
4.值域為(0,1)
在繪製桑基圖的過程中,利用該曲線的計算,完成圖表字段中,“位置1”指向“位置2”,可以理解為能量的流動指向。
第二步:數據預處理
準備2個excel表格數據
1.在第一個表格中,新增“ID”字段,範圍為1~50,等差數控制為1;新增“From”字段,值為“country”;新增一列“link”字段,值為“link”。
2.在第二個表格中,新建兩個字段,一個為“link”字段,值為“link”;另一個為“t”字段,值為-6到6的等差數列,差值為0.25 (t值即作為後續繪製S型曲線的變量)
第三步:開啟Tableau工具
1.繪製樹枝
1)新建數據源,連接sheet1與sheet2,選擇“內部”聯接方式,連接字段為“link”
2)在工作表上,創建五個計算字段。
第一個計算字段為logistics函數:
第二、三、四計算字段如下:
第五個字段為:
3)將度量中的T拖拽到行,將度量中的f(x)country-university拖拽到列,在工具欄“分析”中將“聚合度量”取消
4)標記選擇“線”。
5)把“From”和“University”拖拽至詳細訊息,“Country”拖拽到顏色以區分不同的國家。
至此,完成樹枝的繪製。
3.繪製樹幹
1)創建計算字段
在新工作表上參照“繪製樹枝”的方式進行設置,不再贅述。
第四步:儀表板拼接工作表
1、新建儀表板,把樹枝、樹幹的圖表進行垂直拼接
2、新建儀表板標題
3、進行最後的保存操作
完工! ! !