第三周:TABLEAU數據可視化,讓數據會講故事

blank

第三周:TABLEAU數據可視化,讓數據會講故事

先去官方網站下載Tableau,我下載的是Tableau Public 是一個免費的版本,可以滿足我們一般的學習和數據練習的需求。

Tableau 的優點

  • 容易上手,並且持續吸引消費者鑽研
  • 美觀直接,可視化瞬間表達數據結果
  • 功能強大,尤其在數據探索和可視化絕對是第一名,甚至可以建模
  • 介面開源,直接連接所有類型資料庫,支援SQL、Python、R寫入
  • 多端部署,WIN/MAC桌面用戶端、本地部署和雲端服務
  • 資源豐富,完善的官方使用文檔,多元的社區資源支援
  • 可以重複執行

一、介面介紹和數據源

1、開始頁面

  • 連接:連接到數據表、資料庫或伺服器,是對數據進行操作的第一步
  • 打開:打開最近使用過的工作簿,以及官方範例工作簿
  • 探索:發現和流覽Tableau社區產生的內容,如官方培訓視頻、活動和精選可視化案例
  • 説明:查看官方培訓視頻與產品使用文檔、修改語言、管理產品密鑰
  • 伺服器:登錄到購買/部署的伺服器或TableauPublic,發佈專案到伺服器上

2、數據源介面

導入數據以後,將會進入數據源介面。

在該介面,我們可以:

  • 選擇連接的數據表
  • 對數據進行查看和一些簡單的處理

記得要先明確數據需求再進行針對性的處理,不要盲目進行操作。

● 連接方式

blank

● 連接

blank

● 資料類型

blank

二、可視化原理

數據是如何轉變為可視化圖表的?

blank

1、資料轉換:將資料轉變為可以計算的【度量】以及用於區分的【維度】

• 數值型變數

【度量】

  • 一般是由數位組成的變數,例如:成交金額、用戶數、點擊量
  • 數值變數可以進行計算,並基於計算結果的大小表示圖表的面積大小、 條形長短、顏色深淺等可以量化的視覺元素
  • 類別型變數

【維度】

  • 類別變數包含有限的類別數或可區分組數,例如:使用者ID、性別、來源管道
  • 類別變數主要用來對數值變數的計算結果進行區分,表現為圖表的顏色種類、 圖形位置、分類方式等難以量化的視覺元素

2、視覺映射:【度量】【維度】映射為我們可以感知到的視覺元素(大小、顏色、方向等)

blank

a 位置——散點圖

散點圖把【度量】映射到【位置】,把【維度】映射到【顏色】

    • 【度量】銷售額 ,對應x軸,映射到位置
    • 【度量】利潤,對應y軸,映射到位置
    • 【維度】子類別,映射到顏色
blank
  • 從而顯示不同商品子類別的銷售額與利潤情況。

b 長度——柱狀圖

柱狀圖把【度量】映射到【長度】,用【維度】作區分

    • 【度量】銷售額 ,映射到長度
    • 【維度】地區,用於區分
blank
  • 從而可以比較不同地區的銷售額大小。

c 角度——餅圖

餅圖把【度量】映射到【角度】,把【維度】映射到【顏色】

    • 【度量】銷售額 ,映射到角度
    • 【維度】地區,映射到顏色
blank
  • 從而顯示各個地區銷售額的佔比情況。

d 方向——折線圖

折線圖把【度量】映射到【方向】,把【維度】映射到【顏色】

    • 【度量】銷售額,映射到方向
    • 【維度】地區,映射到顏色
blank
  • 從而顯示各個地區全年的銷售額變化情況。

e. 形狀

  • 形狀主要用於在多組數據分析時區別組別【維度】,我們在日常使用時又稱之為標記,
  • 比如散點圖和折線圖中的形狀:在散點圖裡使用三種形狀來表現三個各自離散的數據群
blank

f. 面積和體積

  • 面積體積越大則表示【度量】越大。 長度、面積、體積都可以表示數值的大小。
  • 二維平面通常用圓形和矩形,三維空間一般用立方體或球體。
  • 但是在確定面積和體積要注意和邊長或半徑的數值換算問題,避免出現錯誤的暗示,比如:

g.飽和度和色調

  • 飽和度和色調既可以用來區分【維度】也可以用來表示【度量】數值的高低。
  • 例如:使用顏色展現數據的典型圖表熱力圖,通過填色,熱力圖能用顏色的飽和度 或者色調差別來展示數值在特定地理區域(或者頁面區域)的分佈
blank

3、圖形轉換:使用Tableau進行可視化圖表的製作

  • 對【度量】和【維度】進行拖拽操作從而完成可視化圖表的製作,被稱為Tableau第一概念
  • 可拖拽操作的區域主要有以下3個:

• 行列

行:每一行代表的變數,可以理解為縱軸座標

列:每一列代表的變數,可以理解為橫軸座標

• 標記卡

用來表示變數的視覺映射類型,同時調整圖表展示細節

• 篩選器

將指定變數作為篩選條件

4、使用者感知:基於使用者最易感知到的元素以及數據之間的關係,選擇最適合的圖表

• 貝爾實驗室在1985年發佈了視覺元素的暗示排序清單:

blank

• 依次對應數據可視化領域的四大金剛:散點圖、柱狀圖/條形圖、餅圖、折線圖


三、Tableau視覺化操作

1、 資料觀察 :了解我們所獲取的數據,是什麼樣子的。

指標說明

  • 每個數據指標的實際含義是什麼?
  • 是如何產生的?
  • 針對每個指標提一到三個你想知道的問題

數據大小

  • 共有多少條數據,修改顯示行數可以快速得知

資料特徵(一個維度里變數有多少種分佈如何)

  • 使用【摘要】快速查看
  • 直方圖看數據分佈
blank

2、圖表製作:用可視化的圖表,呈現數據的關鍵訊息。

2.1 對比分析

2.1.1 柱狀圖

  • 圖表邏輯:
    • 在一個或多個維度下對度量進行統計,從而得到該維度下不同變數之間的度量值差異
  • 使用場景:少維度下較少變數之間的對比分析
    • 各大區之間的業績對比
    • 各大類商品之間的銷售額對比
  • 製作流程:一個或多個維度至列,一個或多個度量至行

2.1.2 條形圖

  • 圖表邏輯:
    • 條形圖是柱狀圖的水準展示
    • 水準展示下,多變數之間的對比更易流覽
  • 使用場景:少維度下較多變數之間的對比分析
    • 各商品之間的銷售額對比
    • 各人之間的業績對比
  • 製作流程:對柱狀圖進行轉置 一個或多個維度至行,一個或多個度量至列
blank

2.1.3 熱力圖(突出顯示表)

  • 圖表邏輯:
    • 在文字表上根據度量值大小加上顏色深淺標記
  • 使用場景:多維度下多變數的同時對比,並且需要同時查看對比效果和數值
    • 各組/商品類別之間的銷售額、利潤同時對比
  • 製作流程:

先做出文本表【添加百分比差異的快速表計算】

至少拖拽一個維度至行,然後直接拖拽需要展示的度量到維度后的Abc上

右鍵度量值內的膠囊設置格式,可設置數據格式

快速表計算——重要知識點

  • 編輯表計算設置計算區域和順序
  • 總額百分比可以直接計算百分比佔比
  • 差異百分比可以計算環比
blank

然後選擇標記下方的圖表類型為方形(不選擇方形則是數值變色)

最後將需要展現的度量或直接將度量值拖拽至顏色

  • 度量值
  • 度量名稱
  • 記錄數
  • 都是Tableau自動創建的字段,方便批量處理度量及對應名稱

2.1.4 氣泡圖

  • 圖表邏輯:
    • 用度量代表氣泡大小,維度代表氣泡顏色
  • 使用場景:極多變數下在同一度量上的對比分析
    • 一個班或者全公司所有個人的某一度量分析
  • 製作流程:度量至大小、維度至顏色和標籤 、圖形選為圓形
blank

2.1.5 詞雲

  • 圖表邏輯:
    • 用度量代表文本大小,維度代表文本顏色
  • 使用場景:極多變數下在同一度量上的對比分析,同時需要突出變數名稱
  • 製作流程: 度量至大小、 維度至顏色和標籤 、圖形選為文字
blank

2.1.6 標靶圖

使用場景

  • 單一維度下各變數目標達成情況的分析與評估
  • 銷售目標達成率評估
  • 實際花費與預算比較
  • 績效優劣範圍( 優/良/差)

圖表邏輯

基於當前情況的條形圖,橫軸增加目標輔助線,顏色標識是否達成

製作流程

1、製作子類別的銷售額條形圖

  • 度量[銷售額]至列
  • 維度[子類別]至行

2、連接到銷售目標數據源

數據 → 新建數據源 → Microsoft Excel → 銷售目標.xlsx

注意 :

觀察到銷售目標是根據[子類別]分類的,並且只有2018年各月份的數據

因此需要做以下資料處理 :

  • 1、數據需要在子類別和月份兩個維度上均做連接(連接只能基於維 度,所以需要把月份的數據類型從度量拖拽至維度)
  • 2、訂單記錄數據源中沒有月份欄位,需要創建[月份]用來連接這兩份數據,僅適用子類別連接會形成笛卡爾積
  • 3、由於只有2018年的銷售目標數據,因此要添加篩選器,只顯示 2018年的數據

3、編輯數據源關係

創建月份欄位→編輯資料關係→編輯數據連接

  • 將銷售目標-月份的從度量拖拽至維度
  • 在訂單記錄數據源中創建計算字段[月份]:year([訂單日期])*100+month([訂 單日期]),並將月份從度量拖拽至維度
  • 數據-編輯關係-自定義-添加[月份]連接
blank
  • 選擇銷售目標數據源,點擊[月份]右側的連結,啟動數據連接為紅色

4、創建[目標達成率]欄位

在銷售目標數據源下,創建計算字段[目標達成率]:SUM([訂單記錄 (超市訂 單)].[ 銷售額])/SUM([銷售目標])

  • 建立計算欄位后,選擇訂單記錄數據源,拖拽[銷售額]
  • 再選擇訂單記錄數據源,除以SUM([銷售目標])

5、添加顏色標記及數據篩選

  • [目標達成率]拖拽至顏色
  • [銷售目標]拖拽至詳細訊息
  • 訂單記錄-[訂單日期]拖拽至篩選器,選擇年2018
  • 編輯顏色-色板:紅色-綠色發散(任意發散色均可)-漸變顏色2階-顏色透明 度75%(為了好看可以自行調色)

6、在橫軸添加標靶參考線

右擊橫軸添加參考線,範圍:每個儲存格,值:總和(銷售目標)【其實就是 大家要作為目標的欄位】,標籤:無

2.2 變化分析

2.2.1折線圖

  • 圖表邏輯
    • 基於時間維度的圖表,展現形式為折線
  • 使用場景
    • 基於時間維度分析度量的數據變化及趨勢
    • 過去三年的成交額變化
  • 製作流程

1、將訂單日期拖拽至列,選擇下方的季度

2、將數量拖拽至行

3、將類別拖拽至標記區域的顏色

4、可以點擊分析,將預測拖拽至作圖區域,繪製趨勢線

blank

2.3 構成分析(可視化圖形可以累計出一個整體)

2.3.1 餅圖

  • 圖表邏輯
    • 維度代表各扇區的顏色,度量代表餅圖中各扇區的大小
  • 使用場景:一個維度下各個變數在某一度量下所佔比例
    • 性別維度下,男女顧客各佔成交金額的百分比
  • 製作流程:

維度拖拽至顏色

度量拖拽至大小 選擇圖表類型為餅圖

度量和維度拖拽至標記顯示數值,但餅圖一般不標記絕度值,只標記百分比

因此右鍵標籤度量選擇快速表計算,合計百分比計算各數值的百分比佔比

最後右鍵標記的數值設置格式區,第一個,設置為為兩位數百分比

餅圖不宜顏色過多

blank

2.3.2 環形圖

  • 圖表邏輯
    • 兩個餅圖疊加得來,中間的餅圖縮小並設置為白色
  • 使用場景:升級版餅圖,更加美化直觀
    • 環形圖中間還可以加上標題、數據結論等文字
  • 製作流程:

首先做出餅圖

在行處按兩個0值

將一個餅圖的欄位全部移除並改為白色,另一個餅圖調大

最後右鍵行中創建的值,選擇雙軸即可

2.3.3 樹地圖

  • 圖表邏輯
    • 每個方格代表一個該維度下的變數,方格的大小代表此變數的佔比大小
    • 方格會按順序排列,佔比最大的在最左上方
  • 使用場景:一個度量在多個維度下的佔比展現和分析
    • 各組銷售貢獻度
    • 各用戶用戶貢獻度
  • 製作流程:

拖拽度量至大小

維度至標籤 樹地圖是升級版的餅圖,按照順序展示大小,還能增加顏色等維度

其他維度可以拖拽至行和顏色

螢光筆可突出顯示一個維度中的值在其他維度中的展現

注:一般標註類別和絕對值,工具提示百分比

2.3.4 堆積圖

  • 圖表邏輯
    • 在柱狀圖/條形圖的基礎上,用顏色區分一個維度在另一個維度下的佔比大小
  • 使用場景:相同度量下,比較一個維度下另一個維度的佔比
    • 各地區各品類產品對銷售額的貢獻
  • 製作流程:

在做完柱狀圖后,將需要堆積展示佔比的維度拖拽至顏色即可

拖拽度量值或在軸下添加變數也可堆積

2.4 關係分佈

2.4.1 散點圖

  • 圖表邏輯
    • 橫縱軸各代表一個度量,維度中的變數則作為一個點,根據橫縱軸上的度量值大小確認位置
  • 使用場景:分析某一維度變數在兩個度量下的分佈和變數之間的相關性
    • 產品的銷售額和所得利潤之間的關係(正相關、弱相關、不相關)
  • 製作流程:

將兩個度量分別拖拽至行列

將點代表的維度拖拽至詳細訊息

可以將你想區分的維度添加到顏色,對該維度的變數進行區分

還可以將維度拖拽至大小,增加展現維度

分析-趨勢線即可展示分析的兩個度量之間的線性關係,也可以直接右鍵圖表-顯示趨勢線

分析-群集即可對變數進行聚類分析,具有相同分佈特徵的變數會被分為一類,右 鍵群集膠囊即可修改聚類數量

2.4.2 直方圖

  • 圖表邏輯:
    • 將度量下數據分組計數
  • 使用場景:查看單一度量下的數據分佈
    • 2/8法則
    • 馬太效應
    • App 使用者留存率 40-20-10
  • 製作流程:

按兩下一個度量

點擊智能顯示-直方圖

右鍵度量中被自動創建的數據桶-編輯,設置數據桶的大小,越小統計得越細

2.4.3 箱型圖

  • 圖表邏輯
    • 某一維度變數在度量下的位置分佈
    • 處於最大值、最小值、中位、四分位
  • 使用場景:分析基於一個或多個維度統計的度量中另一維度變數的分佈情況
    • 各地區的各銷售的銷售額分佈情況
  • 製作流程:

按兩下一個度量,一個以上的維度

選擇智能顯示-箱型圖

2.4.4 地圖

  • 圖表邏輯
    • 以地理位置為點,用點大小、顏色展示度量值大小等特徵
  • 使用場景:基於地理位置的數據分析

製作流程:

先設置數據類型為地理角色

將地理角色拖拽至詳細訊息,城市會顯示成點圖,省份會顯示為填色圖

將你要在地圖上展示的度量拖拽至顏色或大小

空值可以忽略或搜索經緯度填充

頂部工具列中的地圖選項可以對地圖進行設置

2.5 Tableau可視化原則

1、區分使用者

可視化設計的第一步就是判斷觀眾是誰,進而選擇分析和展示角度

blank

2、主次分明、詳略得當

強調訊息的方式有很多種,用恰當的方式去強調恰當的內容

blank

3、真實準確

刻度要從0開始

blank

4、符合大眾認知和審美習慣

可視化學科已經有很長的歷史了,大眾已經形成了基本的認知習慣

blank

5、適度原則

顏色一般不要超過8種,不能過分強調,且搭配要合理 避免使用3d效果,容易產生錯覺

blank

6、五秒原則

你做的圖5秒內其他人看懂了就是成功了,否則就還有優化空間

blank

7、恰到好處的說明

說明包括:標題、圖例、標註、結論等

blank

8、少即是多

Less is More

blank

超過8種顏色幾乎等於沒有用顏色區分

blank

糟糕的可視化案例

blank

酷炫的可視化案例

blank

對TABLEAU的介紹就先到這裡了,重要的還是要自己動手實操才能發現自己存在的問題,一起加油吧!

What do you think?

Written by marketer

blank

淺談數據清洗之道-基於Tableau Prep

blank

Tableau CA 備考及真題回憶