Tableau超市數據分析報告

blank

Tableau超市數據分析報告

此次針對數據可視化軟體Tableau自帶數據源「範例超市」展開數據分析。 主要通過DBeaver軟體使用mysql資料庫取數以及Tableau進行數據可視化的呈現。

一、數據集描述

此次使用的"範例超市"為某超市品牌在台灣範圍內2015年-2018年中的銷售相關數據,檔格式為csv,數據集大小為1948KB,數據總量199200條。

資料來源下載連結:pan.baidu.com/s/1OLSIG2

提取碼:yc4w

tableau超市數據分析
百度網盤

二、理解數據

blank

三、數據分析

分析思路

blank

提出問題

  1. 該公司業績概況
  2. 2018年銷售額的趨勢是怎樣的
  3. 用戶結構是怎樣的
  4. 產品結構是怎樣的,各類別中有哪些爆款
  5. 發貨時效如何

數據清洗

  • 列名重命名

首先將「範例超市.csv」數據源導入本地的名為test2020的資料庫中,並將表格名起為orders。 導入成功后發現部分欄位中存在空格,為方便後續分析操作,將存在空格的欄位當中的空格進行刪除。

blank

  • 重複值處理

對所有欄位進行統一計數,並篩選出計數值大於1的,即為重複值。 結果為不存在重複。

blank

  • 缺失值處理

各列數據條數均為9959條,無缺失值。

blank

  • 一致化處理

'城市'欄位中,統一使用不含市的名稱,從中發現'常熟市'與'吉林市'兩個字段與其他字段不一致。

blank

將『常熟市』與『吉林市』兩個字段分別替換為『常熟』與『吉林』:

blank

blank

  • 異常值處理

以月為單位,分別取歷年來每月的累積銷售額、累積數量、累積利潤。

blank

使用Tableau中的盒須圖對取數結果進行分析:

如圖所示,均不存在異常值。

以上,數據清洗就完成了。

構建模型

  1. 業務概況

主要結論:

  • 銷售額、利潤等指標逐年上升,2018年為近年最高
  • TOP3地區:華東、中南、東北
  • TOP3省份:黑龍江、山東、廣東
  • 各品類產品銷售額佔比均衡
  • 主要客戶為消費者

分析:

以年為單位,通過獲取年累積銷售額、年累積利潤、獲利率、年累積訂單數、平均折扣、客單價數據等數據來了解業務概況

blank

可見銷售額、利潤等主要指標呈現逐年上升趨勢,2018年達到近年最高。 選取2018年度數據通過Tableau進行可視化展示:

blank

blank

銷售額較高的地區為華東(28.70%)、中南(25.84%)、東北(17.41%)。

blank

再進一步瞭解各省份的銷售額分佈。 選取2018年數據,各省份銷售額大小以顏色深淺來區分。

可以看到2018年度,顏色最深的三個省份為黑龍江、山東、廣東,說明這三個省份的銷售額最好。

blank

如圖可見每年的銷售額都比上一年同比增長,且同比增長率逐漸提高,銷售額表現得非常優異。

接著再分別觀察2018年各地區、各產品品類、各客戶分類的銷售額佔比情況,以此進一步瞭解該公司的銷售結構。

blank

如圖可見在2018年度中三個產品類別的銷售額佔比比較接近,由高到低依次為傢俱、技術、辦公用品。

blank

如圖所示,有一半銷售額由消費者客戶貢獻。

以上為該公司的業績概況,匯總以上圖表製作儀錶板:

blank

2.2018年銷售趨勢

主要結論

  • 下半年表現差強人意,11月同比下滑
  • 消費者客單量下滑
  • 高價位商品活動效果不佳
  • 華東、華北表現乏力

分析:

blank

2018年第三季度銷售額環比下降,第四季度銷售額同比增長幅度最小,總體來看2018年下半年表現不如上半年優秀。

blank

2018年十一月是全年唯一的銷售額同比下滑月份,同比下滑11%

blank

從細分的銷售結構來看,消費者是主要消費群體,17、18年銷售佔比達到50%以上。 2018年11月公司客戶的銷售佔比及銷售額均同比同比提高,而小型企業和消費者的銷售佔比與銷售額均同比下滑。

blank

可以看到公司客戶在18年11月的銷售額與訂單平均銷售額均同比增長,而消費者與小型企業的訂單平均銷售額出現同比下滑。 結合銷售佔比來看,應當優先關注銷售佔比高達50%以上的消費者存在的訂單平均銷售額下滑問題展開分析。

blank

對消費者的訂單平均銷售額進行下鑽,可以看出主要是客單量出現了30%的同比下滑導致了消費者的訂單平均銷售額同比下滑。

除了從客戶的銷售結構中發現消費者的客單量同比下滑造成了總體銷售額同比下滑,也要關注銷售人員方面的因素,例如:對產品知識、銷售技巧的熟悉掌握程度,銷售積極性等方面的問題。

blank

從品類的銷售結構來看,各品類銷售佔比沒有發生明顯變化,且均有一定程度的同比下滑。

blank

從價格帶進行分析,發現2018年11月最高檔次的2000元以上商品的銷售佔比出現了下滑,在17年11月佔比30%,而在18年11月佔比僅有20%。

blank

再對比2017年與2018年全年的價格帶銷售佔比來看,2000元以上商品在2017年全年銷售佔比中有26%,而在2018年全年銷售佔比中達到27%。 說明2000元以上商品在2018年11月的銷售是不理想的,高價位商品銷售佔比的明顯下滑,也直接影響到了訂單平均銷售額。

blank

觀察2017、2018年各月份的商品平均單價,也可以發現2017年11月的商品平均單價雖低於全年平均水準,但近幾個月呈現出上升態勢。 而2018年11月的商品平均單價不僅低於當年平均值,在全年當中也是處於較低的水準且低於2017年11月同期水準。 也印證了當月高價位商品銷售不佳影響了商品整體的平均單價。

blank

那麼高價位商品的銷售不佳是否與促銷活動有關聯呢? 因該數據源並無活動訊息,故通過商品折扣進行假設分析。

首先從圖上可以看到2018年11月折扣為全年最低,存在做促銷活動的可能性,當月折扣且低於2017年11月同期。

blank

對比2017、2018年11月的各價格帶的折扣情況,發現2000元以上商品的折扣基本無變化,而500-1000、1000-2000價位商品折扣明顯低於去年同期。

blank

再對比2017、2018年全年各價格帶平均折扣,發現2018年11月各價格帶折扣均低於平均水準,當月整體商品做促銷活動可能性較大。

blank

結合整體銷售額情況來看,在其他價位商品與去年銷售額差異不大的情況下,2000元以上商品卻同比下滑39%,說明該價位的客戶群體可能對折扣的敏感度不高。 總體來說促銷活動效果並不理想。

除此之外,當時商品的庫存情況、生命週期、新舊貨佔比等指標也是影響銷售折扣的重要因素,因數據源無以上維度數據,故此次不對以上維度進行分析。

blank

從地區的銷售結構來看,有兩個重要的地區可以著手展開分析:

2017年11月銷售排名由高到低依次為華東、中南、華北、東北、西北、西南。 2018年11月銷售額排名發生變化的地區是華北、東北,在東北銷售額同比基本不變的情況下華北從第三跌落第四,且同比下滑32%

華東銷售排名均為第一,但2018年11月較同期下滑18%

以上兩個地區銷售額同比下滑是當月銷售額同比下滑的主要因素。

blank

可以發現2018年11月華東銷售額下滑主要因為訂單平均銷售額同比下滑,其中客單量同比下滑13%,商品平均單價雖同比下滑19%但基本持平當年平均值。 華北同樣出現訂單平均銷售額同比下滑,其中客單量同比下滑45%,商品平均單價同比下滑25%。

blank

從城市分級來看,2018年11月華東的一線城市以及五線以下其他城市出現銷售額明顯下滑,且兩類城市的商品平均單價均出現明顯下滑,是導致銷售額下滑的主要原因。 而華北地區銷售額下滑主要體現在一線以及新一線兩類城市,其中一線城市需要關注客單量以及商品平均單價兩個指標,而新一線城市需要關注客單量。

blank

從省份來看,2018年11月華東銷售額同比下滑主要來自山東省(-29%)、江蘇省(-56%)、上海市(-74%)

blank

其中山東省下滑主要來自四線城市(-99%)以及其他(-78%),江蘇省下滑主要來自新一線城市(88%),二線城市(-63%)。 需要注意到地區內這幾類城市近乎腰斬式下滑,應當查看全年數據判斷該下滑是屬於常態還是當月的異常情況。

blank

從2018年全年來看,江蘇省新一線城市除了5月以外其他月份銷售情況均不理想,故11月業績下滑可以判斷為是當年的常態問題。

blank

而江蘇省二線城市2018年業績較為起伏,但11月在相鄰幾個月來看環比下滑嚴重,屬於異常問題。

blank

江蘇省二線城市11月銷售額下滑源於2017年同期公司客戶銷售額流失。

經查詢,2017年11月公司客戶為劉斯雲。 可考慮對該客戶進行跟進,瞭解具體情況並促成銷售。

blank

山東省四線城市下滑來自公司客戶,其他城市來自小型企業。 可考慮對以上類型客戶制定銷售計劃進行跟進。

blank

上海地區的下滑主要來自公司客戶以及消費者客戶。

blank

再看華北地區,2018年11月銷售額下滑主要因為排名前2的天津以及北京同比下滑。

blank

天津、北京地區下滑均體現在消費者客戶。

以上為上述提到的客戶名單,後續可根據實際情況進一步制定跟進與活動計劃。

銷售趨勢儀錶板:

blank

3.產品結構分析

主要結論

  • 商品款式日漸豐富,銷售額逐年攀升
  • 複印機子類別原地踏步
  • 高價位商品成為主力軍
  • 技術、傢俱類湧現4款爆款商品

分析:

blank

從銷售的產品種類來看,三大品類的產品種類數都呈現逐年增長,2018年為歷史最高。

下鑽到子類別可以看到各個子類別產品種類均逐年增加,2018年為歷史最高

blank

從歷年銷售額來看,各產品類別銷售額均逐年提高,在2018年的各子類別中只有技術類別的複印機子類別出現同比下滑1%。

複印機同比下滑原因:

人:訂單數=客戶數X客戶平均下單數

貨:定價原因(商品原價),折扣原因(折扣)

場:地區因素

blank

從人的維度分析,客戶數、訂單數、銷售數量等指標均同比增長,首先排除人維度的原因。

blank

從貨的維度分析,發現複印機的價位分為兩組,其中1000-2000價位的商品銷售額同比下滑15%

blank

接著觀察貨品相關指標,可以發現銷售數量以及平均折扣有較為明顯的同比下滑。 可以判斷是高價位商品銷量不佳造成複印機銷售額同比下滑。

blank

從地區維度分析,下滑的地區有東北(-26%)和西南(-33%)

blank

從省份來看,兩個地區整體表現並不理想,多數省份出現同比下滑,且需要關注海南及貴州省市場。

blank

從價格帶來看,各價格帶產品數均呈現逐年增長態勢

blank

各價格帶商品銷售額均實現同比增長,在2018年達到近年最高。 2018年2000元以上商品也自2015年後重新成為銷售額佔比最高的商品價位,說明2018年在發展高價位商品市場上取得一定成效。

blank

從類別來看,辦公用品商品價格主要分佈在100元以下以及100-500元兩檔,技術用品則主要分佈在100-500、500-1000、1000-2000三檔,而傢俱除了100元以下商品較少,在其餘價位都有較多種類的產品。

blank

那麼在2018年有哪些明星單品,爆款呢?

作為爆款的最直接體現,是銷售額高。 另外從商家的角度來說,利潤也是重點參考指標。 從利潤-銷售額散點圖來看,越接近右上角的單品即為高銷售額高利潤商品,也就是所謂的爆款。 可以看到雖然銷售額最高的商品為辦公用品類,但利潤並不算高。

blank

於是進一步對爆款的統計口徑界定,即為品類中銷售額與利潤排名同時位於前5的商品。 於是定位到了符合統計口徑的2018年爆款,共4款,技術、傢俱類各兩款。

blank

從爆款的銷售分佈來看,顏色越深代表銷售爆款種類越多,可以發現有爆款商品的省份主要為東部地區及北部,其中福建省售出過2018年所有4款爆款商品,而大部分沿海省份有售出爆款產品。 後續可以考慮在新的一年打造爆款時加大在東、北部以及沿海省份尤其是福建省的商品投放以及活動宣傳。

產品結構儀錶板:

blank

4.用戶結構分析

主要結論

  • 華東、中南位列客戶數第一梯隊
  • 一線城市存在天然絕對優勢
  • 廣州、深圳存在挖掘潛力
  • 二八法則確定頭部客戶
  • 客戶結構仍存在優化空間

分析:

blank

從客戶數上來看,華東與中南地區客戶數最多,屬第一梯隊。 東北與華北次之,屬第二梯隊。 西南與西北最末,屬第三梯隊。

blank

從省份分佈來看,西部客戶較少,而沿海以及中部省份客戶居多。

blank

而從城市分級來看,五線以下其他城市的客戶最多。

blank

再引入城市平均客戶數,可以發現隨著城市規模的縮小,城市平均客戶數會隨之降低。 在城市平均客戶數上一線城市有絕對優勢。

從客戶數的城市排名來看,前三分別是上海、天津、北京。 而同為一線城市的廣州和深圳僅排名8、9。 一線城市客戶群體擁有高客單價的天然優勢,而廣州與深圳在客戶數上仍有發展空間。

blank

根據經典的"二八法則",將客戶按照銷售額從高到低進行排列,觀察需要多少比例的客戶完成20%銷售額,進而可以確定頭部客戶是哪些。 可以確定以名為任實的客戶為界,銷售額前65名的客戶為頭部客戶,貢獻了20%的銷售額。

RFM分析

blank

RFM-R代表客戶最近一次購買時間,以6個月為界進行分組,0-6個月屬於高R值客戶,6個月以上屬於低R值客戶

高R客戶佔比75%,低R客戶佔比25%

blank

RFM-F代表客戶的購買頻次,將4次以上定為高F值客戶,將4次及以下定為低F值客戶。

blank

高F值客戶佔比76%,低F值客戶佔比23%

blank

RFM-M代表客戶的消費金額,將消費金額1萬元以上定為高M值客戶,將消費金額1萬元以下定為低M值客戶。

blank

高M值客戶佔比75%,低M值客戶佔比26%。

blank

根據RFM的分級可將具有不同特點的客戶分成8種類型

blank

對各類客戶的客戶數以及銷售額進行展示。 整體來看客戶的RFM結構比較健康,有53%的客戶為重要價值客戶,貢獻了68%的銷售額。 而重要換回客戶佔比12%,貢獻15%銷售額,是第二大客戶群體,但最近一次購買時間已經超出6個月,可以對該類客戶制定相應的喚醒計劃。 而潛力客戶與新客戶作為第三、第四大客戶群體,在銷售額上都有發展的空間。

blank

6.發貨時效分析

主要結論

  • 各項發貨層級均為歷史新高,標準級為主要發貨層級
  • 二級發貨時效不夠穩定
  • 安徽發貨時效需要關注

分析:

blank

從發貨時效來看,當日的發貨時效為0.4天,一級的發貨時效為2.1天,二級發貨時效為3.2天,標準級發貨時效為5天

blank

從歷年數據來看,2018年各發貨郵寄方式的訂單數均為歷史最高,且訂單數呈現出隨郵寄方式高低逐級增加的趨勢,大部分訂單採用速度最慢的標準級。

blank

從訂單平均銷售額來看,當日、一級、二級沒有明顯差別,但標準級的銷售額明顯較高。 可能原因是銷售額較大的訂單因重量以及件數導致運費成本較高,為節省運費開支選擇標準級。

blank

從2018年各訂單發貨時效來看,當日的發貨時效有部分1天的,應該是部分超出當日發貨時間後下單導致的跨日發貨。 而一級二級的最快發貨時效均為1天,一級最慢發貨時效為3天,二級最慢為5天。 標準級最快發貨時效為3天,最慢發貨時效為7天。 從統計學的角度來看均不存在異常值,但從離散程度來看二級的離散程度更大,從穩定性的角度考慮仍有優化的空間。

blank

該地圖顏色從深到淺代表發貨時效從長到短,對於訂單平均銷售額與訂單量最大的標準級訂單中,可以看到甘肅、青海、新疆此類西部偏遠省份以及吉林省、安徽省發貨時效最長。 從地理位置來看,安徽不屬於偏遠地區但發貨時效長,未來可對其進行優化調整,從而提高客戶的購買體驗。

發貨時效儀錶板:

blank

四、結論建議

通過以上分析過程所得出的各方面主要結論,再結合實際業務場景以及部門分工,以「人、貨、場」三個維度提出如下建議:

針對消費者客戶客單量下降的問題,需要運營部門密切關注銷售人員的狀態,例如:對產品知識、銷售技巧的熟悉掌握程度,銷售積極性等方面存在問題需進一步跟進以及培訓;

針對華東、華北地區銷售額下滑問題,已列出需跟進客戶名單,後續可根據各客戶實際情況進行跟進與指定相應促銷活動;

通過「二八法則」確定出貢獻了20%業績的65名頭部客戶名單,是未來需要重點經營的客戶群體;

通過RFM模型對客戶群體進行區分,重要喚回客戶佔比12%,貢獻15%銷售額,是第二大客戶群體,但最近一次購買時間已經超出6個月,可以對該類客戶制定相應的喚醒計劃。 而潛力客戶與新客戶作為第三、第四大客戶群體,在銷售額上都有發展的空間。

11月促銷活動效果不佳的問題,貨品部門在設置活動調價時需對活動商品進行科學篩選,需要對客戶在不同價位商品的折扣敏感度進行相關調研;

通過歷史數據篩選出的4款爆款商品掌握到其地域分佈特徵,未來在打造爆款商品時可參照過往經驗,加大在東、北部以及沿海省份尤其是福建省的商品投放以及活動宣傳。

通過分析發現一線城市的市場規模相較於其他級別城市有著絕對優勢,但一線城市廣州、深圳所擁有的客戶數僅名列全國第8、9位,是未來可著力的提升點;

二級發貨方式的發貨時效較其他發貨方式而言不夠穩定,另外在安徽地區出現整體發貨時效偏慢的情況,需要物流部對以上情況進行優化。

What do you think?

Written by marketer

blank

Tableau基礎圖表進階:條形圖/柱狀圖

blank

Tableau可視化分析【7】打卡桑基圖