超級菜鳥怎麼學習數據分析?

16年我決定:以數據分析為核心技能,到風口所在的行業去工作。目前我在網路公司從事數據工作。

之前寫過一篇回答:如何快速成為數據分析師?

這篇回答作為“如何快速成為數據分析師”的補充,列舉一下數據分析各個模塊的學習路徑。

數據分析是啥?我將數據分析分成了三種境界:

  1. 招式花哨:招式就是分析工具。會Excel、會SQL、會Python、會Tableau、會PowerBI 等等,很重要,但是完全不夠。換一種說法:掌握分析工具的使用方法,只是成為一名數據分析師的底線。
  2. 內力雄厚:內力是指數學基礎和分析思路。數學基礎包括統計概率,機器學習知識等。分析思路是指拿到一個問題,有沒有結構化的思維模式。往細了說,熟練使用對比分析、下鑽分析、各種分析方法論(漏斗、相關分析、邏輯樹、RFM等)。內力是否雄厚決定了你針對一個問題是否有insight。但是,這還是不夠。
  3. 業務是核心:離開了業務KPI和業務邏輯,你的分析只是空洞的數字,不能給公司帶來任何價值。所以,在有招式和內力的前提上,還得擁有業務sense。或者說,你的數據報告能夠打動業務方,才是最關鍵的。如果你只能告訴業務方本月銷售額周同比下降20%,業務人員只會跟你“呵呵噠~” 銷售額跟他們的薪資息息相關,他能不知道下降的程度。你得告訴他們:下降多少(what)、下降在哪裡、為什麼下降(why)、哪裡可以上升、怎麼做大概率可以上升(so what and how)。

1 - 學招式

  • 招式1:Excel

很多數據分析的簡歷裡是不寫Excel 的,但是這不代表Excel 不要用。實際上在工作中,數據量不大時,臨時分析下數據或者畫個折線圖,Excel 是非常能夠提高效率的。

有一定Excel 使用經驗的同學,其實完全可以在工作中遇到問題直接百度或者Google的。如果你時間充裕,也可以看下下面的兩本書:

Excel應用技巧寶典(豆瓣)

Excel實戰技巧精粹(豆瓣)

這兩本書除了Excel 技巧的講解,還會有一些案例,以及如何邏輯嚴謹的去看數。

但是,這兩本書內容很多很雜,時間不充裕可以挑重點先看。

重點學會使用:各類函數(IF、Countif、Countifs、SUMIF、SUMIFS、VLOOKUP 等)、透視表、基礎繪圖(折線圖、柱狀圖、餅圖等)。

其次,也可以聽這個課程:

跟王佩豐學Excel視頻教程:Excel實戰1800分鐘-網易云課堂

  • 招式2:SQL

SQL 語言在數據分析工作中非常重要。目前大部分公司都是將數據存儲在數據庫中,尤其是網路公司,每天產生大量數據,數據分析師就從數據庫中直接獲取自己想要的任何數據(經過授權)來進行分析工作。

SQL語言在數據分析工作中有多重要?

學習SQL 我推薦的方式是刷題,但是刷題也不是盲目的刷,毫無經驗的同學最好先靜下心來全面學習下基礎知識。這就不得不提經典入門書籍:

SQL必知必會(第3版) (豆瓣)

MySQL必知必會(豆瓣)

這兩本書很入門,也很適合入門。沒有很深奧難理解的理論知識,就是教你如何看懂SQL 語言。

網絡教程我一般就看下面這個:

SQL教程|菜鳥教程

沒有繁瑣的講解,只有每個語句如何寫,以及案例的例舉。

然後,你就可以嘗試著開始刷題了,從簡單的題型開始,給自己一些信心先。

SQL 刷題網站有:

SQLZOO

刷題當然少不了大名鼎鼎的Leetcode:

題庫-力扣(LeetCode)

我之前也寫過一些刷題攻略,供參考:

如何學習SQL語言?刷題! ! !

佰初:面試數據分析會遇到的SQL題

  • 招式3:Python

Python連續3年成為開發者最想要學習的語言。
2018年起,Python進入浙江省訊息技術高考,山東省最新版的小學教材也加入了Python內容。

Python 的火爆程度可能大家都有所耳聞。 Python 對於數據分析工作者來說,是非常能夠提高工作效率的,寫一段代碼,可以把一些重複的數據報表工作變成敲一遍回車鍵就完事。

而且,學會了Python,後面你也可以在分析工作中做一些機器學習算法的開發。

經常有人問我,學習Python 還是R語言,很糾結。我是這麼回答的:

廢話不多說,先上一個大神的教程:

Python教程:廖雪峰的官方網站

再來一個菜鳥教程:

Python基礎教程|菜鳥教程

書籍類的資料也很多,推薦幾本:

Python語言入門(豆瓣)

Python編程:從入門到實踐(豆瓣)

利用Python進行數據分析(豆瓣)

下面的回答是我當時學習Python 的過程,可以獲取一個Python 的實戰項目代碼:

你是如何自學Python的?

點贊、評論留郵箱地址,我發送一些珍藏資料給你~

  • 招式4:可視化類工具

市面上有很多可視化的工具,Excel、Python 也可以用來做數據可視化的工作。

一般公司使用的第三方的可視化工具有:Tableau、PowerBI 等,也有很多公司是用的自己開發的可視化工具,比如阿里巴巴就是自主研發的。 (說實話這方面我的經驗不是很多,只是用過一段時間PowerBI)

這方面沒有蒐集到特別好的學習資料,不過有一個經驗,就是這類第三方的軟件工具,官網都會有很完善的培訓教程,也可以加一個對方的銷售或者客服人員,拿到一些資料。

2 - 修內力

  • 內力1:數學基礎

統計概率是數據分析的絕對基礎。很多分析方法模型都是建立在統計概率學的基礎上的。這也可能是已經工作的你,最難靜下心來學習的。

所以,跟之前一樣,先給一個入門級別的書,其實裡面很多知識都是高中就學過的,幫你複習一遍:

深入淺出統計學(豆瓣)

進一步的,可以看一些難一點的書:

統計學習方法(豆瓣)

這本書是從統計開始向機器學習的知識過渡了。不過對於小白來說,確實有一些難度,閱讀順序可以往後面放放。

出除了藍寶書,西瓜書也是很出名的:

機器學習(豆瓣)

也有更深奧一些的:

數據挖掘導論(豆瓣)

嗯,看不看就隨緣吧。

網絡課程也有很多講數學的,牆裂推薦B站上的3Blue1Brown,用動畫講述數學專業知識,生動形象,有時間可以看看。

嗶哩嗶哩:3Blue1Brown

還有可汗學院的統計學公開課:

可汗學院公開課:統計學_嗶哩嗶哩(゜-゜)つロ乾杯~-bilibili

復旦陳紀修老師的數據分析課程:

數學分析復旦陳紀修_嗶哩嗶哩(゜-゜)つロ乾杯~-bilibili

清華大學的數學建模課程:

清華大學數學建模課程_嗶哩嗶哩(゜-゜)つロ乾杯~-bilibili

清華大學出版社出品的在線學習平台:清華大學的文泉課堂免費開放,有很多高質量資源,有興趣可以去翻翻:

文泉學堂

裡面有很多計算機類和數學類的學習資源。

  • 內力2:分析思路

Head first 打頭陣,這個系列很適合小白入門:

深入淺出數據分析(豆瓣)

用差評來證明下這本書有多基礎(笑cry~)。

如果你不認為自己是“毫無基礎的中學生”,那就看這個:

精益數據分析(豆瓣)

打造你的數據驅動思維模式,此書案例較多,涉及業務範疇比較廣。

如果你準備找前端用戶增長相關的工作:

成長駭客(豆瓣)

這本書是國內的,整本書的框架就是漏斗分析模型,講的是創業公司的增長之路。

“AARRR”轉化漏斗模型,即: Acquisition(獲取用戶)、Activation(激發活躍)、 Retention(提高留存)、 Revenue(增加收入)、 Referral(傳播推薦)

也有國外的版本:

成長駭客(豆瓣)

成長駭客的理念是這本書最早提出來的,有空也可以看看。

還有關於網站的分析:

網站分析實戰

最後在推荐一本麥肯錫分析師的經典書籍:

金字塔原理

這本書除了講解了很經典的金字塔分析方式,還對“演繹”和“歸納”兩種分析邏輯有很詳細的講解。

3 - 業務sense

業務sense 這一部分太大了。每個人從事的行業不一樣,業務模式也都有區別。我就推薦兩本我看過的書:

數據化管理(豆瓣)

這本書通過小白進入零售企業從0開始學習的視角,講解了各種數據分析方法如何融入到具體的業務場景中,最終形成數據化管理模型,從而幫助企業提高運營管理能力。教你如何量化目標,如何形成邏輯縝密的說服力。

如何用數據解決實際問題(豆瓣)

該書作者在日產公司工作十餘載,專門負責為高端決策層提供參考和支持,書中的很多案例都很接地氣,適合小白閱讀。

這兩本書都是零售領域的,主要我一直在這個領域工作。其他行業我暫時沒有特別好的建議和經驗分享。

4 - 結語

如果看到這一堆書,一堆資料,佷懵。那對於小白來說正常。

可以先點贊、收藏(嘿嘿嘿~~),目前只挑每個模塊入門級別的書和資料來看。

而且最好是結合: 3個月拿到數據分析offer~裡的節奏來學習,給你規劃好了應該先學什麼,後學什麼,怎麼找數據來實戰。

最後說一句:

數據分析是一門跨學科的學科。對於小白來說,這是機遇也是挑戰。機遇是說:就算對於科班(數學類專業)出生的朋友來說,也還是要學習IT、所在行業的業務邏輯、分析思路等很多知識;而且數據分析的崗位也會越來越多(數據分析師的前景怎麼樣? ),數據分析(數據分析日常工作做什麼:分析+監控+溝通~ )的技能在其他崗位上也會越來越被重視。挑戰就不多說了,要學習的內容真的多,保持學習的狀態很重要。


最後,一如既往的,附上我的數據分析大禮包:

祝大家能夠在大數據的浪潮里淘到金子~

5萬收藏,只有1萬贊~希望大家能夠幫忙點贊~給我持續更新數據分析乾貨的動力~謝謝~

s.zhihu.com/B2C4r (二維碼自動識別)

第一章:樹立倒追思維

你用Python 做過什麼有趣的數據挖掘/分析項目?