數據分析學習感受分享(數據分析思維、MySQL、Tableau)

數據分析學習感受分享(數據分析思維、MySQL、Tableau)

數據分析學習感受與筆記分享

目前為止學了五個星期,淺談拉鉤教育數據分析訓練營帶給我的感受,相當於交代自己的用戶體驗。 總體來講,解決我的部分痛點——教育對接的是焦慮,焦慮被解決了,不止是爽,更是持續性的爽,會對學習形成一個正反饋。 寫這篇文章的目的在於分享感受以及學習效果記錄,分以下幾個方面來講:個人情況介紹、自學過程中的問題、為何氪金、目前所學知識的梳理以及學習總結。

1.個人情況介紹

本人是管理科學與工程專業研一的學生,管理科學總的來說是基於數據、模型構建、分析等為管理做決策輔助等相關支持活動,這與數據分析能力是密切相關的,既對學習也對往後工作有著很大的説明。 因此工欲善其事必先利其器,在建立好自己的計劃后我開始學習相關思維、軟體、爬蟲技術等等,但由於碎片化、遊離化的學習路徑讓我在器這方面的掌握程度是極不靠譜的,就如同蒼蠅一樣面對B站或其他網站上參差不齊的與數據分析相關視頻時,採取的動作便是停留片刻,一鍵三連,然後輕鬆飛走。

2.自學過程中的問題

現在講一講之前自學過程中遇到的問題:

(1)陷入假自律中感動自己。 即使認為自己的自律性強,但在面對質量參差不齊的相關學習資源時只能徒增疲勞,實質性的知識和思維無法得到質的提升;

(2)野蠻生長固然可以,但不適合絕大多數人。 我認為在大學最重要的能力就是自學能力,不斷自學的能力,一部分人是按照自己的資源、渠道、個人天賦、興趣激情導向去野蠻生長,但另外一部分人無法像前者一樣,需要部分程式化、系統化得學習,需要一種引力帶他向前走,如此去形成自己的知識體系;

(3)遇到問題時,無法及時找到他人指點迷津。 不管是在製作報表看板還是用python處理數據或者爬蟲等情況時,有時候遇到一個小問題但是屬於自己知識盲區的點,任由自己捯饬,花大量時間也無法解決,學習效率低下;

(4)存在學習門檻。 涉及專業領域學習時,本身就有門檻,白嫖基本上都是討的劣質貨色;

(5)學科思維建立困難,重器不重思維。 個人學習時,很多人包括我自己在內對掌握一門技術或者說技能有特別大的訴求,但往往會本末倒置,這些所謂的器是我們解決問題的輔助手段或者支援途徑罷了,解決問題的核心是在本領域的學科思維搭建,如此才能更好去解決問題。

3.我為何氪金

對拉鉤教育數據分析訓練營氪金的初衷:

(1)系統化學習數據分析能力,目的是在學術研究上有技術支援思維補充;

(2)對自己往後的職業規劃方向有個初步明確;

(3)拉鉤個人的第一印象是拉鉤招聘專門面向互聯網行業的招聘網站,拉鉤教育服務的對象剛好求職者和招聘者,至少在行業內他們是專業的

(4)對於內容範圍,首先是對大綱的瞭解,與自學所知道的內容進行匹配,發現匹配度讓我滿意;

(5)對於內容品質,純粹是相信口碑,因為自己並沒有過完整體驗,等學完再做評價。

4.目前所學知識的簡單梳理

目前,已經學習了三個階段,分別是第一階段數據分析思維與業務流程、第二階段MySQL數據分析實戰以及第三階段互聯網公司必備-BI商業智慧工具tableau、quikBI以及神策用戶行為分析平臺。

4.1 數據分析思維與業務流程

數據分析思維的重要程度不言而喻,是產出進行數據分析工作清楚思路的必要條件。 管理學科最重要的思維和能力我認為是將看似不可量化的研究對象進行科學有效的量化,但在量化這個過程中,需要一套完備嚴謹的量化思維,不能想到哪裡是哪裡,量化到哪裡算哪裡,每一步的量化都有規則可尋,同樣,數據分析思維能力也是這樣的效果。

課中提出了這樣一個問題:波士頓這座城市有多少架鋼琴? 回答這個問題,就需要數據分析、科學量化的思維,當然這個問題讓我想到了著名的費米問題,即如何估算芝加哥的鋼琴調音師的人數,回答這個問題需要以下幾個數據:芝加哥當前人口數量、每家平均幾口人、家庭平均擁有的需要定期調音的鋼琴數量(10 家裡最多1 家,但30 家至少有1 家)、每部鋼琴需要調音的頻率(也許平均1 年1 次)、 一個調音師平均每天能調多少部鋼琴(4 —5 部,包括交通時間)、一年工作多少天(約250 天)等等。

此時,就可以計算結果:芝加哥調音師的數量 = 人口 / 每家人口 × 有鋼琴的家庭百分比 × 每年調音次數/ (調音師每天調音的鋼琴數 × 年工作天數)。 如此呢就得到了最後的計算結果,這與實際的結果相差不大,具有說服力。 除開解決費米問題,還有很多去量化研究物件的分析方法,如下表所示,將複雜問題簡單化採用的邏輯樹分析法,也就是上述所提及的費米問題。 其中在目前的商業分析中,留存和流失分析、用戶價值分類、用戶行為分析、轉化分析最為常見,在課程安排中結合鮮活的案例以及excle對數據的基本操作,不僅學到了上述分析方法。 而且還激發了我對這方面的興趣。

表1數據分析方法表

4.2 MySQL數據分析實戰

為什麼必學Mysql,看如表所示:資料庫排行表

圖1 資料庫排行表

MySQL 是最流行的關係型資料庫軟體之一,其體積小、速度快、開源免費、簡單易用、維護成本低等,在集群架構中易於擴展,很好的資料庫工具。

Mysql的學習內容方面主要分四個部分,第一部分是Mysql的基礎,包括資料庫的基本概念、關於Mysql的發展歷程及相關介紹、Mysql的安裝配置以及navicate安裝、SQL語言、語句操作Mysql完成數據的存儲+管理操作即增刪改查;第二部分是Mysql的核心查詢包括排序、分組、聚合、多表查詢、合併查詢以及子查詢等;第三部分是Mysql的高級應用包括視窗函數、索引機制、Mysql試圖等;第四部分是Mysql專案實戰,基於Mysql資料庫(數據載體)結合企業項目實例進行數據分析行為。 從基礎到進階然後到高級應用最後進行Mysql的項目實戰,有學習有練習。

對於我來講,本科期間是學過SQL語句的,因此對於簡單的增刪改查還是比較清楚,但是面對其核心查詢時就很陌生了,同時對主鍵外鍵的相關學習也犯了難,更別提Mysql的高級應用視窗函數、索引機制等問題了,但在整個學習過程中,這些問題都得到了解決,後續會對相關問題是如何解決的通過發帖子分享出來,包括左外連接的注意事項、視窗函數、時間函數、 欄位函數對求使用者留存率的作用、笛卡爾積問題、多表查詢的複雜問題等。

另外,對於老師在直播課上分享的Mysql面試題目以及所學過程中遇到的難點說明特別有用,掌握mysql需要反覆的訓練,在牛客或是其他管道多加訓練才能夯實所學,當然希望在課程設計中多分享一下類似的練習Mysql的資源。

4.3 互聯網公司必備BI商業智慧工具tableau等

Tableau 是一款可視化的分析和商業智慧軟體,可以幫助個人或公司組織更善於利用數據來做決策。 簡單來說,tableau是一個很好的數據源處理、數據可視化智慧工具,特別在製作報表看板時功能效果突出,其在業界的流行程度相當高,參考互聯網女皇2020報告對tableau的地位,如圖2所示,處於領導的地位。

圖2 magic quadrant for analytics and business intelligence platforms

tableau能幹的事情最直觀的就是數據可視化,而且乾的相當漂亮,如圖3對COVID-19全球疫情情況的說明所示。

圖3 COVID-19全球疫情情況顯示圖

tableau的學習路徑是先熟悉其操作面板主要是tableau desktop,包括連接數據、數據預處理、數據的連接、並集、管理等到字段的處理、圖表的製作,當然也必須對頁面、智能顯示、分析視窗、格式設置、基礎圖表、高階圖表的學習和掌握,然後是練習,去製作如下圖4所示的報表展示看板。 對於tableau目前為止就我的了解沒有太難的知識,因為老師講解的還算詳細,因此花點時間、精力肯定可以做出來,至於報表的邏輯性、可視化程度、美感方面的考量,需要在後續的反覆實踐中摸索出來。

圖4銷售數據報表看板

也可以根據自己的喜好給出詞雲圖,由於我個人比較喜歡王小波,所以如圖5詞雲圖所示。 另外,對於quikBI,作為阿裡巴巴的數據分析 BI可視化工具以及輔助精細化用戶運營的神策平台的相關分享,包括心得以及學習筆記我會後續發出來。

圖5詞雲圖

5.學習總結

逐步對數據分析需要做的事情明確了起來,不能說遊刃有餘但是做出來是可以的。 因為目前還沒有對大數據查詢利器Hive以及python、數據挖掘演算法與實戰進行學習,至少在難度上是沒有太大障礙的,前三階段的學習按照業界標準來說,是目前初級數據分析師最常用到的知識技能,只要多加練習多思考多提出問題來,搞定前三個階段的學習是完全可以沒問題的,當然對於業務層面的構建指標等問題需要在以後實際工作中熟悉起來, 保持學習持續學習很有必要,奧利給。

Tableau Desktop Specialist 考試心得及詳細備考攻略

tableau學習教程,最高效的tableau學習教程,附可以寫進簡歷中的範本案例。