Google Analytics是如何獲取你的網頁瀏覽數據

blank

Google Analytics是如何獲取你的網頁瀏覽數據

相信很多人對“大數據殺熟”都有切膚之痛的體會。上某貓某狗的時候,明明同一款產品,iPhone 用戶就會比Android 用戶多交錢; 許多產品/服務的優惠券都是新用戶比老用戶拿得多,拿得頻繁;自己不過是瀏覽了某些購物網頁,以後幾天每天都在搜索引擎首頁上看到這個商品的廣告。時間長了,不禁讓人心生疑惑,所謂的“大數據”到底是怎麼收集我的個人訊息的?

blank

Google Analytics是谷歌公司出品的,針對網站流量,渠道,客戶行為模式進行收集數據並作分析的一個工具,它可以和Google Adwords, Google Tag manager, Google Search 等關聯使用。通過追踪cookies, GA可以獲取特定的用戶的來源,行為模式以便針對這種用戶採取特定的行銷方式(區別定價,區別優惠等狗套路)。

本文將簡要的介紹一下GA的原理,功能, 以及總結怎樣避免被GA追踪到。

1. 原理

註冊GA以後,根據商家需求,比如,旅遊網站想監測遊客感興趣的目的地和旅行類型,會生成一個Javascript的追踪代碼,加在要觀察的網站上的特定位置,比如這裡是加在《詳情》這個按鈕上。當用戶點擊這個按鈕的時候,他所查看的旅行目的地等訊息就會被收集起來。

blank

為了對用戶進行標記,每個用戶訪問網站的時候,追踪代碼會將域名作為網站的定義,生成一個cookies 到用戶的瀏覽器裡。其中“點擊" (hit)會發送到GA裡, 它是一個包含許多用戶的訊息的URL,比如用戶的來源,語言,瀏覽器類型,操作系統,還有隨機生成的用戶身份代碼。這些構成用戶的維度。

blank

GA會生成一個列表,儲存所有的用戶代碼。用戶訪問網頁時,追踪代碼會獲取他們的用戶代碼。對於已存的代碼,會識別為老用戶。相反,新的代碼,會識別為新訪客。如果用戶換用瀏覽器,或者換用設備登陸同一個網頁,將會識別為不同的用戶。同樣的,如果用戶清理掉瀏覽器的cookies,或者禁止cookies,當用戶再次登陸時,以前的用戶代碼也將無法識別到這個用戶,也就是說,該用戶將作為新用戶被識別。

”點擊“分為網頁瀏覽、事件, 電子商務交易和社交互動等。每當一個網頁加載出來,GA就會收集並更新用戶數據,以30分鐘為一個週期分組數據。這個週期叫做會話(session),一個會話包括一連串的網頁瀏覽、事件、社交互動和電子商務交易等用戶行為。當用戶打開一個有追踪代碼的網頁開始計時,持續不活動30分鐘後一個會話結束。如果用戶還在該頁面,那麼一個新的會話就會開始。但是仍會識別為同一個用戶。

blank

GA可以追踪在一個會話裡用戶的每個行為。比如穀歌網店的頁面在“續訂”, “購買”, “播放視頻”這些板塊都設置了追踪代碼,那麼當用戶點擊這些版塊的時候,追踪代碼都會將這一行為錄入,並傳給GA 。

blank

比如,網頁瀏覽是每開一個新的商品頁面,該商品的名字就會被記錄。用戶點開視頻,這是一個事件點擊,事件點擊包含四種訊息: 類別,行為,標籤,值。這四個變量都會被導入GA中生成報告。社交點擊是點贊,轉發等行為。商品交易點擊是購買商品付費的行為。

blank

這些點擊提供的訊息足以構成區分用戶的標準。比如可以過濾出安卓用戶。

blank

還可以採用dynamic remarketing, 篩選出特定的用戶群體, 比如連續一個月以上沒有訪問網站的用戶,針對他們發放相應的優惠碼。確保這些優惠碼只有這些用戶能夠看見。

blank

GA還可以通過一些額外渠道收集訊息,比如測量協議(measurement protocol),和其他Google賬號。測量協議可以接受其他能聯網的設備收集的數據,比如銷售點系統,或者能聯網的公共電話亭。其他Google賬號包括Google Adwords, Google Adsense, Google Search等等。總之,通過這些收集數據的方法,GA將這些數據按照維度分類,分門別類的放在統計報告裡,供商家研究。

2. 功能

那麼收集了這麼多數據以後,GA將用這些數據幹什麼呢?

先介紹一下GA的數據結構。在GA裡,所有的數據是通過維度(dimension)和指標(metric)存儲的。維度和指標形成一個個表。維度的每個值是表的每一行,每個指標是表的每一列。維度和指標也有三種範圍: 用戶範圍,點擊範圍和會話範圍。用戶範圍舉例來說就是用戶的類型,點擊範圍可以是網頁的名字,會話範圍可以是設備類型。 GA將相同範圍的維度和指標組織在一起,不同範圍的維度和指標不能同用。

blank

根據收集到的數據,GA有四種報告。包括用戶(User),獲客(Acquisition),行為(Behavior),和轉化(Conversion)。

2.1 用戶

對於用戶,最重要的三大指標莫過於黏性,活躍,產出。 GA 在用戶報告中,除了基本的用戶地理位置,人口結構,設備,興趣點等訊息,還會給出1日活躍用戶,7日用戶,14日用戶和1月用戶的時序圖, 據此可以看出網站的黏性。針對活躍性的考量,GA也給出了各會話區間的用戶的平均會話時長和平均訪問網頁數量。對於不同類型的用戶,GA都會列出產出作為評價的指標,這些產出包括:總交易量,交易總金額,交易率等。比如,對於新老用戶,一個基本的報表如下:

blank

可以看出,老用戶比新用戶的產出高,活躍性高。

2.2 獲客

GA記錄著每個用戶訪問網頁的媒體和來源,這些媒體包括:Organic(無付費渠道,比如穀歌搜索),CPC(付費廣告渠道), Refer(友情網站鏈接), 郵件, None(直接輸入url) 。來源就是具體的搜索引擎名字,或者郵件行銷代碼等。

最合適的評估各個來源的有效性的指標之一就是跳出率(bounce rate)。跳出率是指出率是指在只訪問了入口頁面就離開的訪問量與所產生總訪問量的百分比。 GA提供對每個來源的跳出率的比較。

blank

可以看出,youtube 的友情鏈接的跳出率最高。

2.3 行為

行為報告中顯示了一些重要的用戶行為。比如用戶行為流追踪用戶從入口頁面開始都進行了哪些活動。可以了解特定來源的用戶的需求是什麼,他們下一步想要做什麼。

blank

還有,對網站的一些關鍵頁面的用戶表現,比如入口頁面,退出頁面的跳出率等等。此外,GA還對每個頁面的平均加載時間進行統計。如果一個頁面的加載時間長,跳出率高,那麼這個頁面就是需要進行完善的。

商家還可以對於他們認為重要的按鈕設置成事件,比如聯繫我們,訂閱等等。

2.4 轉化

商家常常針對一些行為設置一些目標,比如購買,訂閱等。如果這些目標實現了,那就可以稱之為一次轉化。 GA幫助商家將他們的商業目標量化為GA目標,轉化報告裡詳細記載了各個目標的轉化情況。除了設置目標,商家還會設置目標漏斗,就是為了實現當前目標所需要的步驟。 GA會對目標漏斗進行可視化,因為進行到下一步的用戶會越來越少,所以圖形會像一個漏斗,這樣的圖也被稱為漏斗圖。根據漏斗圖,商家可以知道在哪一個環節用戶流失的最多,從而加強對那個環節的把控。

blank

3 避免追踪

知道了GA的原理以後,想逃避GA的追踪就很簡單了。既然GA主要靠嵌入網頁的JavaScript代碼,我們可以有以下方法阻止這段代碼。

i.用防火牆阻止GA域名: google-analytics.comwww.google-analytics.com

ii. 用Host 文件將GA域名添加為不存在的IP地址,這樣任何請求都不會被發送到Google.

iii. 用Script Blocker 或任何使JavaScript 無效的插件。

既然我們知道新用戶比老用戶更容易獲得優惠,我們也可以利用這點,反將一軍,把自己包裝成新用戶。方法包括但不限於:

i. 定期清理遊覽器cookies

ii. 換用不同的瀏覽器訪問網頁。

iii. 使用不同的設備,手機,筆電,平板換個遍。

iv. 註冊不止一個賬號,定期換賬號,然後等著接受針對你的”荒廢“賬號的贖回優惠吧~

What do you think?

Written by marketer

blank

一些你可能不知道的關於Google analytics 在APP上的tips

blank

Google AdWords投放前如何綁定Google Analytic統計工具、並驗證網站所有權?