如何從零開始構建用戶畫像?

blank

01.初識用戶畫像

1.1用戶畫像

隨著用戶的一切行為數據可以被企業追踪到,企業的關注點日益聚焦在如何利用大數據為經營分析和精準行銷服務,而要做精細化運營,首先要建立本企業的用戶畫像。

HubSpot白皮書:2020行銷技術新風向- Linkflow聯否官網​www.linkflowtech.com 圖標

提到用戶畫像的概念,我們區分下用戶角色(Persona)和用戶畫像(Profile):

1.1.1用戶角色(Persona)

用戶角色本質是一個用以溝通的工具,當我們討論產品、需求、場景、用戶體驗的時候,為了避免在目標用戶理解上的分歧,用戶角色應運而生。用戶角色建立在對真實用戶深刻理解,及高精準相關數據的概括之上,虛構的包含典型用戶特徵的人物形象。如下是一個典型的用戶角色:

blank

1.1.2用戶畫像(Profile)

用戶畫像更多被運營和數據分析師使用,精準行銷、經營分析、個性化推薦都是基於用戶畫像的應用。用戶畫像是各類描述用戶數據的變量集合,能夠準確描述任何一個真實用戶。如下是一個簡化的用戶畫像:

{ “ID”: 123456,

“姓名”: “張建國”,

“性別”: “男”,

“出生年月”: 631123200,

“籍貫”: “北京”,

“居住地”: “北京”,

“教育背景”:

{ “學校”:”北京大學”,

“專業”: “CS”,

“入學年月”:1220198400

}

}

用戶畫像產品化

從業務價值來說,標籤和畫像類似一個為前台服務提供數據支持的中間層系統模塊。開發完畫像標籤數據,如果只是“躺在”數據倉庫中,並不能發揮更大的業務價值。只有將畫像數據產品化後才能以標準方式提升數據處理鏈路上各個環節的效率,同時也更便於業務方使用。下面分別從產品化後涵蓋的標籤生產架構和功能模塊兩個角度進行總結:

用戶畫像產品系統架構

下圖是一個用戶畫像產品系統的結構圖,數據是從左到右的,主要包括數據採集、數據接入、數據整合/標籤計算、標籤應用4個層級。下面嘗試對其進行簡單描述:

blank

數據採集

在數據採集模塊,主要通過客戶端/服務端SDK、導入、對接第三方應用3種埋點方式進行日誌數據、業務數據、第三方數據的採集。

1、SDK

(1)客戶端SDK:通過客戶端SDK埋點,可以採集iOS、Android、小程序、網站等各種客戶端的用戶行為數據和用戶屬性訊息。

(2)服務端SDK:若數據已經存在數據庫、數據倉庫,比如訂單訊息,可以使用對應開發語言的服務端SDK進行數據的採集。

2、Importer

可以根據運行環境、源數據格式、導入數據量的大小等影響因素,選擇不同大導入方式,把歷史文件數據導進用戶畫像產品系統。

3、Link針對不同第三方產品OpenAPI的特點,採用接收事件消息推送、或主動輪詢方式採集用戶在不同第三方應用系統的個人屬性和行為事件數據。

數據接入

埋點數據先大量進入Kafka,然後慢慢消費接入後續的數據整合存儲系統。

數據整合/標籤計算

在用戶畫像系統中,主要使用Hive作為數據倉庫,進行ETL處理,開發相應的用戶屬性表和用戶行為表,以及標籤的計算。

1、數據整合

各種渠道接進來的數據,存在孤立、空值、格式不對應、超過極限範圍等數據質量問題,因此需要進行臟數據清洗、格式轉換、用戶識別與合併等整合工作:

(1)Clean/Transform

a.Clean:比如,某個用戶的出生年月時間是未來的某個日期時刻,因此就需要把這類臟數據給過濾掉

b.Transform:比如,通過某個第三方應用API獲取到的所有用戶的地區訊息是IPB標準編碼形式,為了能和其他渠道的訊息一起進行分析,就需要根據IPB標準編碼轉換成標準的省、市格式

(2)Id Mapping

a.各個渠道接進來的用戶屬性數據、行為事件數據等都是孤立的,為了能計算用戶的全方位的綜合標籤,就需要做用戶的識別合併,比如通過unionID,識別合併綁定在同一微信開放平台的公眾號、小程序、網站的同一個用戶的訊息。

經過數據整合處理,數據會進入下面的數據模型中:

blank

2、標籤計算

在用戶畫像系統,會做一套批量離線的標籤處理引擎,依賴的是底層比較穩定的數據結構。這個標籤引擎一邊讀事件數據,一邊讀用戶的屬性數據,再配合上特定的標籤規則,做一個批量計算,最後生成用戶標籤。

blank

標籤應用

標籤的應用主要分為前端畫像展示、通過API接入其他系統兩大類應用方式,通過下面的「3.2 用戶畫像產品化功能模塊」章節具體描述。

用戶畫像產品功能模塊

系統看板

通常用戶畫像系統的數據看板,以可視化形式展示企業的核心用戶數據資產情況或者重點關注的人群數據。旨在建立和統一使用者對企業數據資產或者核心人群數據的基礎認知,主要分成以下幾類:

1、用戶量級及變化趨勢:不同設備類型ID量級、不同類型用戶量級(如註冊與非註冊用戶、付費與非付費用戶等);

2、標籤資產:按主要類目統計標籤個數等;

3、核心用戶標籤:展示固有或自定義人群的關鍵標籤畫像數據等;

blank
Linkflow系統後台

標籤管理

供業務人員進行標籤的增、刪、改、查等操作,包含:標籤分類、新建標籤、標籤審核、標籤上下架、標籤覆蓋人數監控等。

基於用戶行為數據、用戶屬性數據,通過設置標籤規則創建標籤:

blank
Linkflow系統後台

單用戶畫像

主要能力包含通過輸入用戶ID,來查看單用戶畫像的詳情數據,如用戶的屬性訊息、用戶行為等數據。

blank
Linkflow系統後台

3.2.4用戶分群和用戶群畫像

1、用戶分群

用戶分群功能主要是面向業務人員使用。產品經理、運營、客服等業務人員在應用標籤時,可能不僅僅只查看某一個標籤對應的人群情況,更多地可能需要組合多個標籤來滿足其在業務上對人群的定義。例如:組合“過去7天領取優惠券次數大於1次”、“活動活躍度等於高和極高”、“女性”用戶這3個標籤定義目標人群,查看該類人群覆蓋的用戶量。

blank
Linkflow系統後台

2、用戶群畫像

和用戶分群功能相似,用戶群畫像功能首先也需要組合標籤圈定用戶群體,不同之處在於用戶群畫像功能支持從多個維度去分析圈定用戶群體的特徵,而用戶分群功能側重的是將篩選出來的用戶群推送到各業務系統中,提供服務支持。

blank

What do you think?

Written by Zhihu QA

blank

現在很多企業都在追求數字化轉型,請問要怎麼做才能實現數字化轉型呢?

blank

有沒有懂私域流量的,現在運營感覺受限了,私域流量怎麼運營?