Headless Analytics Stack?

blank

Headless Analytics Stack?

什麼是 Headless CMS

Headless CMS 是最近很流行的一個概念,是前後端分離浪潮的一個產物,一般配合 JAMStack 一起,可以快速搭建 WEB 應用。 典型代表是 Strapi 和 GraphCMS。 特點是靈活,低耦合,配合各種開源元件和雲服務可以有巨大的想像空間。

blank

什麼是 Headless Analytics

其實並沒有 Headless Analytics 這個概念。 但和 Headless CMS 與 JAMStack 的流行有著相似的地方,我覺得把這種趨勢的 BI 技術棧,MPP Database or SQL-MR(bigquery、clickhouse、presto)+ self service BI(metabase、chartio、cubejs)稱為 Headless Analytics 是很恰當。

前面提到,促成 Headless CMS 和 JAMStack 流行的兩個因素是前後端分離和雲端服務設施的普及。

那麼,Headless Analytics 流行的幾個因素:

  • SQL 成為數據分析領域的第一語言,大數據領域的元件無論底層實現是什麼,都會提供 SQL 介面,比如各種 SQL on hadoop、SQL on HDFS,甚至 SQL on kafka。 還有一些堅持造自己的查詢語言的元件,比如 elastic 和 influxdb,不過這都成為了永久的遺留問題。
  • 分析型資料庫的擴展能力和性能有了很大提升,像 bigquery、clickhouse、greenplum、timescaledb 等開源產品和雲服務的數據處理能力足夠強大,在 PB 級數據量,Ad Hoc 查詢也可以秒級回應,不需要像傳統數倉預聚合之類的方案,也不需要很重的 ETL。 ELT 和 Data Lake 成為新的趨勢。
  • Self Service BI 開源專案和雲服務的流行,由於 SQL 的標準化介面和普及,才有了像 metabase、superset、chartio、mode analytics、cubejs 等開源和商業的自助式 BI 可視化工具的流行。 SQL 作為統一的介面功不可沒。

Hypercable Analytics

最近在做一個專案 Hypercable ,用 timescaledb 和 openresty 實現一個開源的 Google Analytics,基本上複製了 GA 的大部分功能。 但最近想法有些變化,打算做成一個 Headless Web Analytics 集成工具,就是存儲可以自由切換,可視化部分也可以由使用者自己選擇,Hypercable 只提供行為數據收集和 Data Model 定義的工作,當然對於沒有耐心去客製化的使用者,Hypercable 還會提供預設的存儲和 UI,只不過是以外掛程式或 SaaS 的形式。

blank

理論上,GA + BigQuery + datastudio 也是類似的效果,不過使用谷歌這套的特點就是貴,並且運營商鎖定,並不是所有人都能用谷歌雲。

What do you think?

Written by marketer

blank

電商前沿趨勢:”無頭電子商務”

blank

wayfair是美國電商屆迅猛崛起的黑馬