【TB】如何優雅地使用Tableau Server
作為新興的細分技術,大數據技術正在越來越快地驅動企業的數據資產轉化為真實的財富價值。 Tableau作為敏捷BI的代表,已經被越來越多的企業採納用來搭建企業的自助式分析平台,這其中包括80%以上的財富500強企業。
不過,和Tableau倡導的“讓提問題的人自己找答案”的宗旨一致的是,大多數企業的Tableau敏捷BI部署,是首先由業務系統中的受益者倡導和推動的,因此在部署階段表現參差不齊。在此,我們結合公司在學習、開發及為客戶做技術指導過程中的經驗,概括瞭如何優雅地使用Tableau Server,幫助更多的人在企業部署和高效使用Tableau server平台。
「不著二邊,不住中間,二邊中間,處處無礙,如此之行,即是中道。
不住著於有見,不住著於空見,空有二邊齊含,即是正觀。 」
1、使用數據提取,提高訪問性能
Tableau性能表現的首要條件是數據源的表現和數據訪問性能,尤其是面臨動輒百萬的底層明細數據時。 Tableau Server還不能作為大型數據倉庫服務器使用,需要與第三方的數據倉庫結合,才能更好地處理複雜的數據源。
針對非實時生產數據,企業中大部分數據無需實時更新;對於組織中較大的非實時更新數據源,Tableau建議通過非工作時間進行數據提取刷新,從而為工作時間內負擔過重的數據源創建數據提取,加速可視化製作的過程。
比如,在凌晨2點時數據倉庫從業務系統數據庫中抽取昨日數據(增量更新),設置Tableau server refresh extract計劃在凌晨3點執行數據提取(完全更新或增量更新),並按照訂閱計劃在早上8點時將相關報表以電子郵件通知的方式,推送到訂閱人郵箱,超過預定閥值的報表啟動“數據驅動型通知”,推送到郵件或手機端app。
為了更好地實現這個目的,我們就需要部署後設置SMTP從而支持“服務器事件通知”(建議2),並通過分佈式架構為此提供軟硬件支持(建議5)。
2、善於使用「服務器事件通知」,驅動業務需求
自助式分析不僅僅需要主動查詢,更重要的是通過推送、訂閱和分享、評論,把數據與業務緊密結合在一起,這就需要越來越多的被動查詢或啟發查詢的技術。為此,Tableau不斷地開發新技術,增強企業客戶的數據體驗,將數據訪問和使用習慣培養為客戶的企業文化。
很多客戶忽視了Server默認的通知功能,僅需簡單設置,即可貼心服務。在服務器上配置SMTP和郵件通知後,服務器管理員、站點管理員或項目主管可以為其他用戶創建報表訂閱,用戶無需登錄server,就可以接收到電子郵件的數據報表,實現自助化分析與業務的緊密結合。
而如果管理員在站點“允許用戶訂閱工作簿和視圖”,用戶甚至自己訂閱工作簿和視圖,比如行銷主管設定每天上午八點收到前一天的行銷報表,運營經理每週一上午八點收到上週的銷售報表推送,就可以優雅開始當日工作,如此把Tableau驅動技術與每天的工作緊密結合在一起。
更重要的是,Tableau Server為所有站點默認支持數據驅動型通知。報表用戶可以為自己設定重要業務閥值,達到閥值後server會自動向關鍵人員發送電子郵件通知。比如故障率超過1.5%時,相關的設備相關人員會接收到電子郵件通知,從而提醒及時關注數據變化。管理員則可以在後台清晰地查看所有的通知計劃(數據閥值、通知計劃和收件人列表)。
最近拼多多因為系統bug被用戶領取了200億的優惠券,想想如果有Tableau Server的警戒推送,會不會好一點?
3、靈活使用站點和項目管理內容
面對不斷增長的組織和日益膨脹的數據,每個企業都需要搭建一套具有伸縮性的數據架構,應對未來的企業增長。 Tableau Server在部署之處,就為未來提供了硬件縱向擴展和橫向擴展的彈性。在內容方面,Tableau優雅的使用首先來自於優雅的內容架構設計,在部署之初,我們需要靈活的使用站點、項目和項目嵌套,確保數據內容和用戶都是安全而高效的。
每個站點的內容(項目、工作簿和數據源)與其他站點上的內容完全隔離。每個完全隔離的分公司,建議使用單獨的站點隔離;各個站點配置不同的用戶,並為每個站點配置一名站點管理員(前期站點管理員可以由數據發布者兼任)。
在站點下面,增加不同的項目和嵌套項目,作為每個部門的內容框架。如果站點中的項目相互之間隔離,則為每個項目設置項目級別的權限設置。每個項目設置項目主管,在項目複雜度比較低時,可以不設項目主管,權限管理由站點管理員負責。
在此不得不提一點對發布者用戶不夠優雅的事情,為了增強數據安全,建議在項目級別設置鎖定權限,確保項目中的工作簿和視圖都會繼承模版中的默認權限,從而防止發布者以“所有者”的身份修改發佈內容的權限,導致數據的擴散。
4、合理部署用戶權限
在企業中實現高效的受控自助分析,關鍵在於架構設計和用戶權限設計的合理性。 Tableau設計的用戶權限受許可證類型、站點角色和內容權限三者共同決定。最高的“權限可能”來自於站點角色,實際的權限能力來自於內容的賦權。
針對權限管理的最佳建議是:通過項目管理內容、通過群組管理用戶,項目權限制定到群組;成熟項目權限鎖定到項目。這樣組合可以保證後期的擴展性和靈活性,不會造成“工作簿+用戶”設置權限帶來的複雜和失控狀態。
5、使用嵌套項目管理開發進度
項目嵌套有兩個使用方法,一種是把部門的項目按照工作分為不同的主題,比如人力資源、財務、運營等;還有一種按照開發進度的方法,隨著開發進度的前進,把報表從測試環境逐步轉移到公開訂閱的環境。可以形像地用圖像表示如下。
在項目開發的過程中,我們需要大量的事件去調整數據,從最開始的演示報表,到可以相互溝通的beta版本,最後到可供外部訂閱的儀錶盤,我們可以在項目中嵌入子項目,結合項目級別的權限訪問,在靈活訪問的過程中兼顧數據安全性。
6、使用分佈式架構,充分利用你的軟硬件資產
單節點的Server架構僅能滿足少數的訪問需求,當用戶訪問量和數據容量同步增加,我們就需要縱向地擴展計算機硬件,同時橫向地增加Server節點。
鑑於Tableau的Server賬號是五個起售,我們建議有條件的期間至少部署三個Server節點,並通過合理分配進程搭建高可用性架構環境。一方面把性能消耗高的創建和刷新數據提取任務,與用戶查詢視圖在物理上分到不同的節點,避免二者的性能衝突,另一方面可以提高系統的穩定性,防止數據丟失和減少宕機時長。
「在安裝文件存儲的節點上安裝的數據引擎實例用於查詢視圖請求的數據。在安裝後台程序的節點上安裝的數據引擎實例用於創建和刷新數據提取。在進行性能調整時,這是一個重要的考慮因素。」
優雅地使用Tableau Server的標准在於,當你工作的時候,它在為您服務;當您下班的時候,它在為您服務,並在您即將需要它的時候貼心提醒。成熟和健全的Server環境中,主動查詢和被動訪問會被同等重視。
Tableau,幫助大家從問題中尋找洞見——From question to insight.
附:
Tableau Server白皮書
如有問題,歡迎留言。
Jan 20, 2019
Jan 21, 2019 Update
Jan 27, 2019 Revise
Jan 28, 2019 update user permission