整天說大數據,多大算大?
這么大的數據,怎么管?
語塞,心塞,喝酒吃飯...
后來想了一項,這看似門外的問法其實涉及到了一個嚴肅的技術討論問題,那就是DataGovernance,又叫做數據治理。第一次我在接觸這個詞的時候努力試圖把它與DataManagement數據管理分開,以宏觀(政府)和微觀(企業(yè))想映射。

數據就是二十一世紀的石油,所以“DataLake數據湖”產生了。對于企業(yè)來說,掌握數據就掌握了更多的可能。聯(lián)絡中心則是日以繼夜地生產大量數據的后方根據地,以一個100坐席規(guī)模的多媒體聯(lián)絡中心,每天產生的數據量也是驚人的:如通話數據、錄音數據、坐席數據、工單數據、日志數據、網頁數據等,如果是一個外呼的營銷型聯(lián)絡中心或者工單派發(fā)型的服務聯(lián)絡中心,再配合CRM所產生的業(yè)務數據,日積月累,存儲空間會以T比特級別直線上升。
經常業(yè)務部門要一個數據ETL做匹配篩選,或者來一份CDR詳單對一下明細,數據庫管理員DBA的內心深處其實是奔潰的,就好比:

hmm,來點干貨吧:
聯(lián)絡中心本質上是一種綜合的信息處理系統(tǒng),包括了多方的參與者,因此數據的生成可以從多個維度來進行剖析。從宏觀來說可以從業(yè)務流、知識流、信息流、數據流這四個層次去觀察。
- 業(yè)務流根據不同企業(yè)對聯(lián)絡中心的任務定義通過不同分工完成,各個崗位和組織之間的協(xié)作構成業(yè)務流,典型的就是一個電話訂單受理的流程,客戶來電下單,CSR在線受理后,提交工單,流轉到財務、審核、生產、物流形成一個線性的流程。站在這個維度,聯(lián)絡中心可以將觸角延伸到后臺處理,以一個“流程360度視圖”數據的方式來綜合提高運營效率。
- 知識流則是在不同的崗位和組織之間進行業(yè)務活動時候,知識也在不斷的遷移。比如新產品的對應的營銷話術,投訴工單的聚類和歸集輸出等等。
- 信息流的直接表現(xiàn)形式就是ERP/BPM或者CRM軟件,讓各種知識流在不同的IT信息系統(tǒng)中傳遞。
- 信息流最終具象成數據,要么短暫使用,要么持久化在數據庫中,形成數據湖,等待后期數據挖掘。
如果只有數據一直在存而不做數據挖掘分析,那就會形成數據“沼澤”,因此數據治理的第一步就應該是頂層設計,也就是數據分層。抽象地理解,聯(lián)絡中心的數據大致可以分為:
- 元數據:描述數據的數據MetaData
- 參考數據:如知識庫等包含通用不變的數據(網點、利率、等常見知識)
- 組織結構數據:坐席、崗位和后臺流程部門等
- 業(yè)務結構數據:用戶信息、理財產品、工單表格等
- 業(yè)務活動數據:交互記錄、活動數據、合同信息等
- 業(yè)務審計數據:操作記錄、審批記錄、質檢記錄等
從聯(lián)絡中心層面來說,多種媒體渠道(語音、聊天、APP),各種工具軟件(知識庫、錄音)和應用程序(機器人)越來越復雜,相互依存度逐年增加,相應的追蹤整個客戶鏈條各組件之間數據流動、了解數據元素含義和上下文的需求越來越強烈。比如一個客戶在APP上通過聊天機器人對話轉到人工,坐席后又主動致電客戶,后續(xù)質檢人員在追蹤此條對話需要對應地抽取聊天記錄和通話錄音兩種數據,甚至還有后續(xù)客戶短信滿足度回放的結果。
從總量上來看,聯(lián)絡中心的元數據越來越多,光現(xiàn)有的數據模型中就包含了成千上萬的表,同時還有更多的模型等著上線,同時隨著大數據時代的來臨,企業(yè)需要處理的數據類型越來越多,需要明確元數據管理策略和元數據集成體系結構,依托成熟的方法論和工具實現(xiàn)元數據管理,并有步驟的提升其元數據管理成熟度。
為了實現(xiàn)大數據治理,構建智慧的分析洞察Insight,僅僅是分析聯(lián)絡中心自身的數據,很難建立完整且一致的元數據管理策略,聯(lián)絡中心需要實現(xiàn)貫穿整個企業(yè)的元數據集成。該策略不僅僅針對某個數據倉庫項目、業(yè)務分析項目、某個大數據項目或某個應用單獨制定一個管理策略,而是針對整個企業(yè)構建完整的管理策略。
通俗的話說,就是聯(lián)絡中心在自身的元數據整理好、數倉建設好后,以ETL標準件方式主動融入業(yè)務部門的大數據分析系統(tǒng),形成更有力的數據治理。

其實后來想得清楚一些了,這就是道與術的區(qū)別,抖音一個機靈:《黃帝內經》之素問·四氣調神大論中提出到:“是故圣人不治已病治未病,不治已亂治未亂,此之謂也。呃~大概也就是這個意思。