醫(yī)療大數(shù)據(jù)的優(yōu)勢和應(yīng)用場景
有效的整合和利用數(shù)字化的醫(yī)療大數(shù)據(jù)對個體醫(yī)生,康寶中心,大型醫(yī)院,和醫(yī)療研究機構(gòu)都有著顯著的好處。
潛在的利益包括 (W.Raghupathi & Raghupathi, 2014):
1)更多更準確的數(shù)據(jù)使得疾病能在早期被監(jiān)測到,從而使治療更容易和有效。
2)通過對特定個體或人群的健康管理,快速有效地監(jiān)測保健詐騙。
3)基于大量的歷史數(shù)據(jù),預測和估計特定疾病或人群的某些未來趨勢,比如:預測特定病人的住院時間,哪些病人會選擇非急需性手術(shù), 哪些病人不會從手術(shù)治療中受益,哪些病人會更容易出現(xiàn)并發(fā)癥,等等。麥肯錫估計,單單就美國而言,醫(yī)療大數(shù)據(jù)的利用可以為醫(yī)療開支節(jié)省出3千億美元一年。
醫(yī)療大數(shù)據(jù)的利用可以從以下幾方面減少浪費和提高效率 (Manyika, 以及其他人, 2011):
臨床操作: 相對更有效的醫(yī)學研究,發(fā)展出臨床相關(guān)性更強和成本效益更高的方法用來診斷和治療病人。
研究和發(fā)展:在藥品和醫(yī)療器械方面,建立更低磨損度,更精簡,更快速,更有針對性的研發(fā)產(chǎn)品線。統(tǒng)計工具和算法方面,提高臨床試驗設(shè)計和患者的招募,使得治療方法可以更好地匹配個體患者的病癥,從而降低臨床試驗失敗的可能和加快新的治療方法推向市場。分析臨床試驗和病人的病歷,以確定后續(xù)的跡象,并在產(chǎn)品進入市場前發(fā)現(xiàn)病人對藥物醫(yī)療方法的不良反應(yīng)。
公共衛(wèi)生:分析疾病模式和追蹤疾病暴發(fā)及傳播方式途徑,提高公共衛(wèi)生監(jiān)測和反應(yīng)速度。更快更準確地研制靶向疫苗,例如:開發(fā)每年的流感疫苗。
此外,醫(yī)療大數(shù)據(jù)的分析還有利于以下幾方面的發(fā)展 (W.Raghupathi & Raghupathi, 2014):
循證醫(yī)學:結(jié)合和分析各種結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),電子病歷,財務(wù)和運營數(shù)據(jù),臨床資料和基因組數(shù)據(jù)用以尋找與病癥信息相匹配的治療,預測疾病的高;颊呋蛱峁└喔咝У尼t(yī)療服務(wù)。
基因組分析:更有效和低成本的執(zhí)行基因測序,使基因組分析成為正規(guī)醫(yī)療保健決策的必要信息并納入病人病歷記錄。
提前裁定欺詐分析:快速分析大量的索賠請求,降低欺詐成功率,減少浪費和濫用。
設(shè)備/遠程監(jiān)控:從住院和家庭醫(yī)療裝置采集和分析實時大容量的快速移動數(shù)據(jù),用于安全監(jiān)控和不良反應(yīng)的預測。
病人的個人資料分析:全面分析病人個人信息(例如,分割和預測模型)從中找到能從特定健保措施中獲益的個人。例如,某些疾病的高危患者(如糖尿。┛梢詮念A防措施中受益。這些人如果擁有足夠的時間提前有針對性的預防病情,那么大多數(shù)的危害可以降到最低程度,甚至可以完全消除。
然而,根據(jù)一份針對美國和加拿大333家醫(yī)療機構(gòu)及10家其他機構(gòu)的調(diào)查(IHTT, 2013),2013年,醫(yī)療機構(gòu)累積的數(shù)據(jù)量比2011年多出了85%, 但77%的醫(yī)療健康行政人員對自己機構(gòu)在數(shù)據(jù)管理方面的能力評價為“C”。此外,僅有34%報告他們能從電子健康記錄(EHR)中獲取數(shù)據(jù)用來幫助病人,而有 43% 報告他們不能收集到足夠多的數(shù)據(jù)來幫助病人。由此可見,在北美的醫(yī)療系統(tǒng)中,醫(yī)療大數(shù)據(jù)的管理使用準備工作還有一大段路要走。中國也是處在起步階段。
數(shù)據(jù)分析框架(傳統(tǒng)數(shù)據(jù)分析框架,大數(shù)據(jù)分析框架)
醫(yī)療大數(shù)據(jù)有著前面第一節(jié)提到的所有特征。在醫(yī)療大數(shù)據(jù)帶來各種優(yōu)勢的同時,大數(shù)據(jù)隨之帶來的各種特性使得傳統(tǒng)的數(shù)據(jù)處理和數(shù)據(jù)分析方法及軟件捉襟見肘,問題多多。在大數(shù)據(jù)時代出現(xiàn)之前,受限于數(shù)據(jù)量的可獲得性和計算能力的有限性,傳統(tǒng)的數(shù)據(jù)管理和分析采用著不同的思路和流程。傳統(tǒng)上,對于問題的研究建立在假設(shè)的基礎(chǔ)上進行驗證,進而研究事物的相關(guān)因果性,希望能回答“為什么”。
而在大數(shù)據(jù)時代,海量數(shù)據(jù)的涌現(xiàn)提供了從不同角度更細致更全面觀察研究數(shù)據(jù)的可能,從而打開了人們的好奇心,探索欲望,人們想知道到數(shù)據(jù)告訴了我什么,而不僅僅是我的猜想是否被數(shù)據(jù)驗證了。人們越來越多地用大數(shù)據(jù)挖掘各種感興趣的關(guān)聯(lián),非關(guān)聯(lián)等相關(guān)性,然后再進一步比較,分析,歸納,研究(“為什么”變成一個選項而不是唯一終極目標)。大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)思路上的不同導致了分析流程的不同,如圖一所示:
圖一
面對海量的數(shù)據(jù)和不同的分析思路,大數(shù)據(jù)的管理和分析與傳統(tǒng)數(shù)據(jù)分析的差異日益加大;卮鹛囟▎栴}的單一預設(shè)結(jié)構(gòu)化數(shù)據(jù)庫明顯不能完全勝任處理大數(shù)據(jù)的海量及混雜等問題。數(shù)據(jù)的混雜多樣性具體可以從一些調(diào)查數(shù)據(jù)中表現(xiàn)出來。SAS 的一份調(diào)查報告顯示機構(gòu)內(nèi)的非結(jié)構(gòu)化數(shù)據(jù)最多可以占到總數(shù)據(jù)量的85%,而這些非數(shù)字,非結(jié)構(gòu)化的數(shù)據(jù)卻必須被量化分析和用到?jīng)Q策分析中(Troester, 2012)。
另一份2013年進行的 SAS 調(diào)查報告顯示在461個提供完整反饋信息的機構(gòu)中只有26%的機構(gòu)表示他們所擁有的大數(shù)據(jù)是結(jié)構(gòu)化的(Russom, 2013)。 此外,在機構(gòu)中,分析的數(shù)據(jù)一般不會只有一個單一的來源。Alteryx 的調(diào)查報告顯示在200家被調(diào)查的機構(gòu)中只有6%的機構(gòu)表示他們的數(shù)據(jù)是只有一個來源,最為普遍的情況是5-10個來源, 具體分布如圖二(Alteryx, 2014)。
調(diào)查中還顯示 90%的被調(diào)查樣本表示有數(shù)據(jù)整合問題,37%表示需要等其他小組提供數(shù)據(jù),30%表示不能得到他們想要的數(shù)據(jù),一般估計是一個數(shù)據(jù)分析師的60%到80%的時間是花在數(shù)據(jù)處理準備階段上的(Alteryx, 2014)。