文/清華大學互聯網產業研究院 趙紅燕
社會老齡化加快和新技術快速發展的形勢推動醫療信息化市場需求的快速增長,從個人到家庭的治療需求和健康管理需求,從醫院到區域的信息共享和平衡發展,這些領域的需求對社會供給提出更加多元化的要求。
基于互聯網平臺產生的信息快速地更新迭代且體量龐大,內容復雜多樣,涉及到門診、住院、結算、手術、醫保、用藥等就醫前后一系列繁冗數據,傳統的數據管理系統難以有效、經濟、智能地存儲、加工和管理現代數據,由此產生以云計算等技術為主要工具處理該類復雜數據集,提取對應的數據信息并加以應用的大數據技術。
大數據技術在醫療行業多個領域探索智能化應用,試圖為用戶和企業提供更加精確的服務,輔助從業者予以決策,延長產業價值鏈。各國政府在社會發展新形勢下積極做出政策調整,迅速出臺相關法規,支持大數據在醫療產業的發展并完善相應的監管。在市場選擇、政策鼓勵的雙重支持下,產業發展也的確沒有令人失望。目前業界討論比較多的是大數據對于醫療服務的支持,如 AI 醫學影像、醫院服務系統等,除此之外,大數據在公共衛生、醫藥產業、醫療保險等領域也在逐步探索、發展并應用。
為加強疫情管理、提升應急處理能力,在政策的推動下開始建立區域衛生信息系統和公共衛生平臺加強公共健康管理。公共衛生監測以互聯網為途徑獲取公眾關注內容進行疾病早期預警,以衛生信息系統為工具掌握疾病區域布局和蔓延速度。例如公眾在患某種疾病時很可能會在搜索引擎平臺查找關注疾病相關內容,以關注熱度和搜索頻次分析該疾病發生的概率,成為疾病爆發的前期預警以做好防疫準備工作。
谷歌依托大數據技術分析用戶對疾病的搜索指數并預測到流感的爆發,通過統計用戶搜索詞匯和位置等數據繪制各項疾病搜索時間和地域分布的地圖,提前于美國疾控中心 1-2 周的時間;Flu Near You 網站專門監測用戶自我流感情況并預測流感趨勢,用戶可以自愿在網站檢測自身健康狀況,匿名且免費,以個人實時報告癥狀的方式補充傳統跟蹤模式,發現早期疾病征兆并防止傳播;美國 University of Rochester 數據分析團隊以 Twitter 為渠道,研究 60 多萬人產生的 440 萬條信息挖掘解析其疾病健康狀態,并證實可借此提前 8 天預測流感形勢下個體被傳染情況。
暗合藥物研發嚴謹性的要求,大數據的專業化處理技術助力縮短藥物研發周期。通過統計、整理、分析患者的疾病信息、藥物使用及其臨床表現形成結構化和非結構化數據庫,數據庫的資料來源可能包含醫院信息系統、公共衛生信息系統以及知識網站和搜索引擎等網站。
一方面,利用現有的案例分析藥物可能存在的不良反應,快速學習已有的研究成果提取對藥物研發有用的知識獲得所需藥物成分加以試驗,縮短藥物研發生命周期,降低不良反應率和研發成本。另一方面,通過大數據技術對社會潛在用藥需求的分析,預測未來藥品的需求數量和需求階段,結合研發成本分析研發的必要性與否及其生產數量。
Atomwise 搭建的一個藥物設計系統 Atom Net,該系統的數據庫來源于數百萬的親和力實驗和數千種蛋白質結構數據,以預測小分子與蛋白質的結合。葛蘭素史克與英國的 Exscientia 合作,利用已有的藥物研發數據庫,研究得出上百萬種與特定靶點相關的小分子化合物。而英國 Benevolent AI 的數據庫則是包括論文、臨床試驗數據等。
建立疾病模型檢測費用合理性優化醫療保險支出結構。大數據技術通過對以往案例的分析,建立不同疾病案例的模型,研究同種疾病所需進行的醫療檢查項目、藥物使用、住院時間等情況,結合新政策下按項目付費的醫保方式,按照一定的醫療標準控制醫療保險支出情況,防止醫療資源的過度利用和費用的無效開支。Valence Health 使用 Map R 公司的數據融合平臺(Converged Data Plat form)建立數據湖作為數據倉庫,以此優化決策改善醫保結果和財務狀況。
大數據處理技術為優化醫療效果、提高醫療服務效率、降低醫療過程費用、完善醫療服務體驗等方面做出貢獻,但新技術的發展在行業應用中往往需要適應過程和發展階段,暴露出一些發展問題:
(1)醫療信息繁雜且類型多樣,即便同一種醫療癥狀在不同的醫療機構之間也可能存在表述不同的術語,缺乏統一的數據標準導致數據體量龐大但是質量參差不齊,數據分析利用率不高,大數據技術在醫療行業前景美好但落地困難;
(2)不同醫院之間數據標準的差異和出于對患者數據隱私性的保護導致數據共享困難,醫療行業信息孤島現象嚴重,但從另一個角度來講隱私保護也是對醫療服務商和醫療產品供給商的重要要求,因此會有不同程度的需求矛盾問題;
(3)數據的應用需要符合安全性和合法性的規定,美國在醫療商業信息化過程中要求必須符合 HIPAA 和 HITECH 法案的規定,如何兼顧數據的合規性和有效性是大數據技術應用的難點,也是需要政府、醫院和企業之間的相互協調和配合;
(4)大數據分析后產生的診斷方案和治療方案是基于對大量已有案例和個人信息的分析而得,相對來說較為客觀,但處理過程需要數據準備過程和數據處理時間,而很多疾病則需要快速地給出方案否則有可能延誤治療而導致病情加重,這對計算、分析的速度是一種挑戰,需要經過長期的積累和訓練。
近年來,各個企業以大數據技術在醫療領域的探索層出不窮,熱度不減,而醫療領域的敏感性和復雜性使得大數據應用進展緩慢,這是行業性質決定的,但這并不能阻擋醫療大數據發展的趨勢,大數據技術在醫療領域實現的一小步即是推動社會發展的一大步。新技術下未知性和挑戰很多,要想實現醫療大數據對產業的轉型升級,還需要醫療生態系統內部和新興信息技術公司各個角色的協同互助,更重要的是,需要保持對生命的敬畏和對隱私的尊重。