大數(shù)據(jù)在醫(yī)院運營管理中的價值探索

作者簡介:

曾春:北京東軟望海科技有限公司首席架構(gòu)師,負(fù)責(zé)公司基礎(chǔ)架構(gòu)、云計算、大數(shù)據(jù)管理平臺、開發(fā)平臺等技術(shù)體系的研發(fā),并負(fù)責(zé)OES產(chǎn)品研發(fā)中心及人力資本HCG專項孵化管理工作。清華大學(xué)計算機軟件與理論專業(yè)博士。曾就職于IBM、百度公司任重要技術(shù)崗位。在數(shù)據(jù)庫、云計算、大數(shù)據(jù)及人工智能方面擁有豐富的經(jīng)驗。

———————————————————————————————————————

如今,云計算、大數(shù)據(jù)、物聯(lián)網(wǎng)、人工智能在科技領(lǐng)域的發(fā)展方興未艾,并與各行各業(yè)不斷融合。在新技術(shù)給人們帶來便捷的同時,引發(fā)的思考和爭論也隨之而來。大數(shù)據(jù)時代對個人的數(shù)據(jù)權(quán)益和隱私保護(hù)帶來了新的挑戰(zhàn),特別是個人健康數(shù)據(jù),涉及個人敏感信息,如何保護(hù)越來越受到重視。

一、大數(shù)據(jù)技術(shù)的發(fā)展以及在醫(yī)療行業(yè)的應(yīng)用場景

大數(shù)據(jù)技術(shù)經(jīng)過多年的發(fā)展,經(jīng)歷從SQL(Structured Query Language,結(jié)構(gòu)化查詢語言),到NoSQL(Not Only SQL,泛指非關(guān)系型數(shù)據(jù)庫),再到NewSQL數(shù)據(jù)庫,其應(yīng)用場景在不斷得到強化。

傳統(tǒng)SQL數(shù)據(jù)庫在醫(yī)療行業(yè)的需求場景仍然很強勁,用于很多醫(yī)院信息系統(tǒng),但越來越無法滿足OLTP(Online Transaction Processing,聯(lián)機事務(wù)處理)數(shù)據(jù)快速增長的需要。在業(yè)務(wù)報表和數(shù)據(jù)分析等OLAP(Online Analytical Processing,聯(lián)機分析處理)場景,一些新型的關(guān)系型列式數(shù)據(jù)庫技術(shù)被用來解決大規(guī)模歷史數(shù)據(jù)的復(fù)雜查詢分析。

NoSQL數(shù)據(jù)庫的出現(xiàn)有效解決了系統(tǒng)的可擴(kuò)展性,但也存在很多不足,比如對SQL的支持不夠,也不支持事務(wù)操作。通常NoSQL作為分布式非關(guān)系型數(shù)據(jù)庫使用,用于支持高吞吐、高并發(fā)的新興業(yè)務(wù)場景,比如物聯(lián)網(wǎng)應(yīng)用,以醫(yī)療物資為核心的供應(yīng)鏈生態(tài),實現(xiàn)全要素的協(xié)同運營。

NewSQL數(shù)據(jù)庫是傳統(tǒng)SQL與NoSQL技術(shù)結(jié)合之下的產(chǎn)物,在為OLTP業(yè)務(wù)提供像NoSQL那樣的伸縮性同時,提供傳統(tǒng)SQL數(shù)據(jù)庫那樣的事務(wù)ACID(原子性、一致性、隔離性和持久性)保證。通常NewSQL作為分布式關(guān)系型數(shù)據(jù)庫使用,主要針對傳統(tǒng)SQL的部分高性能應(yīng)用場景,可以滿足醫(yī)療行業(yè)OLTP數(shù)據(jù)快速增長的需要。NewSQL技術(shù)和NoSQL技術(shù)有著各自典型的應(yīng)用場景,兩者也在不斷演進(jìn),在慢慢借鑒和融合。

隨著醫(yī)療健康數(shù)據(jù)的不斷積累,以及大數(shù)據(jù)技術(shù)的深入應(yīng)用,很多人工智能和深度學(xué)習(xí)技術(shù)被引入來支持?jǐn)?shù)據(jù)挖掘和輔助診斷,比如醫(yī)學(xué)影像診斷分析、心電圖診斷分析等。這些新興技術(shù)結(jié)合醫(yī)生的專業(yè)知識,通過經(jīng)驗?zāi)P偷挠?xùn)練,從大量數(shù)據(jù)中篩查可疑的信息,可以有效輔助醫(yī)生做出判斷,大大減輕醫(yī)生的工作量。

二、醫(yī)療健康大數(shù)據(jù)的價值

醫(yī)療健康大數(shù)據(jù)是國家重要的基礎(chǔ)戰(zhàn)略資源,醫(yī)療健康大數(shù)據(jù)的發(fā)展與醫(yī)療信息化緊密相關(guān),一般醫(yī)院都部署了醫(yī)院信息系統(tǒng)HIS和電子病歷EMR系統(tǒng)等,這些系統(tǒng)的各個模塊中都沉淀了大量的醫(yī)療數(shù)據(jù),比如診療數(shù)據(jù)、用藥數(shù)據(jù)、醫(yī)學(xué)檢驗結(jié)果數(shù)據(jù),以及費用數(shù)據(jù)等。這些數(shù)據(jù)一般分散在多個業(yè)務(wù)系統(tǒng),由不同的供應(yīng)商實施和運維,難以利用和形成有用的知識和信息。

為了有效利用和挖掘這些分散的數(shù)據(jù),醫(yī)院一般通過建設(shè)多種數(shù)據(jù)中心,比如醫(yī)院臨床數(shù)據(jù)中心、醫(yī)院經(jīng)濟(jì)運營數(shù)據(jù)中心等。基于這些分散的數(shù)據(jù)源,通過數(shù)據(jù)集成平臺推動數(shù)據(jù)倉庫的建設(shè),然后生成不同主題的數(shù)據(jù)集市,產(chǎn)生更多的統(tǒng)計指標(biāo)和分析數(shù)據(jù)?;谶@些數(shù)據(jù)集市可以研發(fā)不同的數(shù)據(jù)應(yīng)用,比如運營駕駛艙、財務(wù)分析應(yīng)用,成本分析應(yīng)用等。醫(yī)院管理層可以基于這些數(shù)據(jù)服務(wù),及時掌握醫(yī)院運營的狀況和指標(biāo)完成情況,為醫(yī)療業(yè)務(wù)的發(fā)展和投入做出正確的決策。

隨著局端監(jiān)管和區(qū)域醫(yī)療管理等平臺的信息整合,也會帶來數(shù)據(jù)的快速增長。這些數(shù)據(jù)不僅可以增加共享和優(yōu)化就醫(yī)秩序,也可以形成從點到面的信息全覆蓋的疾病監(jiān)測方式,實現(xiàn)全流程和可追溯的管理體系?;趨^(qū)域醫(yī)療信息,醫(yī)院還可以與同類指標(biāo)的行業(yè)標(biāo)桿值橫向比較,發(fā)現(xiàn)自身的問題和優(yōu)化方向,并找出自身在區(qū)域醫(yī)療行業(yè)中所處的位置。

醫(yī)療健康大數(shù)據(jù)的價值還可以體現(xiàn)在很多方面,比如:

1用藥經(jīng)驗

可以對知名專家的臨床診療數(shù)據(jù)進(jìn)行采集,通過對數(shù)據(jù)的整合和分析,形成一些用藥經(jīng)驗和關(guān)聯(lián)規(guī)則,針對個體癥狀,調(diào)整用藥的比例、類型或成分等,通過參考這些經(jīng)驗,有效提升普通醫(yī)生的診治水平。

2輔助診斷

通過構(gòu)建醫(yī)學(xué)影像數(shù)據(jù)倉庫,可以利用人工智能和深度學(xué)習(xí)技術(shù),基于醫(yī)生的專業(yè)知識,訓(xùn)練診斷模型,從大量醫(yī)學(xué)影像數(shù)據(jù)中篩查可疑的影像,減輕醫(yī)生的閱片工作量。

3成本管控

對醫(yī)院經(jīng)濟(jì)業(yè)務(wù)活動的風(fēng)險進(jìn)行防范和管控,使醫(yī)院決策層、管理層、執(zhí)行層和監(jiān)督部門之間形成相互制衡、相互促進(jìn)、相互協(xié)調(diào)的關(guān)系。

4疾病防控

通過整合和共享不同醫(yī)院之間的臨床數(shù)據(jù)信息,可以對某些疾病的演變和慢病的防控進(jìn)行跟蹤,通過全流程和可追溯的方式進(jìn)行管理。

三、醫(yī)療健康大數(shù)據(jù)的安全

大數(shù)據(jù)時代對個人的數(shù)據(jù)權(quán)益和隱私保護(hù)帶來了新的挑戰(zhàn),特別是健康數(shù)據(jù),涉及個人敏感信息,數(shù)據(jù)安全和隱私保護(hù)尤為重要。對個人健康數(shù)據(jù)的保護(hù)不足,不僅會損害個人數(shù)據(jù)權(quán)利和隱私權(quán)利,也會導(dǎo)致公眾信任危機,阻礙醫(yī)療健康大數(shù)據(jù)的良性發(fā)展。

在建設(shè)醫(yī)療健康大數(shù)據(jù)的過程中,主要涉及如下安全挑戰(zhàn):

1內(nèi)部威脅

醫(yī)療行業(yè)的內(nèi)部威脅高于外部威脅。除了比較明顯的安全管理問題,比如弱密碼、數(shù)據(jù)庫暴露在公網(wǎng)等,這些都比較容易發(fā)現(xiàn)和整改。一般醫(yī)院都要求進(jìn)行信息安全等級保護(hù)的認(rèn)證,這些基本的外部威脅都能有效控制。目前比較突出的是內(nèi)部威脅,受經(jīng)濟(jì)利益驅(qū)使或其它原因,內(nèi)部員工很容易獲得數(shù)據(jù)的權(quán)限和竊取非授權(quán)數(shù)據(jù)。

2基礎(chǔ)平臺

傳統(tǒng)的SQL數(shù)據(jù)庫,比如Oracle、SQL Server、MySQL等,還有分析型數(shù)據(jù)庫,比如Greenplum、Vertica等,這些數(shù)據(jù)庫本身提供細(xì)粒度的權(quán)限控制和安全審計功能。而NoSQL數(shù)據(jù)庫,比如基于Hadoop的數(shù)據(jù)庫系統(tǒng),就比較缺乏基于角色的身份管理和細(xì)粒度訪問控制,以及安全審計功能,存在很大的安全隱患。

3數(shù)據(jù)采集

由于數(shù)據(jù)采集的復(fù)雜性,很多數(shù)據(jù)存在被濫用的風(fēng)險,數(shù)據(jù)的跟蹤和溯源存在很大的困難。醫(yī)院內(nèi)部一般存在很多第三方的技術(shù)供應(yīng)商,通常系統(tǒng)之間需要建立服務(wù)接口,滿足互操作的應(yīng)用場景,這種醫(yī)療數(shù)據(jù)的傳遞和流動很難保證數(shù)據(jù)的安全性。

4隱私保護(hù)

一般健康數(shù)據(jù)都涉及個人敏感信息,醫(yī)療健康大數(shù)據(jù)尤其需要注重隱私保護(hù)。為了滿足醫(yī)療科研項目和非商業(yè)的用途,一般都需要對醫(yī)療健康數(shù)據(jù)進(jìn)行脫敏處理,也就是不能有效標(biāo)識用戶和還原匿名數(shù)據(jù)。

四、東軟望海大數(shù)據(jù)技術(shù)和應(yīng)用的探索

東軟望海在HRP、醫(yī)院成本一體化、醫(yī)療衛(wèi)生資源監(jiān)管等領(lǐng)域保持優(yōu)勢地位。東軟望海在大數(shù)據(jù)方向做了很多積極的探索,從傳統(tǒng)的商業(yè)智能BI到大數(shù)據(jù)平臺,應(yīng)用于醫(yī)院的精細(xì)化運營、局端監(jiān)管和成本核算等應(yīng)用系統(tǒng)。

◆ 大數(shù)據(jù)平臺

數(shù)據(jù)集成需要整合多種數(shù)據(jù)源的醫(yī)療健康數(shù)據(jù),其中比較關(guān)鍵的是標(biāo)準(zhǔn)化,使分散、零亂、標(biāo)準(zhǔn)不統(tǒng)一的操作數(shù)據(jù)轉(zhuǎn)換為集成、統(tǒng)一的信息。數(shù)據(jù)字典標(biāo)準(zhǔn)體系是業(yè)務(wù)數(shù)據(jù)進(jìn)行交換和集成的基礎(chǔ),可以實現(xiàn)不同業(yè)務(wù)系統(tǒng)對同一數(shù)據(jù)理解的一致性,比如會計科目、財務(wù)報表、成本報表、資產(chǎn)分類、物資分類、科室分類、人員分類等。這些字典和數(shù)據(jù)標(biāo)準(zhǔn)都需要遵循國家或者行業(yè)發(fā)布的政策、制度,并進(jìn)行統(tǒng)一和規(guī)范。

一般數(shù)據(jù)集成到一個中心數(shù)據(jù)倉庫里,傳統(tǒng)的數(shù)據(jù)倉庫都是基于SQL數(shù)據(jù)庫,通過建立星型模型或者雪花模型,支持歷史數(shù)據(jù)的查詢和分析。隨著醫(yī)療健康數(shù)據(jù)的不斷積累,很多歷史數(shù)據(jù)會不斷聚合,只支持粗粒度的查詢場景。

為了滿足對數(shù)據(jù)精細(xì)化的查詢和分析場景,平臺引入了基于Hadoop生態(tài)的數(shù)據(jù)庫技術(shù),數(shù)據(jù)集成后生成特定格式的數(shù)據(jù)文件(比如parquet)存儲在HDFS上。分布式查詢引擎基于精心設(shè)計的數(shù)據(jù)分區(qū),并行調(diào)度和查詢集群上的數(shù)據(jù)文件,滿足用戶的復(fù)雜查詢請求,如下圖所示:

◆ 大數(shù)據(jù)應(yīng)用

1、HIA醫(yī)療大數(shù)據(jù)平臺

HIA(健康信息聯(lián)盟)以“分享、創(chuàng)新、發(fā)展”為宗旨,將大數(shù)據(jù)“取之于聯(lián)盟,服務(wù)于聯(lián)盟”。以“數(shù)據(jù)標(biāo)準(zhǔn)化、服務(wù)規(guī)范化、應(yīng)用智能化”為特點的HIA醫(yī)療大數(shù)據(jù)平臺,可以幫助醫(yī)院進(jìn)行高效、精細(xì)化運營,共同提升醫(yī)療行業(yè)的管理水平?;诖髷?shù)據(jù)技術(shù),平臺內(nèi)置數(shù)據(jù)標(biāo)準(zhǔn)與數(shù)據(jù)質(zhì)量控制機制,完成醫(yī)療數(shù)據(jù)的標(biāo)化與入庫。數(shù)據(jù)內(nèi)容覆蓋醫(yī)院運營相關(guān)數(shù)據(jù)應(yīng)用場景,支持關(guān)鍵標(biāo)桿值/知識庫的平臺測算,支持個性化數(shù)據(jù)分析報告?;谌斯ぶ悄芗夹g(shù),實現(xiàn)數(shù)據(jù)分析的智能化,支持?jǐn)?shù)據(jù)分析的自定義,支持行業(yè)指數(shù)的發(fā)布與持續(xù)更新。

2、區(qū)域經(jīng)濟(jì)運行監(jiān)管平臺

以醫(yī)院財務(wù)核算、成本核算數(shù)據(jù)為基礎(chǔ),從醫(yī)院經(jīng)營風(fēng)險、成本管控、運行效率、費用控制等方面全面監(jiān)管區(qū)域醫(yī)院運行情況,防止經(jīng)濟(jì)風(fēng)險發(fā)生。從保證醫(yī)院可持續(xù)發(fā)展角度出發(fā),對收入、成本兩個重要方面進(jìn)行分析,指導(dǎo)合理組織收入,控制成本,提高經(jīng)濟(jì)效益。從項目角度出發(fā)對項目的盈虧及成本構(gòu)成進(jìn)行分析,指導(dǎo)醫(yī)療服務(wù)價格調(diào)整。從病種角度出發(fā),對病種的盈虧及成本構(gòu)成進(jìn)行分析,指導(dǎo)病種定價。醫(yī)療服務(wù)價格跟蹤與監(jiān)管依據(jù)醫(yī)院項目成本核算數(shù)據(jù),在價格正式調(diào)整前,對醫(yī)院整體運行、各科室運營及各類疾病患者影響情況進(jìn)行測算;醫(yī)療服務(wù)價格調(diào)整后,通過對醫(yī)院的收入結(jié)構(gòu),患者負(fù)擔(dān)進(jìn)行實時監(jiān)測,防患系統(tǒng)性風(fēng)險發(fā)生。

————更多行業(yè)專家資訊,可在微信搜索“東軟望海”,別忘加關(guān)注哦!————

Hash:82c2a8bd7e35801bd0c35d8a4465261afd3176cd

聲明:此文由 望??敌臯iewHigh 分享發(fā)布,并不意味本站贊同其觀點,文章內(nèi)容僅供參考。此文如侵犯到您的合法權(quán)益,請聯(lián)系我們 kefu@qqx.com