今日最新上線的《自然》子刊《Nature Medicine》上,發(fā)表了一項(xiàng)激動人心的成果:利用機(jī)器學(xué)習(xí)和自然語言處理等人工智能(AI)技術(shù),廣州市婦女兒童醫(yī)療中心的夏慧敏教授和加州大學(xué)圣地亞哥分校(UCSD)張康教授領(lǐng)銜的一支研究團(tuán)隊(duì),合作帶來一款全新的AI診斷工具。這項(xiàng)工具和人類醫(yī)生一樣,當(dāng)填寫完患者口述和醫(yī)生體查文本型病歷之后,工具可直接閱讀醫(yī)療病歷,自動分析患者病情,智能給出推薦診斷。這是該團(tuán)隊(duì)在《細(xì)胞》雜志封面發(fā)表有關(guān)AI圖像診斷的論文后,不到一年時間里,在AI技術(shù)實(shí)施應(yīng)用于醫(yī)療方面取得的另一個重要里程碑。它標(biāo)志AI模擬人類醫(yī)生進(jìn)行疾病診斷時代的到來。
近年來,AI在基于醫(yī)學(xué)圖像的診斷上一次次超越人類。在放射學(xué)、病理學(xué)、眼科學(xué)、皮膚病學(xué)等影像數(shù)據(jù)的識別和篩查上,以機(jī)器學(xué)習(xí)為基礎(chǔ)的診斷工具表現(xiàn)搶眼。不過,這些應(yīng)用對于迅猛發(fā)展的AI技術(shù)來說,還只是小試身手。真正的考驗(yàn),在于AI能否像人類一樣,讀懂疾病信息,而不是僅僅分析圖片。在這項(xiàng)研究中,科學(xué)家們成功實(shí)現(xiàn)了這一目標(biāo),挖掘出了AI在輔助醫(yī)生診斷上的巨大潛力。而他們所關(guān)注的,是對多種兒科疾病的準(zhǔn)確診斷。
對兒科疾病的診斷是醫(yī)療中的一大痛點(diǎn)。一方面,兒童的抵抗力較弱,容易罹患多種疾病。另一方面,一些兒科疾病威脅程度較大,需要盡快得到治療。能夠快速、準(zhǔn)確地對兒科疾病進(jìn)行診斷,不但可以減少患者們的等待時間,還可以讓那些情況危急的兒童及時得到醫(yī)療診治。
▲本研究團(tuán)隊(duì)的負(fù)責(zé)人夏慧敏教授(左)與張康教授(右)(圖片來源:兩位學(xué)者所任職科研院所官網(wǎng))
為了解決這一痛點(diǎn),研究人員們首先訓(xùn)練AI理解海量電子病歷中的臨床特征數(shù)據(jù),這包括了醫(yī)生輸入的大量文本報告。光是這一步,難度就比分析影像數(shù)據(jù)要大多了!電子病歷中,包括個人史、體格檢查、實(shí)驗(yàn)室檢驗(yàn)結(jié)果、用藥和手術(shù)等許多方面,維度遠(yuǎn)遠(yuǎn)高于圖像。而且,電子病歷數(shù)據(jù)中往往存在一些系統(tǒng)差錯,以及有意或無意的輸入錯誤,都會給數(shù)據(jù)分析帶來噪音。因此,怎么從電子病歷中挖掘數(shù)據(jù),用機(jī)器學(xué)習(xí)方法來進(jìn)行準(zhǔn)確的模式識別,這是一個挑戰(zhàn)。
為此,研究人員整合醫(yī)學(xué)知識和數(shù)據(jù)建模,提出了一個數(shù)據(jù)挖掘框架,以深度學(xué)習(xí)技術(shù)為基礎(chǔ),開發(fā)了一套自然語言處理系統(tǒng)。
▲AI診斷框架的設(shè)計(jì)流程圖(圖片來源:參考資料[1])
深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個類別,使用多層神經(jīng)網(wǎng)絡(luò)進(jìn)行推理,需要大量的訓(xùn)練數(shù)據(jù)來實(shí)現(xiàn)高精度。而這項(xiàng)研究的大量數(shù)據(jù)來自近60萬名患兒、超過130萬門診人次的電子病歷,讓機(jī)器學(xué)習(xí)的技術(shù)提高有了極大保障。
尤其值得一提的是,針對電子病歷中醫(yī)生記錄的診斷文本,研究人員建立了一套自然語言處理模型進(jìn)行信息提取。在這一階段,兩個研究機(jī)構(gòu)的醫(yī)生和科學(xué)家通力合作,由高級主治醫(yī)師和信息學(xué)研究人員組成的專家團(tuán)隊(duì)手動給電子病歷上的6000多張圖表進(jìn)行注釋,對模型進(jìn)行訓(xùn)練和檢驗(yàn)。高質(zhì)量的數(shù)據(jù)輸入成為這套系統(tǒng)的關(guān)鍵優(yōu)勢。
有了良好的訓(xùn)練為基礎(chǔ),接下來,研究團(tuán)隊(duì)采用邏輯回歸分類器的機(jī)器學(xué)習(xí)方式,建立了一套AI分診系統(tǒng)。這套分類系統(tǒng)模擬人類醫(yī)生問診的框架,把電子病歷中提取到的臨床特征按人體各大系統(tǒng)來逐級劃分。
具體來看,這套系統(tǒng)首先會按呼吸系統(tǒng)疾病、胃腸道疾病、全身性疾病等幾大系統(tǒng)分,然后在每一類下面做細(xì)分。舉例來說,在最常見的呼吸系統(tǒng)疾病中,這個系統(tǒng)會先按上呼吸道和下呼吸道進(jìn)行區(qū)分,再按喉炎、氣管炎、支氣管炎、肺炎進(jìn)行細(xì)分。經(jīng)過檢驗(yàn),在每一層級,由AI做出的初級診斷在精確度上都接近檢查醫(yī)師做出的初級診斷。例如在患兒群體中最常見的急性上呼吸道感染,模型對病例的診斷達(dá)到95%的準(zhǔn)確率。
對于一些兇險的、有可能威脅生命的疾病(例如急性哮喘發(fā)作、細(xì)菌性腦膜炎等),算法也同樣表現(xiàn)出了強(qiáng)大的診斷性能。這在臨床應(yīng)用中有非常重要的意義,因?yàn)橛辛薃I快速分診的輔助,就可以讓醫(yī)療服務(wù)的有限資源用于最需要幫助的患者。
▲AI診斷系統(tǒng)的分診層級(圖片來源:參考資料[1])
最后,要真正檢驗(yàn)AI的實(shí)力,當(dāng)然要讓AI來和富有經(jīng)驗(yàn)的人類醫(yī)生比試一番了。研究人員拿出近12000份兒科患者的病歷記錄,并把20位“參賽”兒科醫(yī)生按年資和臨床經(jīng)驗(yàn)高低分成5組,看看AI的成績和哪一組醫(yī)生接近。結(jié)果顯示,AI模型的平均得分高于兩組低年資醫(yī)生,接近三組高年資醫(yī)生。從這個結(jié)果來看,AI模型或許可以為年輕醫(yī)生做診治判斷時助他們一臂之力了。
“我們的工作借助AI復(fù)制優(yōu)質(zhì)兒科醫(yī)療智力資源,增加優(yōu)質(zhì)兒科醫(yī)療資源供給,通過輔助賦能,提升兒科醫(yī)療行業(yè)效率和體驗(yàn),并有望通過遠(yuǎn)程醫(yī)療和互聯(lián)網(wǎng)醫(yī)療形成更大范圍的示范推廣,從而為基層兒科醫(yī)生和年輕兒科醫(yī)生提供輔助診療服務(wù),為患兒家長提供智能自診服務(wù)和權(quán)威的第二診療意見,避免誤診、漏診造成的醫(yī)療風(fēng)險?!?夏慧敏教授說。
“我們的工作為不久的將來提供一種準(zhǔn)確快速廉價的兒科AI醫(yī)生系統(tǒng)打下了堅(jiān)實(shí)的基礎(chǔ)?!?張康教授補(bǔ)充說。
我們再次祝賀夏慧敏教授和張康教授的研究團(tuán)隊(duì),也期待人工智能的實(shí)施可以在不久的未來為廣大患者提供準(zhǔn)確高效的診斷,徹底改變看病難看病貴的現(xiàn)象。