每日最新頭條.有趣資訊

如何“喂飽”醫療AI?騰訊這個實驗室想了“兩個辦法”

我們都知道人要保持充沛的精力,離不開食物、水等能量供給,只有保持充沛精力才會有力量去發現、去創造。

同樣,要想一個醫療AI像人類那樣思考,成為醫生的得力助手,就必須“喂”給它大量的數據,幫助它從中找出規律。

而現在,醫療AI卻面臨“雙重挑戰”,一是缺乏訓練樣本,二是缺乏標注。

這兩大挑戰讓深度學習嚴重“彈藥不足”,由此衍生出的“小樣本學習”問題一定程度上阻礙了AI醫學影像的發展,難道就這樣止步不前?這些問題到底該如何突破?

在5月30日-6月2日的“中國醫師協會第十三次放射醫師年會”上,騰訊優圖實驗室醫療AI總監鄭冶楓博士,在題為“深度學習在醫學影像分析上的應用”的分享中,講述了騰訊優圖實驗室通過遷移學習和計算機合成圖像兩大方法,突破醫療AI數據量不足,沒有辦法像傳統機器學習那樣用大數據進行喂哺的問題。

騰訊優圖實驗室是騰訊頂級人工智能實驗室之一,專注於在人臉、圖像、視頻、醫療影像等領域開展技術研究。騰訊首款將人工智能技術運用在醫學領域的產品“騰訊覓影”,即是由騰訊醫療健康事業部牽頭,優圖實驗室提供的算法支持。

醫療AI面臨“雙重挑戰”

當前人工智能技術的迅猛發展,與強大的計算能力、合理的優化算法和高質量的大數據密切相關。要讓機器像人類那樣思考,成為醫生的得力助手,就必須“喂”給它大量的數據,幫助它從中找出規律。但是,在醫療人工智能領域,這一切卻沒有這麽簡單。鄭冶楓博士提到,近年來,深度學習在包括圖像識別、遊戲、語音識別、自然語言處理等方面取得了重大發展。但是,醫療AI的發展卻面臨“雙重挑戰”。

一是缺乏訓練樣本。鄭冶楓博士表示,“深度學習的目標是盡量端對端,圖像進去、結果出來,因而網絡越來越大,越來越多層,需要的訓練樣本也越來越多。”但與自然場景下自然圖像獲取不同,醫學影像的獲取十分艱難。

一方面,圖像采集的“高門檻性”也製約著訓練樣本的獲取。“醫學影像采集需要專門的設備,有一些設備非常昂貴,比如CT和核磁。”

另一方面,疾病本身的特殊性也對算法工程師獲取樣本造成阻礙,鄭冶楓博士表示,“對於一些罕見病種,能夠找到的圖像就只有幾百張或者一千來張,因為每年的發病量就那麽多。”

二是缺乏標注。鄭冶楓博士介紹道,對於自然圖像來講,其標定相對容易,即便是普通人也能夠直接標注。但醫學影像不同,其標注需要行業頂尖的專業醫生參與。“現實是,培養一個醫生需要十年時間甚至很長,加上臨床、科研任務重,做數據標注對於醫生來說也是‘有心無力’。”

兩大方法突破醫療AI小樣本學習問題

針對這兩大挑戰,鄭冶楓博士提出,有兩種方法有助於解決這一問題:一是遷移學習;二是計算機合成圖像,比如生成對抗網絡。

遷移學習這個要如何理解呢?鄭冶楓博士用了一個生動的比喻:“比如說一個人去森林裡找老虎,但從來沒有見過老虎,不知道老虎長什麽樣。但假如他可以把貓和狗、狐狸等其他動物區分開來,就可以先訓練他去找貓,這就是預訓練的過程。接下去,我們告訴對方:老虎就是黃色的貓放大100倍,從而達到‘找老虎’這個目的。”他強調,遷移學習非常適用於解決小樣本的訓練問題。

另一個方法則是計算機合成圖像。通過影像跨模態轉換,計算機合成圖像能夠有效補充訓練樣本,而生成對抗網絡則讓訓練如虎添翼:一個網絡生成圖像,一個網絡鑒別目標的真偽,把兩個網絡做一些聯合訓練。訓練結束時,生成網絡可以產生非常逼真的圖像。

鄭冶楓博士以肝癌為例,“有時候跨模態生成的圖像會扭曲,會生成一些新的病灶,也可能遺漏一些病灶,為此,我們在研究過程中會加上各類限制,減少生成圖像的失真。我們的算法很完美地保留了器官和病灶的形狀,是在用非常真實的圖像作為訓練任務,通過這種方法,能夠讓準確率得到明顯的提升。

醫療AI逐步落地 提升診斷準確率和效率

通過遷移學習、計算機合成圖像等方法,影像診斷領域的深度學習取得了顯著進展。以肺結節檢測為例,鄭冶楓博士介紹道,目前肺結節檢查方式主要是肺部CT,隨著薄層低劑量CT的應用,圖像數量的倍增、小結節顯示率的提高及結節的定量測量等使得讀片的難度顯著增加,同時,繁重、枯燥的閱片工作使影像科醫師的疲勞度增加,漏診、誤診的風險也在增加。

人工智能的運用,使得這些問題逐步得到解決。經過不斷地迭代和更新,“騰訊覓影”早期肺癌篩查AI系統採用了騰訊優圖實驗室的“端到端肺癌輔助診斷技術”,能夠精準定位微小結節位置和輔助醫生準確判斷患者患有肺癌的風險。

預處理模塊、檢測與識別模塊是這一系統的核心算法。前者利用肺部的三維分割和重建算法,可以處理不同CT成像設備在不同成像參數條件下產生的不同源數據。而後者採用了“深度學習領域最好的分割算法”——全卷積神經網絡,可以實現早期肺結節檢測和分割。

鄭冶楓博士表示,全卷積神經網絡有兩部分,一部分是編碼器,把圖像不斷卷積和下采樣,最後壓縮到低維空間,這是不同任務可以共享的。一部分是解碼器,不斷卷積和上采樣,最後輸出一個輸入圖像大小一樣的分割結果,這部分是每個任務獨有的。“我們預訓練的編碼器會把所有任務的圖像都看一遍,因此訓練得非常好。”

“把編碼器訓練好之後,就將其遷移到其它任務,如肺部分割和肺結節良惡性判斷上。採用公開數據集,發現不僅僅分割可以做得很好,分類也可以做得很好。”鄭冶楓博士強調,“在醫療AI上,技術方面大部分工作都差不多,最後的競爭還是在細節方面。”

比如在良惡性的判斷上,騰訊提出了Med3D預訓練模型,該模型採用多個公開競賽數據集進行訓練。通過選取三維醫學影像進行圖像分割任務,並對這些數據進行抓取、收集,預訓練一個模型,能夠大幅提高分割和分類的準確率,解決了大部分結節不活檢,不知道良惡性的問題。”

目前,“騰訊覓影” 通過人工智能醫學圖像分析能力輔助醫生閱片,已經能精確定位3mm以上的微小肺結節,檢出率≥95%。同時,除早期肺癌外,“騰訊覓影”還能利用AI醫學影像分析輔助臨床醫生篩查早期食管癌、眼底疾病、結直腸腫瘤、宮頸癌、乳腺腫瘤等疾病。

獲得更多的PTT最新消息
按讚加入粉絲團