每日最新頭條.有趣資訊

Nat Medicine亮點 | 谷歌AI開發3D深度學習演算法精準預測肺癌風險

撰文 | 伊凱

責編 | 兮

肺癌是全球範圍內最為常見的,也是在中國和美國等國造成最多死亡病例的癌症類型,全球每年有約160萬人死於肺癌【1】。由於大部分肺癌患者在就醫時已處於癌症晚期階段,不適合手術治療或治療效果差,因此對肺癌的早期診斷和臨床乾預就顯得尤為重要。然而,處於肺癌早期階段的患者通常並無明顯臨床癥狀,僅靠常規X光檢查極易漏診;而另一方面,儘管胸部CT掃描具有顯著更高的密度解析度,但大規模採用CT篩查又會帶來異塵餘生劑量過高的風險。因此,誕生於上世紀九十年代的低劑量CT掃描(low-dose computed tomography, LDCT)憑藉其低至常規CT十分之一的異塵餘生劑量和相差無幾的診斷敏感度成為了目前肺癌早期診斷的通行手段。

在美國,對肺癌高危人群中進行大規模LDCT篩查,並由放射科醫生根據肺部結節大小、密度和生長狀況等因素分析患癌風險,然後做出臨床乾預建議的方法,顯著降低了患者死亡率(20-43%)【2】。不過,依據LDCT結果對肺癌風險進行預測仍然面臨著諸多挑戰,例如不同分析者間的顯著打分差異、較高的假陽性和假陰性比例以及較低的分析效率【3】。無論從提升診斷精準度還是改善經濟效益的角度,開發和廣泛利用自動化的早期肺癌診斷流程都顯得十分必要。

近年來,深度學習技術的飛速發展帶動了多個現實領域的革命性變化。由今年三月剛獲得圖靈獎(ACM A.M. Turing Award)的人工智慧三大巨頭之一的Yann Lecun最初於1989年提出的卷積神經網路(convolutional neural network,CNN【4】及其多種變體(下圖),憑藉精妙的模仿人類視覺認知層級結構設計的卷積(convolution)和池化(pooling)與非線性激活配合的演算法特徵,在計算機視覺(computer vision)的多個子領域的重要問題上(如人臉識別、圖像語義分割、目標追蹤和視頻分類等)都取得了最好性能;其同時也依靠對局部序列特徵的識別和提取能力被廣泛運用至生物學領域中DNA/RNA-蛋白互作【5】、DNA甲基化【6】和染色體可接近性【7】預測等問題中。因此,CNN自然也成為了基於圖像分析捕捉病理特徵進行病理診斷的利器。

2019年5月20日,作為人工智慧領域的領跑者之一的谷歌AI主導並聯合史丹佛大學、西北大學和紐約大學的多個研究組在Nature Medicine上發表了題為End-to-endlung cancer screening with three-dimensional deep learning on low-dose chestcomputed tomography的研究,報導了利用3D深度學習演算法預測肺癌的最新進展。

在該項研究中,研究人員設計了一種以三維Inception網路(CNN的一種變體)為核心本質為二元分類器(binary classifier)的複合型卷積神經網路,在輸入端給予患者當前時段的胸部LDCT三維圖像或配合以之前就診時的圖像,而在中間層則同時包含兩部分分析路徑:一是不加限制的LDCT三維全局圖像分析,二是經由提前訓練得到的對包含潛在肺部結節的局部結構的特異識別分析。最後,網路中的上述兩條路徑的輸出值被合併在一起通過輸出層計算導出為肺癌風險預測概率(下圖)

研究人員利用獲取自美國國家肺癌篩查試驗計劃(National Lung Cancer Screening Trial, NLST)的一萬多個病人的四萬多個CT圖像數據訓練了這一網路結構,隨後在測試集(test set)上獲得了高達94.4%的ROC曲線(receiver operating characteristic curve, 以二元分類問題中的假陽性率為橫軸,真陽性率/敏感度為縱軸)下面積(表徵了分類效果與隨機區分的差異程度)。更重要的是,當研究者安排六位平均執業年齡為8年的放射科醫生對同一測試數據集進行肺癌患病風險打分時,發現他們的平均表現顯著差於深度學習網路,且無任何一人具有更優表現(下圖)。值得注意的是,醫生在CT圖像之外同時還具有病人的身份信息及臨床歷史信息。因此,通過大數據訓練的人工智慧模型在早期肺癌風險預測這一任務上表現出了優於人類專家的性能。

在另一項測試中,研究者為網路模型和放射科醫生均同時提供了患者當前時段的CT圖像及配對的之前診斷時的CT圖像。通過不同時間點的CT圖像判斷肺部結節的生長狀況亦是早期肺癌診斷的重要方式之一。由於具有這類前後時間點配對數據的病例相對較少,因此研究者觀察到此次分析中無論是網路模型還是放射科醫生的表現均較前一僅依據當前階段CT圖像的分析有所下降。不過,醫生的預測表現仍然顯著低於模型的預測表現,或兩者持平(下圖)。這一結果有力地證實了神經網路對肺癌預測的結果穩健性。

總之,該研究中通過對超大數據集的運用、對胸部CT圖像的全局和局部特徵的同時識別和提取,以及對不同時間點的CT圖像的綜合分析,實現了人工智慧預測肺癌風險的現有最高精度,且被證明顯著優於醫生表現。其端對端的無需人工輔助的自動化流程也具有相當程度的便捷性和可靠性。同時,這一研究提出的網路結構具有較強的延展性和靈活的適應性,能夠被運用至多種基於三維圖像的病理狀態分析任務中,因而在未來可預期成為病理分析的常規手段。

原文鏈接:

製版人:小嫻子

參考文獻

1. Bray, F. et al. Global cancer statistics 2018: GLOBOCAN estimatesof incidence and mortality worldwide for 36 cancers in 185 countries. CA.Cancer J. Clin. (2018). doi:10.3322/caac.21492

2. Jemal, A. & Fedewa, S. A. LungCancer Screening With Low-Dose Computed Tomography in the United States—2010 to 2015. JAMA Oncol. 3, 1278 (2017).

3. Black, W. C. et al. Cost-Effectivenessof CT Screening in the National Lung Screening Trial. N. Engl. J. Med. (2014).doi:10.1056/NEJMoa1312547

4. LeCun, Y., Boser, B., Denker, J., … D. H.-N. & 1989, U. Backpropagationapplied to handwritten zip code recognition. Neural Comput (1989).

5. Alipanahi, B., Delong, A., Weirauch, M.T. & Frey, B. J. Predicting the sequence specificities of DNA- andRNA-binding proteins by deep learning. Nat. Biotechnol. 33, 831–838 (2015).

6. Sharma, C., Gupta, R. K., Pathak, R. K.& Choudhary, K. K. DeepCpG: accurate prediction of single-cell DNAmethylation states using deep learning. Fluoride 47, 15–22 (2014).

7. Kelley, D. R., Snoek, J. & Rinn, J.L. Basset: Learning the regulatory code of the accessible genome with deepconvolutional neural networks. Genome Res. 26, 990–999 (2016).

8. Liu, Y. et al. ArtificialIntelligence-Based Breast Cancer Nodal Metastasis Detection Insights Into theBlack Box for Pathologists. Arch. Pathol. Lab. Med. (2018).doi:10.5858/arpa.2018-0147

9. Sayres, R. et al. Using a Deep LearningAlgorithm and Integrated Gradients Explanation to Assist Grading for DiabeticRetinopathy. Ophthalmology (2019). doi:10.1016/j.ophtha.2018.11.016

BioArt,一心關注生命科學,只為分享更多有種、有趣、有料的信息。關注投稿、合作、轉載授權事宜請聯繫微信ID:bioartbusiness 或郵箱:[email protected]。原創內容,未經授權,禁止轉載到其它平台。


獲得更多的PTT最新消息
按讚加入粉絲團