每日最新頭條.有趣資訊

用大數據解決臨床問題,40篇SCI輕鬆到手

之前 Science 報導了一場診斷皮膚癌的人機大戰,當機器學習了 13 萬張皮膚癌圖片時,其識別能力已超過經過 10 年以上訓練的高級年資皮膚科醫生。JAMA 雜誌也曾發表一篇機器學習識別糖尿病視網膜病變的文章。

我相信,任何有經驗的臨床醫生在日常診療中都積累了大量的臨床問題;做個 RCT 來解決該問題,在理論上雖然非常簡單,但實際上這需要太大的投入而無法實施。

那為什麼不用臨床大數據分析的方式進行解決呢?

實際上,在臨床問題和大數據研究之間有一個巨大的鴻溝,這個鴻溝就是數據挖掘。

臨床大數據從何而來?

臨床醫學作為資訊密集型的一個體系,大數據也越來越突出其地位。

在這裡,臨床大數據包括了住院系統、門診系統、社保死亡登記系統、傳染病、腫瘤報告系統,保險系統等等。而住院系統與臨床醫生關係最為密切,其中又包含了 His 系統、電子病歷系統、Lis 系統,影像系統。

目前國內從社區衛生院到大型附屬醫院都已經基本上完成了資訊化的過程,伴隨著醫療活動日復一日地進行,數據在不斷地積累。因此,每個科室,每種疾病都足以形成一個獨特的大數據集。

為了解決臨床問題,研究者會對這些數據進行分析,從而發現數據背後的規律。這就是所謂的大數據分析。比如,為了有效預測院內心臟驟停的發生,我們就需要建立模型,而建立模型的基礎就是平時積累下來的大數據,在這些大數據的基礎上建立的模型才是最適合本醫院的。

為什麼要用大數據分析?

臨床醫生的診療靠的是循證醫學,而循證醫學頂級證據都是以 RCT 為基礎的,這個偉大的體系已經持續了幾十年,而今光芒依舊。但 RCT 已經出現了一些瑕疵。

比如 JAMA 上前些年就有報導,在循證醫學最為發達的心內科,也只有 10% 的臨床決策來自於高級別證據等級。也就是說大部分臨床覺得我們無法找到良好的證據,依然是根據經驗而行。

導致這樣局面的原因在於 RCT 的缺陷

  • 不是任何問題都能用 RCT 解決的,比如研究 CPR 時緊急氣管插管的效果,顯然採用隨機方法實施起來很困難,而且會遇到倫理問題;

  • RCT 耗費人力物力,難以針對各種臨床問題全面鋪開;

  • RCT 有嚴格的納入/排除標準,研究得出的是生物學的效應(biological efficacy),而不是臨床療效(clinical effectiveness)。也就是說 RCT 結論告訴你有效,但那是在單病種情況下,現實中我們的患者可能存在很多合併症,而導致乾預手段失效;

  • RCT 的實施場景是特殊化的,較為嚴格的,有時候與真實世界相差甚遠。

這些問題雖然不足以使傳統的循證醫學大廈倒塌,但卻催生了以大數據為基礎的臨床研究。

之前提到大數據就是臨床診療過程中產生的數據,不存在任何的加工排除標準,研究環境就是我們平時診療工作的環境,即所謂「真實世界研究」。

這裡舉個例子來解釋下「真實世界研究」。例如某醫院,因為疏於質控,某化驗指標開始變得不那麼準確,產生了一個系統誤差,平日裡醫生的診療就是根據這個有誤差的值做出的。

如果是做 RCT,那麼在執行之前,勢必要將這個檢驗重新定標,使其準確。待 RCT 完成之後,也許檢驗科的工作又回到了原先的狀態,這時醫生的診療又是基於有偏差的檢驗值得出。

這樣的 RCT,雖然精確,但其結果的臨床指導意義勢必受到影響。

這時,反而是大數據「真實世界研究」愈加能發揮其作用,比如建立模型,根據有偏差的值做出的模型隻適用於有偏差的診療環境。

臨床大數據研究的價值

相比傳統 RCT,大數據研究的其它優勢顯而易見:

它是現成存在的數據,只要編寫程式導出數據即可,不像 RCT 需要花費大量人力物力進行實施;

  • 研究問題無任何限制,只要是平時臨床診療會碰到的問題,就必然有相關的診療數據產生並記錄在資訊科的硬碟上,這就是臨床科研的第一手素材;

  • 大數據研究的是樣本總體本身,沒有抽樣,也就最大程度上減少了誤差;

  • 大數據的多樣性,不像 RCT 隻選取了最為精乾的單病種來做研究,大數據包含的樣本個體就是真實世界存在的個體,包含各種合併症、併發症。

大數據研究能解決這些臨床問題

首先,臨床大數據能解決臨床診療常規中碰到的一些問題,及常見病的處理,因為只有這類問題才有大容量的數據積累。例如 Science 曾發表過的皮膚癌的識別問題。試想,一個皮膚科醫生窮其一生也難以學習到 13 萬份皮膚癌圖片,而利用大數據技術,幾分鐘就能完成這樣的事情。而且程式是可以複製的,63 億人如果人手一個手機,每個手機都植入一個經過學習的程式,那麼就相當於每人擁有了一個私人訂製的頂級皮膚科醫生。

還有一些臨床問題因為倫理限制不適合做 RCT 研究,這也是大數據研究可以提供證據的地方。比如 BMJ 上發表過的關於心肺復甦時是否需要緊急氣管插管的問題。

臨床大數據挖掘教學課程來了!

目前現狀是,一方面臨床醫生產生了大量的問題,但分析無從著手;另一方面,數據專家雖然有很強的數據分析技能,但他們缺乏臨床知識,而臨床知識太過專業。

其實解決臨床問題還是應該依靠臨床醫生,那麼我們要做的就是要學習如何處理臨床大數據。

為此,丁香園特別開設了《臨床大數據獲取、分析與處理實操課》

本課程從零基礎開始講授數據分析的方法技巧,讓臨床醫生掌握數據挖掘這項掘金技能,來開發臨床大數據這個寶藏,更好地為人民健康服務,更好地做臨床研究和發表 SCI 論文。

本影片課程共 26 節,僅 ¥798 (國慶期間有特價優惠哦~)。課程全部使用 R 語言進行講解,適合零基礎學員。

推出以來已經有超過 600 名學員報名。

報名還可加入 VIP 學員群,與講師交流零距離。

報名通道

▼▼▼

即可試聽或購買

或者你還可以試試科研會員

每天只要 3 塊錢,就可以學習包括文獻閱讀、課題設計、統計分析、實驗操作、論文寫作等 14 門醫學科研必備課程。


TAG: |
獲得更多的PTT最新消息
按讚加入粉絲團