每日最新頭條.有趣資訊

進行數據眾包,對解決新冠病毒等流行病有重要作用

“SARS期間有30多個版本的個案調查表,花了一個多月才確定終版。”

編譯:步搖

編輯:tuya

出品:財經塗鴉

內容來自於《柳葉刀》2月20日刊登的文章。

作者Gabriel M Leung和Kathy Leung來自香港特別行政區香港大學LKS醫學院公共衛生學院世衛組織傳染病流行病學和控制合作中心

2019年冠狀病毒疾病(COVID-19)傳播速度和規模空前,這也是自冠狀病毒導致第一次人畜共患病的嚴重急性呼吸綜合征進入人類以來最大規模的一次病毒傳播。據稱可能在2019年11月系統分析表明,測序基因組的最新共同祖先出現在2019年10月23日至2019年12月16日之間。

截至2020年2月19日,據報導,全世界近30個國家和地區的確診患者累計人數已超過70 000。

在任何一種新出現的流行病中,更不用說以如此大的規模和如此迅速的全球傳播速度的流行病爆發中,其第一個任務就是根據各個病例定義的工作標準,將一系列可疑,可能和確診的個體匯總在一起。該列表將允許快速初步評估流行病的增長和傳播的可能性,以便確定隔離和隔離期,以及監視潛在病例的檢測效率。隨著疫情的進展,隨著更多的臨床,流行病學和病毒學(包括遺傳學)知識的獲得,數據和列表將實時更新。

因此,從公共衛生的角度來看,列表是必不可少的。因此,在《柳葉刀》數字健康雜誌上發表的孫開元及其同事的研究成果表明,在COVID-19爆發的關鍵時刻列表非常有價值。孫開元及其同事利用中國的社交媒體,特別是醫療保健專業人員使用的社交網絡,在2020年1月期間收集了有關COVID-19患者的個人數據和每日省級病例數。他們將這些信息提取到眾包中的列表,經過適當分析後,與官方版本的列表非常吻合,例如中國疾病預防控制中心於2020.7年1月29日發布的報告。儘管孫開元及其同事的工作實時提供了寶貴的疫情圖景,但地理覆蓋範圍卻很不統一,武漢和湖北省的震中病例很少。

我們調查了COVID-19可能的列表的不同來源。瓶頸仍然在於仔細整理盡可能多的相關數據,篩選和驗證這些數據,提取情報以預測並告知爆發策略,然後以迭代周期,不斷重複此過程以監視和評估進度。一個可能的方法將是通過文本挖掘和自然語言處理(不限於英語)來開發和驗證算法,以使自動化機器人能夠搜索各種網絡空間,從而加快這些過程。

在這個擁有智能手機及數量龐大的應用程序的時代,政府不僅要抗擊流行病本身,而且還要打擊假新聞和虛假謠言(所謂的信息流行病)。信息流行病最明顯的後果是嘈雜的喧鬧聲,這種混亂的聲音會使混亂引起非理性的恐懼,甚至引起群眾恐慌,並最終在恰恰相反的情況下對社會造成破壞性影響。

在新加坡和香港等最開放的自由貿易經濟體中,超市貨架空置的圖像迄今已報導不到100例,這在一定程度上提醒了這種信息傳播的潛在影響。另一個例子是世界範圍內口罩的短缺和一些國家的出口禁令。創建諸如孫開元及其同事在其工作中匯編的資源,將使科學家和非專業觀察員都能夠迅速填補知識空白,否則將助長虛假信息傳播。

最後,疫病,信息病和大病都具有經濟成本。在2003年的嚴重急性呼吸系統綜合症(SARS)爆發期間,中國佔全球經濟總產值的4%,而今天卻佔16%。2019年,中國的供應鏈和生產線仍與世界許多貿易市場緊密相連。當然,這些經濟不確定性並未考慮到這種爆發可能對世界其他地區造成的影響,而現在已經包括非洲在內的大多數大洲都報導了病例。

儘管有上述動機,但在緊急情況下,尤其是在世界上人口最多的國家,疫情爆發,尤其是在1周內加倍傳播的疫情期間,在短短幾周內能涵蓋所有國內地區的分析的現成數據和清單的數量都是驚人的。即使在2003年SARS爆發期間,我們也處理了30多個版本的個案聯繫調查表,然後在確定第一例病例後的一個多月內才確定最終版本。值得注意的是,中國的衛生保健職能已下放到省級和地方級(擁有300多個縣級疾病預防控制中心分支機構),並且它仍然是一個發展中國家,在較大的地理區域內,隨著社會經濟發展梯度的不同,其防疫水準也不同。

眾包數據可以像正式發布的數據一樣及時甚至更快地進行編譯和分析。但是,這些未來的發展並沒有否定及時發布和更新具有保密性所允許的詳細信息的官方專線清單的重要性。但是,這樣的眾包方式將大大有助於解決和減輕世界在未來幾年內將要面臨的流行病,信息病和地域病。

獲得更多的PTT最新消息
按讚加入粉絲團