每日最新頭條.有趣資訊

加州伯克利教授:美國或在4月10日至14日達病例最大值

美國是全球累計確診新冠病例數最多的國家。作為全球疫情的震中,美國的疫情何時結束?當地時間4月3日,加州大學伯克利分校教授Slav Hermanowicz在預印本網站medRxiv發布論文,通過建模預計:美國的新冠報告病例數可能在4月10日至14日左右達到最大值。

Slav Hermanowicz教授是美國加州伯克利大學土木與環境工程系教授,高端外國專家項目專家,IWA編委,歐洲科學和藝術學院成員,同濟大學、慕尼黑工業大學、北海道大學等多所國際知名學府客座教授。

據美國約翰斯·霍普金斯大學新冠肺炎疫情最新統計數據顯示,截至台灣時間4月6日凌晨1時20分(美東時間4月5日13點20分),美國累計確診病例324052例,累計死亡9180例。

Hermanowicz教授曾通過中國疫情前22天的數據(到2020年2月6日)近乎實時地分析了中國新冠疫情的演變。在這項新研究中,他使用了中國截至2020年3月13日的87天數據以及美國截至3月31日70天的數據,通過Logistic模型進行系統評估以預測美國疫情的增長。研究者估算了模型參數集(最大病例數“K”、增長率“r”和中途時間“t0”)和疫情“結束時間” ——t95(“t95”的定義為預測或實際病例數達到95%的最大值的時間)。

這些參數是根據每天增長的報告病例數進行的預測的。不過在這兩個國家中,K的估計值在指數階段和近指數階段時會隨著時間的增長快速增長,這使得長期預報K值並不可靠。相比K值,該模型對時間的預測更為重要——即t95的區間預測。中國的“結束時間” t95的估算值為60天至70天,實際值為67天,即2月22日,此時中國達到最大病例數的95%。對於美國,Hermanowicz教授通過輸入從現在起往前推兩周的數據,模型估算的“結束時間”值範圍為70到80天之間。如果美國流行病的行為與中國先前的發展相似,則報告的病例數可能在4月10日至14日左右達到最大值。

Logistic模型及其應用

Hermanowicz教授在之前的研究中使用了簡單的Logistic模型,用來分析中國國家衛健委報告的COVID-19病例數據,並推算疫情的演變。最初的分析分三個階段進行(1月30日、2月3日、2月6日)。分析得出了一系列不斷更新的關於疫情動態的預測。隨著新數據的獲得,最大病例數的預計值會持續增加,然而該預測會系統地低估最終報告的病例數。不過,該流行病的連續預測動態非常接近最終的實際結果。

在最新的研究中,研究者進一步探討了這個問題,並使用了完整的中國大陸報導數據來對疫情進行系統的反向估計。

在進行這項研究時,美國正在經歷疫情的快速暴發。作者認為,美國的疫情在某些方面類似於中國,但總體來說有所延遲。研究者運用對中國疫情的分析經驗,來預測美國新冠病毒病例的進一步發展。研究者對美國疫情的預測基於當前可用的數據(不考慮任何其他可能的次要感染源,診斷或報告標準的變更或病毒的突變)。

研究者提到,對疫情和感染動態進行建模非常重要,最近關於全球COVID-19暴發的研究正大量發布。不過許多報告的模型太複雜,不僅包含了初步假設,還需要估計一些不太可靠的參數。

在這項工作中,研究者將非常簡單的Logistic模型擬合到可用數據,並預測最新的感染結果。與其他模型相比,Logistic模型不包含任何外部假設,並且完全從可用數據中得出。

Logistic模型是人口動態中最簡單的模型之一,長期以來一直專門應用於流行病領域。在我們對中國流行病發展的早期分析中,由於該模型結構簡單且易於計算,因此使用了離散模型。

在離散時間內(更適合於每日報告的感染病例),Logistic模型變為:

其中P(t)和P(t + 1)是連續幾天的人數(病例數),R0 *是Logistic增長開始時的增長率(流行病學中的基本傳染數),而K是極限人數(最大病例數)。

然而,用連續時間t表示種群P的增長可以將模型公式化為一個普通的一階微分方程,該方程描述了種群P的動態演變(在本研究中為感染者數量),並受增長率r和最大病例數K的控制。 在連續時間t中,P變化為:

最初,P的增長接近指數級,因為(1 − ⁄)幾乎為1。 當P變大(與K相稱)時,增長率隨著

成為有效的瞬時增長率。

方程(2)的解,是眾所周知的S形函數(logistic函數)

其中,t0是病例數達到最大值一半P(t0)= 1⁄2 K的時間。使用模型的微分版本會更方便,因為存在閉式解,並且可以直接估計三個模型參數:K,r和t0。Logistic模型可能足以分析整個中國大陸和整個美國,因為此時每個國家都可以視為一個單元,其中發生的絕大多數病例沒有任何顯著的“輸出”或“輸入”。

數據分析

分析中國的疫情發展時,研究者使用了國家衛健委截至2020年3月13日(疫情爆發的第87天)每天報告的數據,僅有11例新增病例——比總病例數乘以2×10的負4次方還少,研究者認為這意味著國家層面已經有效地結束了疫情。

論文中提到,關於中國疫情暴發的確切日期,有很多不同的說法,大部分指向12月中旬。另外有一些分析表明有多個原始感染源,同時疫情最初暴發時未能被確認。

在Hermanowicz教授的分析中,則採用2019年12月17日作為疫情暴發的起點。此外,在流行的最初階段,由於對疾病知之甚少、無症狀感染者的存在,報告的病例數可能遠低於實際病例數。只有在疫情發展到一定階段,才能估計出更準確的數。

來自中國的數據顯示,累計病例數呈S形增長。在美國,有大量的機構根據美國各級的政府公布的COVID-19病例數進行疫情追蹤。研究者採用了基於網絡數據的聚合(主要是州級)數據,進行每日病例更新。

研究者以2020年1月21日作為美國疫情的開始時間(第1天),當天報告了美國第一例非撤僑的新冠病例。研究者表示,與中國一樣,由於相同的因素(無症狀攜帶者,最初的認識不足,有限的檢測),初始階段的病例數也被低估。儘管存在這些問題,但這項工作中使用的數據是當前可獲得的最佳數據。

中國和美國的數據也都以半對數形式繪製,以強調該流行病在最初階段的指數增長。在中國,指數增長階段從第30天開始直到到第42天結束,用虛線表示。在第42天(1月28日)之後,病例數仍在增加,但增長率正在降低,代表累積病例的線與指數曲線偏離。

在美國,指數增長髮生的時間較長,直到最近(3月27日至30日)才開始偏離指數曲線。

模型估計和結果

對於中國和美國的報告累積病例數的數據集,研究者估計了邏輯模型的三個參數(最大病例數“K”、增長率“r”和中途時間“t0”),使模型預測與數據擬合。研究者使用定製的非線性曲線擬合程序,該程序採用Levenberg-Marquardt方法。 與Hermanowicz教授之前的工作相似,研究者從日漸增長的數據集中估算模型參數。

對於中國,第一個數據集包含從第38天到第42天的5天。下一個估計值使用了從第38天到第43天的6天。重複此過程,直到使用中國病例數據集的第87天。對於美國,第一個數據集還包含從第43天到第47天的5天。美國可用序列的最後一天是第70天(2020年3月30日)。所有得出的估算值均顯示在附錄中。

在中國疫情增長已基本結束,研究者就以順序估計過程(反向回推)模擬了疫情動力學的近實時分析。而美國仍處於疫情實質性的增長階段,連續估算是幾乎實時進行的。除了三個模型參數外,研究者每天還估計流行病結束的預計時間。即預測的病例數達到預估最大K的95%時,通過設置P(t)= 0.95 K。

中國

如Hermanowicz教授此前進行的分析,預測的最大病例數K,在很大程度上取決於用於估計的數據集的長度。例如,圖5顯示了一些logistic曲線,這些logistic曲線對應著中國特定日期所選模型參數的估計值。如該圖所示,初始估計(接近指數階段)低於20000,但隨著更多數據可用並用於估計細化,它們增加到大約100000。顯然,從完整數據集(直到第87天)獲得的K估計值與實際報告的病例數(80780與80807)是的非常匹配的,但應注意,從第65天起便已非常接近收斂的實際最大值。

由於第57天(2月12日)中國報告標準的變化,報告病例數突然激增。如前所述,研究者決定在任何後續分析中使用所有數據(帶有跳轉)。直接結果是估計的最大案例K有了很大的增加(圖3),從第56天的約50000到第59天的約99400大約翻了一番。這一巨大的增長再次凸顯了Logistic模型對數據質量的敏感性。但是,由於對K的固執迅速收斂至其最終值,也展示該模型在長期預測時具有強大的魯棒性。

同樣,由於病例數量的增加,t95的估計值也出現了大幅增長。但是,值得注意的是,“結束時間” t95的估計受到更多限制,並且更接近於實際值。甚至早在流行病結束前的三周的時候,對“結束時間”的估計值就落在60到70天之間的範圍內,非常接近實際的最終值——67天。

美國

與中國不同,美國的疫情仍處於增長階段。因此,可用的數據集要小得多,Logistic模型的估計值不確定性也要大得多。圖3中顯示了當前對最大病例數K的估計值。它們顯示出非常大變動範圍,從第47天的約1100增加到第70天的約265000,沒有任何平穩的跡象。如此大的變化並不意外,因為美國疫情目前近乎指數的增長,沒有包含關於實際最大值的足夠信息。換句話說,方程式中的導數dP / dt由項r P主導,而(1- P / K)» 1。這在選定的估計參數——K、r、t0的預測Logistic曲線中也可見到(圖6)。

“結束時間” t95的順序估計值繪製在圖4中。隨著報告病例數的增加,它們的時間也趨於增加,但與K估計值不同,它的變化要小得多。根據過去兩周的數據,結束時間應該是介於70到80天之間。研究者認為,如果美國疫情發展與中國的情況相似,可以預期“t95”會在略高於80天的時間內進一步趨於平穩。 如果這一大膽的預測得以維持,可以看到疫情增長將在暴發後大約80-85天左右結束,即4月10日至14日結束。當然,這裡的結束被定義為不再有顯著的新增病例,而不是新冠患者完全康復。

獲得更多的PTT最新消息
按讚加入粉絲團