国家呼吸系统疾病临床医学研究中心

基于SEIR优化模型和AI模型对公共卫生干预下的中国COVID-19暴发趋势预测
发布: 2020-03-05

 

    近日,钟南山院士团队在Journal of Thoracic Disease发表“基于SEIR优化模型和AI对公共卫生干预下的中国COVID-19暴发趋势预测”的文章。

 

    该研究预测了COVID-19疫情全国在2月下旬达到高峰,4月底趋于平缓。如管控措施推迟5天实施,中国大陆的疫情规模预估将扩大至3倍;如减低武汉管控力度,湖北可能在3月中旬出现第二次疫情高峰并延续至4月下旬。其中,优化的SEIR模型和AI模型预测表明,截至4月底国内有9万至12万的疫情规模,请大众不要误解,模型预测与现实是存在一定差距的,如政府继续严格的管控政策,提高诊断水平,推出使用药物,该疫情规模将得到极大控制。另外,本文提及的湖北出现二次高峰是在管控降低的情况下作出的假设,如正常春运,复工等。按目前情况,湖北省政府仍将继续保持严格管控,出现二次高峰的可能性也相对较少。

 

    目前本文预测结果是基于2月9日前的管控政策,疫情规模均比Lancet及国外学者预测的少。Wu等学者预测武汉的疫情规模将在1月25日达到17.5万例,疫情将在4月达到高峰。同样,Read等人预测,在没有控制措施的情况下,将在2月4日达到高峰,高达19万例。即使是交通管控也不能获得很好的效果。上述预测均没有考虑到我国严格管控的措施,导致可能夸大的疫情规模。本文数据显示截至4月底国内疫情现存确诊病例(非累计确诊数)高峰不高于7万例,湖北不高于52000例,广东和浙江不高于1200例,目前流行数据均在本文的预测范围内,更贴近真实情况。

 

    文章结果结论是基于SEIR数学模型和AI模型进行预测的,欢迎大家阅读。

 

杨子峰1,5,曾志奇1,王珂2,黄淑珊1,7,梁文华1,Mark Zanin1,7,刘鹏3,曹旭东3,高中强3,麦芷桐1,梁靖怡1,刘晓青1,李时悦1,黎毅敏1,叶枫1,关伟杰1,杨一帆4,李飞4,罗圣美4,谢玉琪1,刘斌6,王周琅1,张少博2,王耀南2,钟南山1,何建行1

 

1广州医科大学附属第一医院广州呼吸健康研究院呼吸疾病国家重点实验室/国家呼吸系统疾病临床医学研究中心

2横琴鲸准智慧医疗科技有限公司

3南京云创大数据科技股份有限公司

4星环信息科技 (上海) 有限公司

5澳门科技大学,中药质量研究国家重点实验室,澳门药物及健康应用研究院,中医药学院,澳门特别行政区,中国

6昆明理工大学

7香港大学公共卫生学院,香港特别行政区,中国

 

通讯作者: 

何建行

电子邮箱: hejx@vip.163.com

钟南山

电子邮箱: nanshan@vip.163.com

 

注:杨子峰、曾志奇、王珂、黄淑珊、梁文华、Mark Zanin、刘鹏对此文章贡献相同。

 

摘要 

 

    背景:中国湖北省武汉市新型冠状病毒肺炎(COVID-19)的暴发恰逢人口大规模迁徙的春运时期。为遏制疫情蔓延,中国政府于2020年1月23日起采取了大规模检疫、限制出行和对可疑病例监控等前所未有的全国性防疫干预措施。但尚不清楚这些政策是否有益于流行病的控制。

 

    方法:本研究将2020年1月23日前后的人口迁徙数据以及最新的COVID-19流行病学数据整合到经典传染病学预测模型(SEIR)中并得出流行曲线。此外,基于2003年SARS数据进行训练的人工智能(AI)方法来预测本次疫情的流行趋势。

 

    结果:推测本次疫情全国在2月下旬达到高峰,4月底趋于平缓。如管控措施推迟5天实施,中国大陆的疫情规模预估将扩大至3倍;如减低武汉管控力度,湖北可能在3月中旬出现第二次疫情高峰并延续至4月下旬。

 

    结论:优化的SEIR模型及成功建立的人工智能模型能有效预测新冠病毒的流行趋势,证实 1月23日起实施的公共卫生干预措施有效控制了疫情发展。

 

引言

 

    2019年12月,中国湖北省武汉市暴发了由新型人畜共患病冠状病毒(SARS-CoV-2)引发的非典型肺炎(COVID-19)[1-2]。之后,疫情迅速蔓延。截至目前,国内已报告7万余例感染病例和2000多例死亡病例,全球报告感染超过3000例 [3-4],疫情严重程度已超过2003年的严重急性呼吸综合征(SARS)[5]。本次疫情恰逢在春运期间暴发,为遏制疫情,中国于2020年1月23日开始实施前所未有的公共卫生干预策略[6]:封闭武汉的离城通道,延长了法定假日,采取了严格旅行和公共聚会限制措施,关闭了公共场所,并在全国范围内实施了健康监测。但是,尚不清楚这些政策对疫情的控制效果,以及应当保持实施多长时间。因此,本研究通过优化的易感-暴露-感染-退出(SEIR)流行病学模型,结合了1月23日前后的国内迁徙数据以及最新的COVID-19流行病学数据来预测疾病发展进程。另外,还使用了2003年SARS冠状病毒暴发数据进行了机器学习,通过人工智能(AI)方法证实了我们的模型预测。

 

结果

 

    一、湖北省、广东省和浙江省的疫情进展

 

    本文选择了COVID-19确诊病例数最多的三个省份进行研究[7-8]。2月10日,湖北省、广东省和浙江省COVID-19的确诊病例分别为31728例、1177例和1117例 (图1A)。1月7日至23日,广东省和浙江省的迁出人数达到最大且高于流入量。而对于湖北省来说,在1月23日之前,由于春节期间迁移人口的返回,其迁入人数大于流出量。1月23日之后,湖北省开始实施公共卫生干预措施如限制出行,迁移曲线与广东省和浙江省相比明显较为平坦(图1B)。


    图1. 模型数据 (A)截止2月10日各省确认的COVID-19病例,数据来自https://voice.baidu.com/act/newpneumonia/newpneumonia/?from=osari_pc_3. (B)2020年春节假期湖北、广东、浙江三省迁移率指数(实线-流入,虚线-流出)

    SEIR是一种流行病学模型,此模型假设将人群划分为四种状态:易感[S]、暴露或潜伏[E]、感染[I]或退出[R]来预测传染性疾病动力学。每个状态的人口比例由每个状态之间的变化率决定:β ([S] 指向[E]或[S]指向[I]), σ ([E]指向[I]) 以及 γ ([I]指向[R])。参考每个省可用迁移指数(数据取至分析当日),随后根据我们的假设情况模拟往后日期的迁移指数。对于广东省、浙江省、湖北省和中国(在模拟中,交通限制减弱),则使用了2019年的迁移指数,而且认为在[E]指向[S]的迁移率β1是[I]指向[S]的β2的5倍。

 

    由于湖北省目前已实行严格检疫措施,假设2月10日之后湖北省的迁移指数设为零。在2月12日之前,确诊病例主要是基于PCR技术。在此基础上,本模型预测将在2月20日达到单个流行高峰,存在42,792(95%CI 30,149–52,941)例现存确诊病例。预计疫情在4月下旬趋于平缓,总病例数预估达到59,578 (95%CI 39,189–66,591)。如果延迟实施干预措施,疫情将在2月25日达到高峰,当天前后预估有115,061例现存确诊病例,暴发总人数会达到167,598例。如果提前5天采取干预措施,疫情预计在2月15日达到高峰,最终病例数将不会超过25,000(图2)。

 


    图2.  改进的SEIR模型预测曲线 (A)湖北省有严格管控,(B)湖北省减少管控力度,(C) 广东省,(D) 浙江省和(E)中国在1月23日(蓝色),5天后(灰色)和5天前(红色)采取干预措施时的流行曲线,把每天现存确诊病例的实际数据被拟合到曲线 (圆圈)上

    然后,考虑湖北省减少隔离措施,公众有一定程度的社会流动,由此假设r=10。预测结果发现有2月18日和3月11日这两个流行高峰,分别有51,581(95%CI 39,874–63,994)和47,144(95%CI 36,305–58,484)例现存确诊病例,最后疫情总规模将达到73,180 (95%CI 51,308–85,839)例。如果把干预措施实施延迟5天,暴露病例比例起初的增加将导致感染病例呈指数增长,流行峰值为2月21日和3月17日。截止4月末,仍可能存在30,000例以上的现存病例,而总病例数预估将会达到166,930例确诊例数。如果提前5天实施干预措施,则疫情将在2月11日达到高峰,现存确诊病例可能达到8,031例,疫情规模上升至15,965例 (图2B)。

 

    广东省和浙江省不是疫情发源地,本研究预计广东省和浙江省均在2月20日达到流行高峰,分别为1,202(95%CI 1,042–1,340)例和1,172(95%CI 1,004–1,314)例现存确诊病例,且预计两省的疫情将在4月中旬趋于平缓。广东省和浙江省疫情最终规模预估分别达到1,511(95%CI 1,097–1,948)例和1,491(95%CI 1,066–1,851)例确诊例数。如果政府延迟5天实施干预措施,广东省和浙江省预计分别在2月26日和25日达到高峰,现存确诊病例可能分别达到3,553例和3,522例,两个省疫情的最终规模可能均为10,061例确诊病例。如果政府提前5天实行干预,疫情将得到有效控制(图2C和D)。

 

    二、全国疫情模型

 

    1月23日实施控制措施后,COVID-19传染几率降低。一定数量易感人群的存在使平均每日新感染人数稳定增加。基于目前干预措施,预计疫情将于2月28日达到高峰,现存确诊病例达到59,764(95%CI 51,979–70,172)例。截至4月底趋于平缓,预计疫情最终规模预估共计122,122(95%CI 89,741–156,794)例。如果延迟5天实施干预措施,由于感染者平均每天接触的次数增加,传染系数(率)将会更大。病例数量呈指数增加,可能在3月4日达到高峰,达到173,372例现存确诊病例,疫情最终规模预估为351,874例确诊病例。如提前5天实施干预措施,全国疫情最终规模可能减少至40,991例确诊病例  (图2E)。

 

    三、LSTM对中国疫情的预测

 

    LSTM模型是一种递归神经网络(RNN),本研究基于2003年SARS流行病学数据,纳入COVID-19流行病学参数例如传染概率、传染系数(率)、潜伏率和退出率等进行模型训练。根据 LSTM模型预测,新增病例在2月4日达到高峰,到4月底预估有9.5万例确诊病例(图3A)。随后,我们对来自SEIR、LSTM以及中国每日新增病例数报告的数据绘制曲线。在1月22日至2月10日之间,新确诊病例实际数量与LSTM预测数据的曲线之间显著拟合(图3B)。SEIR和LSTM模型均预测在2月4日到7日之间会出现每日新增病例高峰,达到4000例。SEIR模型还预测2月中下旬的每日新增病例可能有几个新的小感染高峰出现,这可能是返程人口流动及复工导致的。

 


    图3. (A)LSTM预测的全国COVID-19病例累计数量,(B)根据实际数据(紫色)、SEIR模型(橙色)和LSTM模型(绿色)计算的COVID-19新增病例数

 

讨论

 

    为了应对1月15日开始暴发的COVID-19疫情,中国宣布启动一级应急响应(最高级别公共卫生响应),在全国范围内实施了管控措施。除了封锁武汉及其他邻近地区以外,还要求必须严格报告往返湖北省的情况。同时,不鼓励湖北居民返回工作地,而且即便是经过武汉的非湖北居民,也被要求进行14天的自我隔离。然而,武汉封城的有效性和必要性受到了质疑,还有报道称这样的做法是否太晚[13-14]。Wu等学者预测如果不采取控制措施,武汉的疫情规模将在1月25日达到17.5万例,疫情将在4月达到高峰[13]。同样,Read等人预测,在没有控制措施的情况下,将在2月4日达到高峰,高达19万例[14]。值得注意的是,他们预测到在武汉大规模封城的情况下,中国其他城市也仍将经历与武汉相似的疫情增长。然而,事实并非如此。广东和浙江是受影响仅次于湖北的两个省份,仅占全国PCR确诊病例的6.6%。与武汉相比,这两个省控制措施出台相对较快。因此,相比于湖北,该两省疫情增长放缓,说明了隔离和管控措施是有效的。本模型同样预测,延后5天执行控制措施将使疫情规模增加至3倍。

 

    自本文分析以后,真实流行趋势已证实与本研究预测曲线相吻合。在上周,广东省和浙江省已报道每天的新增病例少于6例,而湖北的新增病例也同样呈现下降的趋势。对于广东省和浙江省,移动人口已经逐渐开始返程(由于依然存在限制,因此与前几年返程相比,迁移率会相对较低),从而引发了潜在病例进入的担忧。目前只有湖北省依然有大量病例,其他省份迁移人口可能不会构成重大风险。广东省和浙江省实行持续的早期发现与随后进行的隔离措施对于防止第二次流行高峰的出现是很有效的。

 

    本研究强调的另一个关键点是放缓湖北省的检疫限制将导致新的易感人群涌入,即春节后返程人员,将导致湖北省的疫情在3月11日左右出现另一个小高峰。大量资源应被运至湖北省来建设新的医院和检疫中心,以改善医疗护理及减少暴露风险。以上所有的措施都可能减少传播,并有助于缓和二次高峰出现的影响。

 

    COVID-19的暴发引发了对人口密集城市公共卫生流行病控制的重大挑战:决定何时实施控制措施。目前需要市或省疾控中心的阳性检测结果以确诊病例,这一过程至少需要30小时[15]。2月12日,湖北政府将根据影像学检查、中性粒细胞计数和流行病学关联等归为临床诊断病例,使得一夜之间增加了1.6万例病例。但除了湖北省以外,其他省份都没有采用这一分类方法,致使全国COVID-19确诊病例数出现了混淆。尽管有人可能认为临床诊断病例并不完全准确,但目前的PCR诊断方法也同样存在不足[15]。直到有更进一步确诊的方法之前,如血清阳性率流行数据可用于评估真实发病率,本研究可以预见的是,基于PCR确诊的流行曲线可能被低估。

 

    图3中的结果强调了我们研究中使用的两种方法的优点和弱点。基于早期的估测,本SEIR模型使用了7天的潜伏期[2]。到目前,有报道证明潜伏期到症状发作的中位时间是3天[11],此病毒的潜伏期更接近于SARS-CoV的潜伏期,但可以从0到24天不等。我们测试了该模型对不同潜伏期的敏感性,发现较短的潜伏期会加速疫情高峰,但不会对疫情规模大小产生显著影响。这可能解释了真实曲线和LSTM预测曲线之间的显著拟合,以及SEIR模型预测高峰滞后性问题。遗憾的是,用于机器学习的SARS流行病数据是来自2003年4月至6月,对于长期的预测来说这是个有限的数据库。

 

    本模型也没有考虑到其他可能增加确诊病例数的因素,如诊断能力。武汉市政府最近宣布了一项政策,要求对每一位疑似人员和返工人员进行测试[16]。如果武汉市政府能够提高检测能力,尽量控制返回人员的流入量,但结果仍可能出现一个连续的高峰甚至第二个高峰。本研究的另一个局限性是我们无法考虑季节的影响。季节改变带来的气温升高对于广东非典疫情的消失很重要[17]。如果气温变化也适用于COVID-19,那么广东的疫情将比浙江和湖北消失得更早。

 

结论

 

    本SEIR优化模型可精准预测新冠病毒的流行趋势,同时,人工智能预测模型已成功建立并且显示与SEIR模型相似的趋势,证实了1月23日起实施的公共卫生干预措施有效控制了疫情发展。严格的防控措施如“早期筛查”最好实施至2020年4月底。

 

致谢

 

    我们感谢横琴鲸准智慧医疗科技有限公司的成于伽、纪冰怡和许碧峰的技术支持。

 


表1.  本研究预测结果总结

 


    a假设湖北省仍然严格管控,没有返程高峰b假设湖北省减少管控,有返程高峰

 
    注:如需了解英文原文,请扫描下方二维码获取(英文附文章补充方法的说明)。

 

扫描二维码即可阅读英文原文