博客1

先知模型的Covid-19案例预测分析

在脸书上分享
分享到Twitter
分享LinkedIn.
分享在whatsapp上

抽象的

目前,整个世界正在争夺最威胁的疾病(Covid-19),该疾病最早在中国城市武汉报道。由于爆发开始感染中国以外的大量人民,由于积极案件和死亡的持续增长,宣称这是流行的。科学家们在开发一种疫苗方面致力于保护数百万个致死病毒的疫苗。许多国家正在以不同的方式试图打击这种病毒感染。印度从25次强制一个全国严格的锁定3月2020 2020遏制病毒的传播。

在本博客中,采取了三个印度国家(Kerala,Maharashtra&Tamil Nadu)的冠状病毒数据和谷歌移动数据,以了解Covid-19期间锁定和公共运动的影响以及有效预防策略的结果,有助于推翻预测结果。通过利用Google Mobility数据在确认的情况数据的数量下,上半年博客的分析包括对印度三个州的三个州的锁定与电晕感染。下半场讨论了使用Facebook的先知算法来了解Covid-19案例的数量和广泛死亡人数的预测模型。

https://s3.amazonaws.com/user-media.venngage.com/6676193-0b47c4c63d39fcb3dd5afe247aaa0ec1b.jpg.

Covid-19在印度的情况是什么?

截至2020年5月20日,在第一次确认案件于2012年1月30日在喀拉拉在喀拉拉邦记录了超过1万左右的Covid-19案件。从印度占总案件的一半以上,这是明显的来自前四个州 - 马哈拉施特拉,古吉拉特邦,泰米尔纳德邦和德里。虽然喀拉拉邦是印度的第一个受影响国家,但国家在5月的第三周中注册了大约560个案例,远远低于受影响的国家。

印度政府下令全国锁定21天,因为确认案件的数量约为500.在此阶段,该国观察了感染生长速度的逐步减少。但是,正如我们从图中看到的那样,当人们开始走出房子时,案件开始飙升,并且对社会疏散措施并不谨慎。在锁定的第二阶段和第三阶段,整个国家的归类为红色,橙色和绿色区域,具体取决于病毒的传播。由于基本零售商店,私人办公室重新开放,提升了间间旅行限制,无论锁定均依然有效,案件都在迅速增加。

锁定vs corona在tamilnadu

第一个案件于3月7日在泰米尔纳德邦报道。在锁定期间锁定的前一天飙升的公共运动飙升并彻底浸润。在第一次锁定期间,只允许医疗商店和杂货店运作。然而,当人们开始退出基本物品并前往家乡时,案件开始上升。在20世纪4月26日至29日,为前五名红划区(Chennai,Coimbatore,Tiruppur,Salem&Madurai)施加了一个剧烈的锁定,施加了四天至292020年。由于关于激烈的锁定的短期通知,公众飙升,因为无论锁定仍然在哪个情况下,在哪个情况下不断增加。

Maharashtra的锁定VS Corona

Maharashtra于2020年3月9日注册了第一个确认的案件。Maharashtra每次都记录了全国每次确认案件的最严峻一天增加。类似于在泰米尔纳德邦观察到的数量的UPS和下降,在锁定开始前一天在公共运动中存在飙升,然后在公共运动中急剧下降。自孟买以来,浦那以来,众所周知,这三个地方都是马哈拉施特拉的受影响高度影响的地区。

锁定与科伦纳在喀拉拉邦

喀拉拉邦在1月份注册三种案件后宣布了国家灾难。新案件未在国家报告一个月,因此撤回了紧急情况。不幸的是,喀拉拉邦开始于2020年3月9日开始报道新的积极案例。与泰米尔纳德邦和马哈拉施特拉类似,只要宣布锁定日期,就会在公共运动中瞬间推进。在印度政府锁定21天之前,州政府下令完全锁定,直到3月底。因此,在杂货和药房连锁店再次在2020年3月23日再次观察到公共运动中的飙升。作为锁模的第1阶段,喀拉拉邦记录在350左右。喀拉拉邦的卫生部设计了有效的接触追踪,并将细节与国家卫生委员会坚持而抵消了28天而不是14天。因此,这种状态能够在第二次锁定结束基本上降低感染的生长速率。

使用Facebook先知初步时间序列预测

时间序列预测是基于先前观察到的数据来预测未来值的有效方法。最常用的时间序列预测模型是线性回归,指数平滑和自动回归综合移动平均线(Arima)。虽然线性回归和指数平滑技术可以处理多个时间序列组件,但这些型号在处理异常值时敏感,并且具有狭窄的置信区间。Arima模型将自动增加和移动平均技术与现实的置信区间结合起来。但这种模型需要大量的数据,以预测未来的值。

先知算法由Facebook AI团队开发和开放,用于时间序列预测/预测分析。先知与添加剂回归模型的基本原则合作。先知模型在调整参数方面是灵活的,并且具有标准配置准确。它已知非常好处理异常值。它专门用于每小时,每日和每周观察的预测,只有几个月的历史。先知模型后面的数学逻辑包括一种可分解​​的时间序列模型,具有三个主要组成部分即趋势,季节性和假期以及作为第四个附加组件的噪声/错误。随着添加剂回归原理,先知适用于作为组件的线性和非线性函数。

使用Facebook先知预测VS实际确认案例

使用Facebook先知预测对实际死亡案例

在本博客中,先知模型用于预测印度这三个州的确认案件和死亡案件的数量。包含确认案例和死单数量的输入数据集存储到单独的Python数据帧对象中。然后,这些数据帧对象以具有两个列的“DS”的方式格式化,该列为“DS”,其保持日期列和“Y”保持要预测的值。在将数据帧拟合到模型中,建立一个新的数据帧,用于通过在“make_future_dataframe”方法中设置未来的时间段来预测未来数据。在这里,预测确认和死亡病例的未来时期设定为14天。间隔的宽度设定为0.99。预测值设置在这些数据帧的每一行中,这些输出值表示为“yhat”,在较低('yhat_lower')和上部('yhat_upper')置信区间。尽管平均值可能类似,但是可以通过增加通过调整间隔宽度来实现的置信区间来改变变化。最后,使用绘图地展示实际和预测值来创建交互式图。

如从上述图表所观察到的,通过泰米尔纳德邦和马哈拉施特拉的实际价值对准,先知模型的预测值与泰米尔纳岛和马哈拉施特的实际值对齐。尽管先知模型预测了与喀拉拉邦的确认和死亡病例的实际值相比的更多数字,但喀拉拉邦政府能够击败预测值,并由于其严格的遏制策略而降低了感染和死亡的传播。

结论

在这篇博客中,锁定曲线锁定的效果已被捕获泰米尔纳德邦,马哈拉施特拉和喀拉拉邦。由于通过测试和跟踪模型优先考虑早期检测,与其他国家相比,喀拉拉邦成功地含有病毒。其他州还必须遵循喀拉拉邦的脚步,这取得了在确认的病例和死亡案件中推翻了预测值,如本博客所强调的。必须在举行限制的情况下,在不影响卫生基础设施的情况下举行限制之前,必须制定分阶段的有效退出策略。此外,必须练习社会偏移来打破传输链。

参考

从卡格Covid数据存储库下载了Coronavirus案例数据。移动数据从Google的移动数据存储库(Google LLC“下载谷歌Covid-19社区移动性报告“ - 访问:<21-05-2020>)。使用Python和Google Colab开发了数据探索和图形绘图。Facebook的先知包用于建模。