心里总有根弦紧绷着,即便复工的步伐迈得更大了些也是如此,因为最担忧的便是疫情会突然杀个回马枪。就在大家伙都盯着每日披露的新增数据,满心提心吊胆之际,哈佛团队带来了个新奇名堂:要用大数据去预测疫情的发作情况,能够提前两周给人一种类似打“预防针”的提示。
数据拼图
这绝不是仅凭一时冲动就冒出来的想法。7月1日那天,哈佛教授Mauricio Santillana带领团队在arXiv上发布了一篇论文,表示研制出了一个预测疫情的全新指标。他们并非采用传统的假设模型,而是将六种实时数据流进行整合分析。团队中还包含来自斯坦福以及马里兰大学的专家,整体阵容相当强大。然而该论文尚未通过同行评审,属于抢先发布的版本,看待时需要格外谨慎。
六路情报
就他们着实看了些什么呢?谷歌之上搜索“发烧该如何处理”的人数有所增多,推特当中吐槽嗓子疼痛的情况变得密集,医生于 UpToDate 平台查询新冠的频率呈现出增高态势——这些通通变成了情报来源。再加之借助手机定位去知晓出行轨迹、智能温度计读数出现异常,接着结合 GLEAM 流行病学模型,总共是六路信号。将这些数据堆叠在一起进行分析,相较于单独去看其中任何一样而言都更为准确。
提前预警
到底这套算法能够提前多长时间去报信呢?数据所呈现出来的是,对于确诊病例出现增加情况的预测,其中位数能够提前十九点五天;针对死亡病例出现增加情况的预测,更是能够提前二十九天。时间窗口被拉得如此之长,充分足以让人有喘口气的时间去做准备。它并非是在算命,而是借助于实时去捕捉人们行为方面的变化,像是有人开始减少外出、搜索症状变得更多,进而反推出疫情的走势。
复工的调节器
对于那些正处于复工进程中的地方而言,这东西宛如空调的温控器一般。Santillana教授进行了一番比方,政策制定者能够依据预警信号,随时随地给防控措施转动旋钮:倘若这周数据处于平稳状态,那就放松一些限制;要是下周指标呈现红色,那就赶快收紧一些。不再采取一刀切的封城或者放开策略,而是依照实时疫情的情况,灵活地进行调整,以此避免二次爆发。
前辈的教训
事实上,运用数据去追踪疫情并非新鲜态势,2008年谷歌曾推出Google Flu,妄图凭借搜索关键词来对流感予以预测,然而因仅仅着眼于单一数据源,出现过诸多乌龙情况,预测时常出现偏差,那次失误使得科学家们变得谨慎起来,单一信源是不可靠的,必须进行多路数据的交叉验证方可,当下的算法正是汲取了教训,将社交媒体、医疗记录、移动轨迹全部纳入其中,从而让预测变得更加全面。
争议与现实
且不说,这套算法果真能够摇身变为疾控中心的新式杀手锏吗?美国疾病控制与预防中心当下仅仅是以社交媒体数据当作参考依据,尚未将其视作核心衡量标准。引发的争议同样不容小觑:数据究竟可不可以映射真实疫情态势呢?构建的模型会不会再次出现失误状况呢?诸般情形统统都要倚靠现实予以检验。然而当下全球每日产出海量数据,疫情仍在持续蔓延,这无疑倒逼着预测技术不断向前迈进。机遇已然摆在眼前,究竟能不能成功把控,就全要仰仗后续的验证结果了。
假设复工阶段确实存有那种提前两周的预告,你会是更从容安心地前去上班,还是会反过来更焦虑不安地紧盯着手机等待警报?前往评论区交流着聊聊,顺便点个赞以便让更多人瞧见这篇剖析。


