疫情传染概率_第四范式联合周志华团队等搭建新冠病毒自学习模拟器:较传染病预测模型误差降低90% | AI战疫

日益成熟的人工智能正在成为一个特殊的“逆行”群体,在抗击新皇冠肺炎疫情的战线上。

已经出现了人工智能技术和解决方案的身影,并取得了切实的成效,无论是加快早期疫情科学研究,辅助一线疫情诊断和治疗,现场防控,还是搭建后台信息平台。

机器之心特别设立了“人工智能战争疫情专题报道”,跟踪人工智能技术在防疫现场应用的最新进展和效果,重点报道人工智能工作者的英勇防疫故事。

今天是系列文章的第六篇,“第四范式加入周志华团队和其他人构建一个新的皇冠病毒自学习模拟器:流行病预测模型误差减少90% |人工智能流行病”

"流,收敛,连续流,连续收敛...在广阔的中国,北方和南方的城市相距数千英里,病毒的传播可能只有在飞行几个小时后

纪录片《非典十年牺牲》描述了当时非典病毒的传播。17年后,病毒改变了它的组织,同样的伎俩以威胁的力量重复着。

“打赢防疫战”,一个响亮的口号,频频出现在头版头条,但这种新的皇冠病毒却以一种不为人知的迅猛势头,在人类的引领下,开始了燎原之势。为了赢得胜利,我们必须找到更准确、更有效的武器。

你看,一群掌握机器学习和大数据“武器”的技术团队已经悄悄走上舞台,为惊慌失措的人类打开了“上帝的视角”,在几十个昼夜里描绘出各种潜在威胁的可能性,巧妙地避免了与病毒的正面交锋。

经过这场战斗,疾病控制系统的数字化和智能化价值已经显现,随之而来的相应改革和升级也势在必行。

写作|薛范,4月

编辑| 4月

当对现实世界中新冠状病毒的多维数据进行深度挖掘时,它们被不断地输入到一个自洽的、自给自足的机器学习平台中,从而构建并形成一套模仿现实世界运行机制的“双系统”。

人类在模拟数字世界中使用屏幕前的鼠标和键盘集中攻击病毒:跟踪感染路径,筛选易感人群,推断疫情发展...人工智能充分展示了每一步。

疫情传染概率

基于机器自学习的传染病疫情演变预测系统示意图

是小天狗“天地无极,万里跟踪”的筛选和跟踪功能。它在微观人群流中定位潜在的传染源和高风险人群(携带新的冠状病毒而不知道)。

也是《模拟人生》中的真实世界模拟器。它充分考虑了各种意外因素(交通管制/返回工作时间/毒品设施等)。)在复杂环境下,在模拟器上修改相关变量,进而推导出流行病狙击手的人工干预最优策略。第四个范式

结合南京大学LAMDA研究所和苏北人民医院组建团队,推出的智能化疫情防控系统就是基于这样一套思路。

-

的首席执行官在除夕接管了“神秘”任务

。在第四范式的微信群中,在屏幕上闪现新年祝福后,一条动员信息突然跳出来,打乱了节奏。

最初,公司被上级推荐加入一个“特殊”项目,由首席执行官戴文渊亲自承担。这个项目与流行病预防和控制有关,起初有点“神秘”

是由公司高级管理层动员的,该项目是为了助长疫情。很快几十个人主动参与进来。

随后,项目负责人屠维维邀请了以周志华教授为首的南京大学南大研究所和苏北人民医院的十多名专家加入项目组。整个系统项目团队有近百人。他们的任务是建立一套基于机器学习技术的精确防控决策支持系统,用于疫情防控。

第四范式,简称第四范式(北京)科技有限公司,是一家人工智能技术和服务提供商,成立于2014年。创始团队来自核心技术团队,如百度风潮推荐系统和今日头条推荐系统。

第四范式擅长构建复杂的机器学习模型平台,并使它们面向业务和产品早在2016年,第四范式就发布了相关产品“第四范式的先知”——一套企业级人工智能PaaS平台,其功能涵盖了人工智能项目从应用开发、运营到管理的整个生命周期

根据IDC发布的《中国机器学习发展平台市场评估》报告IDC 2019年第四范式,阿里、百度、AWS、腾讯、微软等领先企业都在象限内其中,作为人工智能独角兽的第四个范例,它占据了中国市场最大的份额。

22

当机器学习符合流行病学时,

项目组件提供前端和后端部分王伟负责前端。王伟和他的家人今年春节住在北京。他没有离开北京的记录,身体健康。他已经成为疫情下最好的一线候选人。

事实上,他是唯一一个处于项目早期阶段的人。接到任务后,王伟的日常生活是八比八和二比一。

上午8: 00前,王伟需到达北京项目组设立的集中办公室。在测量了体温并确认了身份后,他进入了有序的办公区域,只留下一双专注的眼睛在面罩下盯着电脑屏幕。

199春节期间,疫情仍呈上升趋势。政策监管者的需求各不相同,来自各方的数据蜂拥而至。王伟主要负责收集和整理需求和任务,并有节奏、有条不紊地反馈给后端团队,以确保有限的资源投入到关键领域。

"数据更新频率很快,一般来说,大约一个小时到半天因此,我们的反应速度也需要更快,”王伟说

"下班后,他还得和我们见面。压力相对较大,”首席项目经理屠维伟补充道。聚合宏数据的持续更新在模型的合理设计和后端算法的有效调用中起着关键作用。

如果前端压力主要集中在极短的任务交付期限上,那么后端压力一直存在。与此同时,

的屠维卫也是数十位处于范式后端的科学家的领导者。这主要是通过远程办公的合作,没有严格的固定工作时间点-它通常意味着随时待命,这是常见的模式转移到凌晨2-3点。在

的合作过程中,屠维卫与南京大学LAMDA研究所的詹德川教授、余阳教授以及国家GCP机构办主任郭玉,从早到晚在微信群里一起工作。周志华教授是

"项目的指导老师,他还在整个过程的各个方面为项目团队提供了详细的指导。大多数时候,周先生会和我们沟通,工作到凌晨3点或4点”屠维维介绍道

起初,科学家的想法很简单——让技术产生价值;然而,好的想法在实际应用中并没有产生好的结果。

由于缺乏流行病学的背景知识,科学家团队采用了一套固有的感染系数,并将其应用于不同的地区和不同的场景,但它们与实际数据相差甚远。

随着团队与一线医学专家的深入沟通和讨论,问题逐渐浮出水面。

“感染率实际上受到许多因素的影响,”屠维卫解释说。“例如,飞机的感染率实际上比火车低得多,因为空气是循环的。另一个例子是,在经济发达地区,居民有很强的保护意识,感染率会更低……”

疫情传染概率

飞机在不同座位的感染率(资料来源:国家地理中文网)

在此基础上,该小组取代了以前固有的感染系数,而是构建了一套感染模型,综合考虑了地区、场景、时间等各种实际因素。根据机器学习的结果,该团队进一步寻找医学专家进行验证和优化,并来回往返。

据屠维维介绍,在全国各省建模后,自学习模拟器的误差与改进的传染病模型(SEIR模型)相比平均减少90%,与实际数据吻合较好。

“当前疫情的发展轨迹证实了之前的推断结果,并在一定程度上消除了我们自己对疫情的担忧,”他说。

此外,系统团队将每天定期远程与宏观调控部门的技术人员联系,讨论结果和方法,并优化系统预测值和实际值之间的差距。

“在这个过程中,产品的迭代是以小时计算的——每两三个小时,相关部门会要求更新结果,产品会在3-5天内得到很大的改进。””说到这里,屠维维不知不觉加快了速度

3

战争疫情监测三部曲

追踪、筛查和演绎

如果消灭疫情是一场“抗战”,从防控初期的病毒传播分析到易感人群的准确筛查再到疫情演绎的后期,为了决策者制定政策和支持疫情的发展,有必要做到“快速准确”, 从预测某一地区的感染率到预先协助发布某一省或市的全面预防和控制决策。

因此,这个由人工智能专家和医学专家组成的联合团队从复杂多变的物理世界中挖掘多维数据,并利用机器学习技术构建一个数据驱动的新型皇冠病毒传播数字双生子系统。

这就像一个真实世界的病毒传播模拟器,它可以模拟与流行病相关的各种变量和指标(交通管制/返回时间/药物设施等)。),从而实现准确有效的传染源定位、人群筛查和疫情推断。

本系统依托第四范式的底层人工智能PaaS平台,已应用于疫情升级。在平台的核心算法、功能组件和底层技术(如自动机器学习技术)方面已经有了成熟的经验保障。

根据疫情发展的不同阶段和现场实际需求,系统团队提出了三套应用方案,分别对应于追踪传播路径、筛查高危人群和疫情推断

1,准确防控的第一步:跟踪传播路径

爆发后,对病毒传播路径的分析极为关键。该系统将模拟一组潜在的感染网络,并在网络中找到可能的传播路径,以帮助进行准确的预防和控制。

此外,第四范式还构建了一个可学习的事件回放模拟器,及时发现和恢复潜在的传播路径和模式,帮助防疫部门迅速切断疫情传播,并反馈给病理学相关研究,为研究方向提供帮助。

2精确防控的第二步:筛查高危人群

在防控的关键阶段,核心是寻找潜在的高危人群为此,屠维卫团队建立了一套准确的筛查模型,用人工智能技术丰富了现有的防控筛查规则模型,进一步提高了人群的覆盖率,以及筛查的召回率和准确率。

疫情传染概率

医学专家建议对“ABCD”人群进行分类。甲是指与武汉有过接触的人,乙是指甲在公共场所遇到的所有陌生人,丙是指甲接触过的熟人,丁是指未外出的安全公民。

传统的筛选规则系统是判断一个被确认或被怀疑的人是否同时出现在同一地区,其准确性还有很大的提高空间。

3精确防控的第三步:推断疫情发展并提供宏观决策预测

。对于决策者来说,更迫切的是了解疫情趋势和预测拐点。此外,从宏观决策的角度来看,国家需要准确推断全国的疫情,以减少疫情的蔓延。

同时,许多现实因素干扰了传统的理想化模型,预测疫情不再可行

为此,系统团队采用了高维机器学习技术和多维数据构建了一个更细粒度、更贴近省、市、县实际情况的可学习的数字双生系统。

不同于以前基于人类书写规则的数字结对系统。基于机器学习、高维非梯度优化和其他技术的系统的最大亮点是数据驱动。从数据中学习数字结对系统可以准确预测关键决策一旦实施后的影响,为制定切实有效的预防和控制政策提供重要依据。

"公众经常可以看到限制人群聚集、道路封闭、封闭住宅区等政策。加大预防和控制力度,或改变风向,恢复生产,降低反应机制水平。这个系统可以有效地帮助类似的决策,”屠维维解释道。

据了解,这套解决方案除了为相关部门提供防控支持外,还深入到了地方政府,帮助更多部门提高效率,协助疫情一线决策,协助企业进行微观防控。

接下来,全国人民又进入了再就业和生育的状态,计划也进行了有针对性的功能调整——如何在控制疫情和恢复经济之间找到平衡是关键。例如,再生产和轮班安排的合理性,以及工作区域危险等级的分类等。在

4

疫情之后,我们如何恢复交易?虽然

病毒疏远了我们的物理距离,但它似乎缩小了一些东西,例如我们一起目睹的抵抗,我们一起询问的话题,以及我们一起在疫情下反映的漏洞。从

到现在,我们有充分的理由相信疫情最终会平息,但大病暴露的问题和反思总结才刚刚开始。自

199日冕新流行病爆发以来,疫情防控经历了早期公众怀疑和信任危机。面对一种传染性极强的新型冠状病毒的突然爆发,近一个月的早期防控措施收效甚微。

在屠维卫看来,数据驱动的疾病控制系统今后将在国家乃至全球层面得到进一步完善。在接下来的几年里,在人类和病毒的共生中,这一系列在国家防疫过程中沉淀下来的项目、经验和技术也将发挥更大的作用

经过这场战斗,中国疾病控制系统的数字化和智能化改革势在必行。我们也将拭目以待。

如何使用人工智能来写有成千上万人和面孔的品牌推广文章?如何使用人工智能来分析可以借鉴的热点?在人工智能+营销自动化在线共享的第四阶段,该机器的核心邀请了tezan的联合创始人兼首席运营官王哲分享主题“品牌增长的新动力:用创意数据智能创建“增长的基础设施”3月7日(星期六)14:00

大家都在看

相关专题