参会总结——AI助力疫情攻关

标签:无 1752人阅读 评论(0)
分类:

参会总结——AI助力疫情攻关

2020年3月29日,第13期“AI未来说·青年学术论坛”AI助力疫情攻关线上专场论坛以“线上平台直播+微信社群图文直播”形式举行。论坛邀请了清华大学电子工程系副系主任、长聘教授、博士生导师、清华大学精准医学研究院临床大数据中心共同主任吴及教授,北京大学软件工程国家工程研究中心副主任、教授、博士生导师王亚沙教授,百度人工智能技术委员会主席黄际洲博士,百度地图出行业务部主任架构师张传明博士作为嘉宾。相关PPT已放置在钉钉共享文档中,有兴趣可以去钉盘:/共享空间/参会报告/20200329-AI未来说疫情专场/ 目录下查看详情。


清华大学吴及——信息助力新冠防控

作者简介:吴及,清华大学电子工程系副系主任、长聘教授、博士生导师;清华大学精准医学研究院临床大数据中心共同主任。1996年和2001年在清华大学电子工程系获得工学学士和博士学位,2013年至2015年在美国佐治亚理工学院担任访问学者。主要从事人工智能,机器学习,自然语言处理,模式识别,数据挖掘等领域的研究工作。从2006年起担任清华-讯飞联合研究中心主任。现在为IEEE高级会员,中国语音产业联盟技术工作组组长,认知智能国家重点实验室学术委员会委员,口腔数字化医疗技术和材料国家工程实验室第二届技术委员会委员,中国计算机学会语音对话与听觉专业组委员,中国医疗保健国际交流促进会常务理事。还担任2018-2022教育部电信类专业教学指导委员会副秘书长,清华大学电子与通信学位分委员会副主任。

报告内容:新冠感染已经发展成为全球性的重大公共卫生事件,新冠防控已经成为全球各国和人民都必须面对的重大挑战。在新冠感染发展和防控的整个过程,医护人员和公共卫生体系当然是中流砥柱,但信息技术也发挥了重要的作用,在这个报告中交流利用信息技术支持新冠防控的工作和体会。

图片 1.png


北京大学王亚沙——新冠肺炎传播预测模型

作者简介:王亚沙,博士、北京大学软件工程国家工程研究中心副主任、教授、博士生导师,中国计算机学会高级会员、普适计算专委会常委、国家大数据标准委员会技术专题组组长。长期从事数据分析、普适计算、城市计算等领域的研究工作,在IEEE IOTJ、IEEETMC、ACMUbicomp、ACM CSCW、AAAI、IJCAI、ICDE等国际高水平学术期刊和会议发表论文百余篇。作为首席科学家承担国家科技重点研发计划项目1项,并承担国家多项自然科学基金、国家863计划、“核高基”重大科技专项课题,取得大数据、智慧城市相关的发明专利十余项。研究成果获国家科技进步二等奖、北京市科技奖二等奖、国家教育部科技进步奖一等奖。

报告内容:首先介绍建立新冠病毒疫情分析预测的意义、数据来源和数据预处理方法,然后介绍报告人及团队建立的多种疫情数据分析方法和疫情预测模型,接下来分湖北、湖北域外地区对模型预测结果进行了对比和讨论,最后探讨了相关方法和模型的可扩展性及其在其它领域的应用潜力。

王教授首先介绍了研发预测模型的意义与作用。第一,模型针对未来不同时段可以揭示疫情的总体发展状况(恶化还是缓解)、到达拐点的时刻,以及未来的感染人数、潜伏期人数、发病期人数、地区疫情走势等关键信息。第二,从模型计算出的参数可以表征不易直接观察的疫情动态参数,帮助我们理解并预测不同时期的疫情特点,比如有效再生数、基本再生数、感染者被医院收治比例等等。第三,模型能够预测不同措施对疫情发展的影响:不同时期的措施对模型参数的影响不同,会直接在指标的发展曲线上反映。以上等等功能都可以辅助公共卫生、应急、疾控等部门和其他相关决策者制定疫情防控策略,比如落实在具体时间地点上的医疗投入、是否限制流动、对个人采取的防护建议、复工复学的可能性。总而言之,通过研发大数据预测模型希望对疫情防控这件事情做到有的放矢、未雨绸缪。

除此之外对数据进行平滑处理。 2月12日国家卫健委发布新版指南,湖北省新增“临床诊断病例”分类,这些人用核酸试纸测试是阴性,但是临床通过CT片子判断有明显症状,为了做到应收净收而增加了临床诊断这一类病例。因为以前没有这个分类,现在增加这样一个分类导致2月12日湖北省报出来确诊病例骤增为14000多人,其中13000多人是标准变化带来的新增,而且不是12日那一天产生的,是之前累计产生的。团队参考终南山院士论文说治疗时间中位数是12天的研究结论,把13000多人按照过去12天确诊人数比例分摊。这就是数据平滑处理。否则直接拿数据跑模型很难跑出正确的结果。

王教授团队考虑的第一类模型是从数据出发的模型,包括自回归和机器学习(深度学习)两种。自回归模型把数据看成一个时间序列,横轴是时间,纵轴是一个观测变量,即疫情相关数据如新增确诊病例。自回归会用一条曲线拟合观测变量的点得到一条发展曲线。简单的自回归模型将所有数据划分为同一个时间窗口,但它不符合新冠疫情模型,因为政府在不同时间段采取的措施是不同的;比如武汉封城之前如果认为新增病例符合某一个模型的话,封城以后数据就跟封城之前不应该是同一个模型,因为一些基本参数变化了。不同时间窗口对应不同的曲线,所以需要对数据划分成若干时间窗口分别拟合。时间窗口要通过模型自适应地选取,而不是人为划分。这里引入了差分整合移动平均自回归模型ARIMA解决问题。 另一个模型是基于时间序列的LSTM。LSTM的表达能力更强,可以考虑到不同变量间的耦合关系,而采用自回归模型时,每一个变量独自建模,变量之间是相互独立的。

第一类模型这是从数据本身观察预测,比较简单易于实施,对近期预测效果尚可,但长期预测性能显著下降,并且只能给出变量预测结果,并不能够揭示疫情发展更深层次的规律。

图片 1.png

图片 1.png

图片 1.png

第二类模型是融合传染病动力学的模型,因为如果没有把领域特定知识用到估计中来,肯定不能把估计做得特别好。所以团队做了一个模型基于可获得的疫情数据,对C-SIER传播模型进行了定制。模型把人生活环境分成两类,一类是未隔离环境,这个环境里人和人可以传染,另一类是隔离环境,比如方舱医院。除此以外还有死亡人群、恢复人群,这两类人都没有传染性,不把他们放到任何一个环境里。

图片 1.png

图片 1.png

图片 1.png


百度黄际洲——时空大数据与AI助力抗击疫情:百度地图的实践与思考

作者简介:黄际洲,博士,现任百度人工智能技术委员会主席,多年来一直从事自然语言处理、知识图谱等人工智能相关研究工作。2010年加入百度,先后担任阿拉丁、图片搜索、搜索推荐、信息流推荐、百度地图等产品的研发架构师,通过持续的技术创新突破,为百度产品的进步做出了突出贡献。截至2019年底,黄际洲共获得中国和国际已授权发明专利五十余项,发表高水平论文十余篇,获省部级科技进步一等奖一项。

报告内容:黄际洲博士介绍了时空大数据和AI技术在本次疫情中发挥的作用。首先,黄际洲博士介绍了百度迁徙平台,该平台能够将城市人口迁徙数据进行智能化处理和可视化展现,提供每日全国各省市人口迁入迁出规模、趋势、出行强度等数据。之后,黄际洲博士介绍道,百度地图在疫情期间上线了疫情小区专题地图、发热门诊地图、复工地图、抗疫特别版语音包、疫情期间出行管控消息速报页面、境外出行防疫指南专题页、跨省市申报登记服务、目的地人群趋势查询等服务,方便用户快速找到城市和周边社区的疫情信息、出行信息和复工信息。在介绍完这些服务后,黄际洲博士解释了百度地图团队是如何利用AI技术实现这些功能的,例如利用智能电话实现千万商户的信息核实、利用AI技术“个性化语音合成”在短时间内自动合成语音包等。


百度张传明——疫情下的“活”导航是如何炼成的

张传明博士介绍了疫情期间百度地图的导航功能。首先,他介绍了导航相关的基础知识。他表示,导航实现的流程包括(1)数据生产出路网;(2)数据加载到内存里形成权值图;(3)进行搜索产生侯选路线并加以排序;(4)基于语音、图像等交互方式进行用户引导。其次,他还具体介绍了影响路线好坏的要素,包括实时路况、ETA(起点到终点需要的时长)、路况预测等。之后,张传明博士又介绍了疫情中突发问题的解决方案,包括收费站出现异常排队时间、高速路口封停等。例如,针对突发封路,百度提供了三种解决方案:一是利用百度地图采集车;二是依靠用户、交警的反馈;三是进行轨迹挖掘。最后,张传明博士从工程架构层面讨论了如何设计可靠的架构以支撑节假日特殊的流量波动问题。


总结

下午的四个报告中,印象最深刻的是王教授的报告。可以看出,在解决一个实际问题的时候,开始的预想模型可能跟最终的结果有较大的差异,随着实验结果,慢慢调整就可以。从实际问题出发,能够逐渐使用已有的知识加以应用。

查看评论

暂无评论

发表评论
  • 评论内容:
      
首页
团队介绍
发展历史
组织结构
MESA大事记
新闻中心
通知
组内动态
科研成果
专利
论文
项目
获奖
软著
人才培养
MESA毕业生
MESA在读生
MESA员工
招贤纳士
走进MESA
学长分享
招聘通知
招生宣传
知识库
文章
地址:北京市朝阳区华严北里甲22号楼五层 | 邮编:100029
邮箱:nelist@iie.ac.cn
京ICP备15019404号-1