机器学习可预测哪些动物病毒有感染人类的风险
科学家开发出新机器学习法,精确预测未来哪些动物病毒会感染人类,仅使用病毒基因组编码的信息
多数新出现的人类传染病是由由其他动物物种生成的“动物病毒”引起的然而,数以百万计的病毒在动物中循环,只有少数病毒有可能感染人类。科学家目前在病毒发现时快速评估动物风险的能力非常有限,这使得难以知道哪些新发现病毒优先用于早期调查,除此之外,哪些病毒应优先用于爆发准备
由格拉斯哥大学牵头并发布于SPLOS生物学的新研究中,研究人员开发出一种新的机器学习法预测哪些病毒完全基于病毒基因组序列病毒会感染人类 — — 常常是科学上唯一知道新发现或特征不良动物病毒的东西。
新的建模方法能够精确预测病毒可能感染人类,只使用病毒基因组序列,并排入低、中、高或高风险级使用同一种模型,而事先完全不知道人类前次SARS暴发,该模型还能够精确预测SARS-COV-2病毒,即引起COVID-19大流行的病毒,及其动物中最亲近的病毒,极有可能感染人类。连同对数百种已知动物学状态病毒的更正式测试显示模型对各种RNA和DNA病毒(即使是那些完全对科学新奇病毒)作出可操作预测
新的建模方法预测病毒是否能够感染人类,但无法判断病毒在症状或流行/广度潜力方面可能有多危险,或何时会跳入人口中。能够感染人类是引起暴发的第一步,但许多其他因素,如水库与人类的接触,病毒能否在人间传播,以及我们对这种“溢出感染”的反应将形成流行病风险
研究人员相信这一新建模方法可以帮助科学家更好地优先研究最有可能成功感染人类的动物病毒,这是未来人类突发准备和规划的重要一步。
mRC-Glasgow大学病毒研究中心主编Nardus Mollentze表示:「对面向野生动物病毒发现程序投资的呼声一直引起争议,发现新描述病毒能力以及如何应对,需要实验室和自然环境的广泛特征化,而这种特征化目前无法跟上病毒发现数 。当病毒首次发现时,我们所具备的往往是基因组序列,因此开发出精确机学习工具,基于信息内所含信息,应使我们更好地了解哪些动物病毒构成最大风险,并因此应先定性和调查
预测还只是第一步需要开发高通量病毒特征化方法 和更多模型 将方法生成的信息转换成更新风险预测
高级作者Daniel Streicker来自MRC-Glasgow中心大学和Glasgow大学生物多样性、动物健康和比较医学学院说 : “在动物感染病毒极多样性下识别高风险病毒不太可能感染人类,这一直是干草堆挑战中的针头问题。以基因组为基础的动物风险新评估代表了解决这一挑战的一步,加上我们早先的努力显示病毒水库宿主和节肢动物矢量可以从病毒基因组预测出来,显示单从基因组序列就能有惊人量的生态洞察力,暗示病毒适应宿主的方式不明
立即,因为这些模型只使用基因序列, 它们在病毒发现时应用, 创建快速廉价分治系统 判定哪些病毒值得格外关注
生物多样性、动物健康和比较医学学院联名作者Simon Babayan说道 : “ 人类中大多数新发传染病是由少数病毒引起的,这些病毒发源于其他动物物种,因此知道在哪里寻找下一个病毒流行,仍是一个巨大的挑战。提供快速低成本方法 帮助证据驱动病毒监控 和病毒特征化
论文“识别并优先处理基因组序列中潜在的人感染病毒”,发表在SPLOS生物学上这项工作由医学研究理事会和Wellcome资助。