利用AI探索生物世界
Nigel Whittle, Pleftek医疗主管 研究人工智能如何为新药法注入新光
人工智能快速变化并影响许多不同的医疗部门,帮助解决多年来挑战专家的问题确定蛋白质形状被称为'蛋白折问题'在过去50年中击败了生物界中一些最优秀思想
自1953年发现双重危险DNA结构及其编码遗传信息作用以来,遗传学像科学一样爆炸并驱动生物技术产业的快速发展,并使用基因组学作为强健的健康信息源脱氧核糖核酸序列编译并最终转换成线性序列,即蛋白质构件
Proteins几乎参与生物体内每一项重要活动,从消除入侵病原体,消化食物和建筑结构,如肌肉纤维或毛发,到向细胞提供氧气和担任细胞间送信员Proteins可直接从结构中承载大数组不同函数。尽管它们由一串氨基酸组成,但并非单维,而归为三维复杂形状有20种不同类型的氨基酸,每种都具有特定化学特性,蛋白质大小从数万到数万不等,折式蛋白可以显示各种化学和功能特征理解蛋白质分解方式和形状以提供精密功能特性对理解生物机机机功能至关重要
蛋白质叠加问题
蛋白通过线性结构几乎完全定义,但完全无法预测蛋白折叠的形状。 1972年诺贝尔奖得主克里斯蒂安芬森预测总有一天有可能确定蛋白三维形状完全以线性序列为基础。 近50年来,这个问题一直是生物学家的一大挑战。
问题在于蛋白质从理论上可折叠成约10300异形, 并需要极长时间对蛋白分子采样每一异形空间假设蛋白质归并正确整齐化,逐块阻塞,但似乎并非如此,展开式蛋白几乎总能归并正确折叠状态在许多情况下,在蛋白质中可辨别出特殊结构,如构成二级构件和对最终结构有帮助的表和表
关键问题仍然存在在所有可能的配置中, 每种蛋白自发折成一个特殊形状, 并允许它执行它特有的生物角色?3D结构对蛋白质十分重要,因此任何将蛋白质合理开发为治疗方法的尝试往往会受这一问题的阻碍。
AlphaFold
质素结构预测临界评估组织者每年举办一次竞赛,以确定确定蛋白折叠的最有效AI系统竞争直截了当:竞争者获得线性氨基酸序列100蛋白并需要预测结构,比照已知一致性度量
去年新AI系统 AlphaFold由伦敦DeepMind开发,排除所有阻力,成功预测测试蛋白结构宽度约一原子内。 此前,约3500人蛋白的蛋白结构曾用实验技术如X射线晶体学和NMR费解析多亏了 AlphaFold 3D结构 几乎所有2万种蛋白
AI AlphaFold
变换器网络架构自Google脑于2017年推出以来广泛用于机器学习系统AlphaFold开发团队创建新式变压器,专为三维结构工作设计简单化说,折叠蛋白可视觉化为“空间图 ” 内有氨基酸结点和边缘相联组件近处。 AlphaFold试图解释图结构,同时用虚拟图推理图构建模型结构通过递归假设实现信息流最大化,这些假设对蛋白质底层物理结构产生越来越精确预测,并可在数日内判定高精度结构
有一些潜在的缺陷AlphaFold接受公开已知蛋白结构数据集培训后,可能无法准确预测异常新蛋白的形状当然,它不显示机制或规则 蛋白折叠问题 从学术角度考虑解决
未来
DeepMind计划释放结构 几乎每一种蛋白 基因序列为科学所知 超过一亿AI对结构生物学的贡献, 最重要的是对创新药设计的贡献 已经开始Plextek正期望通过精练开发机器学习和AI系统来发挥我们的作用,这些系统使用计算过程提高性能和实用性随时间推移