蛋白质基础理论及应用方法(国内首个蛋白质工作台)

近日,生物科技团队天壤 XLab 正式上线了国内首个蛋白质设计工作台,免费开放给国内科研院校和机构。用户无需编写任何代码即可进行蛋白质预测和设计等各项任务,并对计算结果进行可视化展示和分析。

AI 不断在生物计算领域爆发巨大潜力,各方向的研究成果层出不穷,一条围绕计算生物学的新赛道正在形成,可预见的是,能够集成生物计算核心能力的平台型公司将赋能下游生物应用,加速整个行业成熟与发展。

蛋白质设计领域的「EDA 软件」

蛋白质是生命活动的直接执行者,其结构与功能由氨基酸序列所决定。如果有一款高效易用的蛋白质工作台,能够从头设计目标功能蛋白质,并完成其结构和特性的分析等全流程任务,就可以广泛应用于生命科学研究的方方面面。

这是天壤 XLab 打造 xCREATOR 蛋白质工作台的初衷,背后也包含了布局生物计算平台商业化的战略思考。

天壤 XLab 是国内最早实现近原子级精度预测蛋白质结构的创新企业,在蛋白质结构预测、蛋白质设计、复合体预测等方面实现了诸多突破。本次工作台的上线旨在打造一款国产 AI 蛋白质设计的「EDA 软件」,围绕通用蛋白质预测和设计工作,为生物科技产业转化和落地服务。

2021 年,美国华盛顿大学 David Baker 团队凭借已知结构天然蛋白质片段组装和能量最小化的 Rosetta 蛋白质设计方法,获得素有 “科学界奥斯卡” 之称的 “生命科学突破奖”。

此次天壤发布的蛋白质工作台 xCREATOR,基于自研 TRDesign 蛋白质设计技术,能够设计不受已知天然蛋白质限制的任意蛋白质,这一全新的创造方式将为生物计算时代的科研工作带来极大便利。

无论是降解塑料或可持续生物燃料的开发,还是应用于疫苗、抗体药物、肿瘤疾病疗法的开发,高耗时、高成本、高人力的生物学研究,将获得 AI 生物计算平台的极大赋能甚至最终完全被其所取代。

xCREATOR 通过集成世界前沿多样化 AI 算法和强大的计算资源,为大家提供更高效、更便捷、更易用的蛋白质结构预测与设计服务。借助工作台,使用者几分钟内就可以获得接近实验解析精度的蛋白质结构,在过去这个时间可能是数个月甚至数年,并且得借助造价昂贵的专业器械。这将极大地帮助科研人员从繁琐的工程和实验中解放出来,投入到更有意义的生物创新与研究中去。

系统级应用降低科研人员技术门槛

AI 时代下的蛋白质设计计算和优化是非常复杂的流程,常常涉及几种甚至几十种算法应用,这背后不但需要大量算力,更需要研究人员在人工智能、计算生物学、计算化学、结构生物学等多个学科领域的技术与经验积累。算力需求大、技术门槛高和流程复杂等困难常常阻碍了大量研究者进行更深入的蛋白质研究。

蛋白质基础理论及应用方法(国内首个蛋白质工作台)(1)

天壤 xCREATOR 为蛋白质研究者提供的是系统级平台,一站式解决算法、数据、算力以及科研流程复杂等所有难题,通过简单的操作,就能完成结构预测、蛋白质设计、特性分析和优化等各项任务,适用于多肽、酶、抗体和各类功能蛋白质,使用时无需安装软件,在线登陆账号就能启用核心功能。

以蛋白质结构预测为例,平台可提供多种解决方案。其中自研最新的 TRFold-Single 核心算法,可以让用户直接从单序列生成预测结构,该算法在对 “de novo 86 测试集” 进行预测评测时,平均分达 86.2,优于 AlphaFold2 的 82.6 分。

工作台专为科研工作者开发,轻便、简易、零门槛,无需重复安装各类算法工具,也不必担心没有足够的计算资源来承担庞大的生物计算规模,在可视化的工作平台上,无需撰写代码,使用简单的操作逻辑即可自由运行各类蛋白质任务。

项目式管理提升研发效率

不同于研发人员过往使用过的算法工具箱式平台,xCREATOR 工作台更关注蛋白质任务流程的设计和优化,研发人员能以项目管理的方式自由的对原本零散的各项任务进行分类、串联、整合和管理,在工作台上从项目规划、实施、计算、分析,一站式全流程地完成他的研发工作,有效赋能项目推进和管理。

在执行设计任务时,仅需四步操作,就可以端到端完成蛋白设计任务。用户只需要添加设计目标的蛋白质功能 motif 信息,启动任务计划,在任务计算结束后就可以查看设计结果及各项分析数据,并选取最适合的候选蛋白质进行下一步优化。

“我们希望蛋白质工作台能成为科学家们的研发 ‘利器’,可以像玩乐高一样对蛋白质任务进行分类和重组,达到各种各样的研究目的。点击一个 ‘按钮’,你就可以马上预测一个蛋白质结构或者设计一个全新的蛋白质,这将大大提升大家的科研效率” 天壤 XLab 负责人苗洪江博士介绍。

强大算力支持速度提升百倍

除此以外,xCREATOR 最大的优点是速度非常快。由于蛋白质序列长度往往从数百到数千个氨基酸不等,可折叠空间巨大、计算复杂度极高,这对计算资源的挑战巨大。xCREATOR 平台支持弹性调度算法,且自研核心算法具备大规模分布式计算能力,能够发挥计算资源的最大价值。

尤其在预测任务方面性能更优,无需 MSA 的 TRFold-single 平均耗时 25 秒即可完成蛋白质单链结构预测,包含 MSA 搜索的 TRFold 预测耗时约 10 分钟,实现预测速度和精度的最优组合,相较于传统实验方式速度提升百倍。

另外平台还可以实现复合体的结构预测与分析,其核心算法使用空间采样的增强方式增加训练数据多样性,启发式地搜索解决多链错配和蛋白质手性问题。通过分子动力学力场优化结合表面原子结构,获得准确的蛋白质相互作用信息,去绘制细胞内蛋白质相互作用通路图。

AI for Science 加速释放研究价值

蛋白质世界的空间巨大、功能丰富,100 氨基酸的蛋白质可能序列是 20^100 ~ 1.3×10^130,而目前人类仅探索了其中源于自然进化的极小一部分。未知空间中还有很多可能解决医疗健康、能源环保等挑战的功能蛋白质没有被触及。

据了解,国外公司专注于从头设计新型蛋白质的公司 Generate Biomedicines 已经创造了超过一百万种在自然界中从未存在过的蛋白质,并对其中一些进行了测试。该公司还计划湿实验室和冷冻电镜平台,以确定其创造的蛋白质的结构和功能。

“人类今天已经有了足够的 AI 工具去探索微观世界,我们希望通过打造算法、算力、数据融合的大型装置,让更多的人加入进来研究更具有挑战的科学问题,帮助人类看清更大的蛋白质世界。” 天壤创始人、首席执行官薛贵荣博士表示。

基于在蛋白质领域的积淀,天壤 xCREATOR 平台目前已上线 TRFold-Single 单链结构预测(无 MSA)、TRComplex 复合体结构预测、TRDesign 等多项算法,供大家免费体验试用。

后续将逐步开放蛋白质特性分析、蛋白质知识图谱、功能 motif 数据库、蛋白质表达水平预测、抗体从头设计等功能。

当越来越多人借助工作台进行蛋白质的计算和优化时,将为行业带来颠覆性改变,科学家们能够专注科研,以更少时间、高小成本进行生产出更多元的功能性蛋白。

“我们的平台不仅支持个人用户自由进行各类蛋白质任务,还可以与团队协作共享研发成果,满足靶点发现、蛋白质设计、药物研发等各类更贴近场景的任务。希望通过平台挖掘生物、化工、农业、能源等下游领域更多需求,也欢迎更多企业用户在我们平台进行试用,我们将为特定的需求任务定制设计方案,从计算生物学的角度帮他们解决实际产业问题。” 苗洪江博士介绍。

未来会有越来越多的团队、企业、高校利用软件平台等新技术手段进行计算机模拟和研究实验,从底层更理性科学的角度理解蛋白质和生命。期待科学家们将为长期以来医药、能源、化学、农业等技术方面的挑战找到解决方案,从而推动更高效率的药物研发、材料开发等过程,促进生物科技领域产业转化落地和发展。

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。