新兴的蛋白质设计竞赛旨在从幻想中筛选出功能性。但研究人员希望,真正的收获将是该领域的一场革命。
8 月中旬的一个周六早上,Alex Naka 在女朋友的厨房里开始了他所说的“小黑客马拉松”。在他的笔记本电脑、一些咖啡和大约 80 个基于云的人工智能 (AI) 处理器的支持下,他生成了数十种计算机工程蛋白质,旨在阻断在某些肿瘤中发生突变的细胞受体。
Naka 在工作日是加利福尼亚州阿拉米达一家医疗技术公司的蛋白质工程师,他将他最有前途的十个作品参加了新发起的蛋白质设计比赛,并看着它们爬上排行榜的顶端。
该竞赛由瑞士洛桑一家名为 Adaptyv Bio 的生物技术初创公司举办,是过去一年左右举办的至少五项竞赛之一。大多数参加比赛的人都使用 AI 工具,例如 AlphaFold 和受聊天机器人启发的“蛋白质语言模型”,这些工具在受欢迎程度和力量上都呈爆炸式增长。其中一些工具背后的三位研究人员因其努力而获得了今年的诺贝尔化学奖。这些赞誉部分来自于希望新创造的蛋白质可以作为更有效的药物、工业酶或实验室试剂。
但科学家们说,设计蛋白的繁荣大多播下了混乱的种子。人们生产它们的速度比在实验室中制造和测试它们的速度要快,因此很难判断哪些方法真正有效。
过去,竞赛推动了关键的科学进步,特别是在蛋白质结构预测领域。最新的比赛通过降低进入门槛,吸引了来自世界各地的人们进入蛋白质设计的相关领域。它还可以加快验证和标准制定的步伐,并可能有助于培养社区。“它将推动该领域向前发展并更快地测试方法,”西班牙巴塞罗那基因组调控中心的计算生物学家 Noelia Ferruz Capapey 说。
但科学家们表示,比赛必须克服一些障碍,例如确定要解决的问题以及如何客观地选择获胜者。正确使用公式很重要。德国慕尼黑工业大学(Technical University of Munich)的计算生物学家布克哈德·罗斯特(Burkhard Rost)说,如果执行不当,“这些比赛可能会对场地造成损害”。
通过设计具有竞争力
蛋白质设计竞赛的部分灵感来自一项已有 30 年历史的竞赛,该竞赛帮助拉开了生物人工智能革命的序幕。自 1994 年以来,结构预测的关键评估 (CASP) 一直在挑战科学家,他们需要根据蛋白质的氨基酸序列预测蛋白质的 3D 形状。该竞赛由马里兰大学罗克维尔分校(University of Maryland in Rockville)的计算生物学家约翰·莫尔特(John Moult)和加州大学戴维斯分校(University of California, Davis)的计算生物学家克日什托夫·菲德利斯(Krzysztof Fidelis)创立,通过将计算预测与未发表的结构模型进行比较来确定获胜者。
2018 年,总部位于伦敦的 DeepMind(现为 Google DeepMind)凭借其第一个版本的蛋白质结构预测工具 AlphaFold 赢得了 CASP。它的下一个迭代 AlphaFold 2 在 2020 年表现如此出色,以至于 Moult 宣布预测简单蛋白质结构的问题已基本解决。此后,该竞赛将重点转移到其他新出现的挑战上,例如预测复合物中多种相互作用蛋白质的结构。
现在,许多人希望这些竞赛能够推动蛋白质设计领域向前发展,就像 CASP 帮助刺激蛋白质结构预测的革命一样。“如果没有 CASP,就不会有 AlphaFold,”Rost 说。“我们需要这些比赛来正确完成工作并激励人们。”
6 月,Rost 和他的几位同事赢得了由国际开放科学非营利组织 Align to Innovate 举办的蛋白质工程锦标赛。该活动包括两个部分。首先,参与者试图预测不同酶变体的特性。然后,本轮比赛中表现最好的团队重新设计了一种分解淀粉的酶,最好的设计由实验室实验确定。2025 年的锦标赛现在正在筹备中。
今年 4 月,位于加拿大基奇纳的生物技术公司 Liberum Bio 和 Rosetta Commons(一家主要由学术科学家组成的合作公司,负责维护蛋白质建模工具)举办了冬季蛋白质设计游戏竞赛,并宣布了获胜者。该竞赛要求参赛者重新设计现有的蛋白质——一种广泛用于蛋白质纯化的植物病毒酶——以提高分子的效率。
另外两项比赛要求参与者想出全新的蛋白质。Adaptyv 一直在寻找能够附着在一种叫做 EGFR 的生长激素受体上的蛋白质,这种受体在许多癌症中过度活跃。90 名参赛者提交了 700 多项设计。
在 Bits to Binders 中,研究人员正在争相创造可用于 T 细胞癌症治疗的小蛋白质。该活动由德克萨斯大学奥斯汀分校(University of Texas at Austin)的研究生领导团体 BioML Society 主办,吸引了来自 42 个国家/地区的 64 支团队,包括尼日利亚、哥伦比亚、伊朗和印度。目前正在测试大约 18,000 种设计,结果将于 2025 年初公布。“我们对参加人数感到非常惊讶,”联合组织者、该大学的生物化学博士生 Clayton Kosonocky 说。
欢迎新人
Adaptyv 的首席执行官兼联合创始人 Julian Englert 表示,其比赛的许多参与者都从事蛋白质工程和设计方面的工作。然而,该比赛也收到了来自没有生物学专业经验的人的有希望的参赛作品。一位来自伊朗的参赛者使用游戏计算机进行预测,因为他无法使用更强大的系统。
Englert 说,来自非成熟研究人员的高质量条目让他想起了 Apple、Microsoft 和其他科技巨头的车库修补起源。“他们本来需要两年的学习和加入实验室才能开始工作。在这里,他们可以在一个周末完成。他设想了一个未来,自由蛋白质设计师争夺公司、学术实验室和其他寻求定制分子的人设定的赏金。
比赛还可以通过其他方式节省时间。从比赛组织者那里获得快速的实验结果是慕尼黑工业大学机器学习科学家 Michael Heinzinger 的一大动力,他是 Rost 获胜团队的一员。“否则我们就不得不花时间写资助申请,”他说。“对我来说,奖励是节省时间。”
就实际奖品而言,Align to Innovate 锦标赛没有提供奖品,但其他一些锦标赛提供。Bits to Binders 的获胜者将获得一个 3D 打印的奖杯,其中包含他们的设计,以及来自明尼苏达州伊根市的生物技术公司 LEAH Laboratories 的一些商品。还将有合作的机会。
Adaptyv 销售蛋白质设计师创建的分子的自动化实验室测试,它提供了一些免费实验和一些自己的赃物。罗塞塔冬季运动会的获胜者瓜分 5,000 美元。
但最引人注目的是最近推出的 Evolved 2024 竞赛,第一名的团队将获得 25000 USD 的 Amazon Web Services 积分,以及来自其他公司(包括 OpenAI)的价值数千美元的积分。它的赞助商包括纽约市的风险投资公司 Lux Capital,该公司已向科技公司投资了超过 15 亿美元,以及同样位于纽约市的生物人工智能初创公司 EvolutionaryScale,该公司吸引了 1.42 亿美元的投资。
超越丰厚的现金奖励
选择谁将获得这些回报并不总是那么简单。Evolved 2024 竞赛更像是一场黑客马拉松,团队致力于解决诸如预测药物疗效和安全性等粗略问题,将由专家小组进行主观评判。但即使对于具有更明确蛋白质设计目标的比赛,“弄清楚谁是赢家也不是一件容易的事,”生物工程师兼 Align to Innovate 创始人 Erika DeBenedictis 说。她所在组织的锦标赛根据设计的活动、稳定性以及它们的制作质量(甚至是否)来衡量设计。“当你设计一种蛋白质时,它有很多种可能失败,”她说。
科学家们表示,如果竞赛要推动蛋白质设计的发展,就需要解决更广泛领域正在应对的挑战。与结构预测不同,蛋白质设计可能因任务而具有截然不同的标准。制作特定类型酶的方法可能无法转化为其他蛋白质,例如疫苗成分。
Rost 警告说,如果比赛将比赛推向兔子洞——例如,对设计的评判过于狭隘,可能会适得其反。威斯康星大学麦迪逊分校(University of Wisconsin–Madison)的计算生物学家安东尼·吉特(Anthony Gitter)说,如果参赛者对自己的方法保持沉默,研究人员也可能无法从蛋白质设计竞赛中获益。“如果团队不传达他们的方法,就没有太多机会了解哪些有效,哪些失败。”
到目前为止,这似乎还没有发生。大多数比赛都鼓励甚至要求参与者描述他们的方法。Gitter 说,这些竞赛还有助于将一些被蛋白质设计吸引的不同领域聚集在一起——从开创蛋白质工程方法的生物化学实验室到在自然语言处理方面崭露头角的机器学习科学家。“组织比赛的人,为了对球场产生最大的影响,应该认真思考如何创建一个社区。”
当 Adaptyv 比赛结果于 9 月下旬公布时,Naka 感到失望。尽管他的所有 10 个条目看起来都很强大,但他的设计在实验室中没有一个奏效。在测试的 147 种设计中,只有 5 种实际上与目标分子结合。其中 50 多辆甚至无法制作。
这实际上还不错:过去设计 EGFR 粘合剂的努力成功率要低得多。“这与蛋白质工程课程的标准一样——你必须做好经常失败的准备,”Naka 说。获胜者是位于洛桑的瑞士联邦理工学院 (EPFL) 的结构生物学家 Martin Pacesa 和 Lennart Nickel,他们发布了一篇预印本,描述了他们的方法并将其代码开源(M. Pacesa 等人)。bioRxiv https://doi.org/nmfm 预印本;2024 年)。Adaptyv 现在启动了第二场比赛,该比赛建立在第一场比赛的基础上。
Naka 希望他早点开始处理他的条目。他将自己的黑客马拉松描述为“2 型乐趣”——当时很痛苦,但回想起来很愉快。通过比赛,他与志同道合的科学家建立了联系,包括 Gitter。“感觉它降低了进入门槛,让很多新人参与蛋白质设计,”他说。“我将来肯定会参加类似的活动。”
自然 634, 532-533 (2024)
doi: https://doi.org/10.1038/d41586-024-03335-z