在生命科学的前沿,AI 技术正在引发一场革命。最近,生物计算公司 ProFluent 推出了 ProGen3,一款强大的生成式蛋白质语言模型(PLM),它有望在抗体、工业酶及基因编辑领域带来重大突破。研究显示,ProGen3的规模和设计优化能够生成功能强大的新型蛋白质,甚至重塑我们对生物学的理解。
蛋白质是生命体内的关键分子,负责多种生理功能。从催化反应到识别病原体,它们的作用不可小觑。然而,设计新的氨基酸序列以实现未曾出现的功能,如新药物或超稳定的工业酶,面临巨大挑战。ProGen3的出现,为解决这一问题提供了新的思路。
图源备注:图片由AI生成,图片授权服务商Midjourney
ProGen3的训练数据来自一个名为 Profluent Protein Atlas v1的数据集,包含34亿个全长蛋白质和1.1万亿个氨基酸标记,成为目前最全面的蛋白质数据集之一。研究表明,随着模型规模的扩大,ProGen3能够生成更为多样化且功能真实的蛋白质。例如,ProGen3-46B 生成的蛋白质多样性比小模型高出近两倍,显示出更广泛的生物学潜力。
在实际应用中,研究团队通过 ProGen3设计了一系列高质量的抗体。这些抗体不仅在多项属性上与已获批准的药物相当,还展现出了优越的开发性,挑战了传统抗体设计的限制。此外,团队还开发出紧凑型基因编辑器,仅由592个氨基酸组成,能够实现精准的基因编辑,展示了 ProGen3在实际应用中的强大潜力。
ProGen3的推出标志着蛋白质设计进入了一个新的时代。研究者们认为,继续扩展这种模型将使我们在药物发现、酶工程和工业生产等领域获得更多进展。
发评论,每天都得现金奖励!超多礼品等你来拿
登录 在评论区留言并审核通过后,即可获得现金奖励,奖励规则可见: 查看奖励规则