近几年,AlphaFold的问世,让“AI+生物”进入了迸发期。生命科学、数字科技等交叉学科,为人们的生活带来了巨大的变化。尤其是医疗领域,已逐渐成为人工智能巨大的应用场景,全产业链实现了前所未有的降本增效。
作为医疗行业观察者,动脉网在覆盖和持续跟踪生物制造领域的过程中,观察到AI+生物这一交叉领域的巨大前景。其中,2021年由上海交大洪亮教授团队创建,目前国内顶尖的AI蛋白质设计服务商上海天鹜科技有限公司(下称“天鹜科技”)引起了动脉网的关注。
天鹜科技创始人兼首席科学家 洪亮教授,图源天鹜科技
日前,天鹜科技与长春金赛药业有限责任公司(下称“金赛药业”)联合宣布,双方在使用AI大模型设计极度耐碱单域抗体方面取得了突破性进展,将一个普通的非耐碱单域抗体的耐碱性提升了4倍,并成功完成了全球首款经大模型设计且进入5000升放大生产、落地应用的蛋白质产品的开发。
该项技术可以将任何单域抗体进化成工业上可以使用的耐碱亲和填料,在任何生物分子的纯化(包括GLP-1,细胞基因治疗载体蛋白,AAV病毒颗粒等)上都可以应用亲和层析的方式,代替无标签蛋白多步层析步骤,解决了这一类分子纯化难度高,生产效率低的问题。
AI蛋白质设计的快速闭环
从科研到落地不到3年
除了与金赛药业的重磅合作之外,天鹜科技成立不到3年,先后还服务了多家行业知名企业,涵盖生物医药、体外诊断、药物中间体、营养保健、食品饮料、美容护肤、洗涤纺织、生物能源、生物农业、环境工程等领域。
天鹜科技在产业端的累累成果得到了行业的认可,公司曾先后荣获国家高新技术企业、闵行区新锐企业等多项荣誉称号,并于2022年、2023年先后完成两轮融资,投资方包括耀途、金沙江联合、本草、晓池等多家产业资本。
事实上,将AI应用在蛋白质设计领域并且取得成果,是近几年才萌发的事情。
此前,利用传统方式进行蛋白质设计需要满足诸多条件。首先,研究人员需要利用长期积累的对蛋白质结构的理解和经验,加上复杂的计算获得目标蛋白质的设计序列,最后再使用生物技术对表达的蛋白质功能进行检测,看是否与设计目标吻合,不仅耗时长、成本巨大且成功率非常低。
“ 2020 年,AlphaFold 的问世,极大地推动了研究人员对生物学领域的探索与研究,但AlphaFold 只解决了蛋白质设计从序列到结构的问题,没有解决结构到功能的问题。不过,AlphaFold的成功为后来者指明了方向,让行业确定用AI赋能蛋白质设计这个方向是正确的。这也是AI+蛋白质设计近几年发展迅速的原因,因为在科研转化的过程中,很多时候我们连这是不是一条路都不确定,前行的过程充满了未知。”洪亮教授告诉动脉网。
基于此,洪亮教授带领团队在 2021 年开发了一套基于预训练的蛋白质设计通用人工智能 AccelProtein™ ,彻底打破了传统蛋白质工程方法存在的实验多、时间长、成本高等行业痛点。
2021年至今,天鹜科技基于AI 蛋白质设计通用大模型AccelProtein™,帮助了二十余家企业提升产品性能、缩短研发周期、降低生产成本、加强专利布局。
这也让天鹜科技与大多数科研转化类型的企业不同。通常情况下,科学家从基础科研到产业化落地,需要10年甚至更久的周期,“天鹜科技比较罕见,从科研到落地只用了两三年。这是因为人工智能赛道是一个闭环快的赛道,AI+蛋白质设计则是一个创新程度高、闭环链条短的细分赛道。多种属性的叠加让天鹜科技能够快速实现科研转化的闭环。”
面对取得的成绩,作为公司创始人和首席科学家的洪亮教授却感慨,“教授创业成功其实是一件概率极低的事情。因为团队所具有的技术和能力,只是企业去提供服务和打造产品的重要条件之一。但这些条件跟全面运营一家企业,实现产品和服务的商业化闭环来比,并不是最重要的。我也是遭受了社会的许多‘毒打’,才领悟了这个道理。”
用时4月完成耐碱性提高4倍的单域抗体设计
据悉,天鹜科技的AccelProtein™大模型采用了先进的Transformer架构和掩码语言模型,通过在近十亿条覆盖各种环境下生物体蛋白质序列的复杂数据上进行训练,该模型掌握了蛋白质序列、结构与其功能之间复杂的语义联系,实现了从“序列到功能”的映射,具备了真正的零样本预测能力。
使用“AccelProtein™大模型自动设计+少量实验验证”可以实现对所有种类蛋白质序列进行设计,多款蛋白质设计案例证明,该技术不仅可以在蛋白质的稳定性、活性、亲和力等关键指标的优化上,达到甚至超越世界领先水平,还可将蛋白质性质的优化时长从传统的2—5年大幅缩短至2—6个月。
就本次与金赛药业合作为例,在初次设计中,AccelProtein™大模型就在没有任何实验数据的情况下成功设计出了十余个在耐碱性、亲和力以及热稳定性等方面都优于野生型的单点突变体。
在这之后,AccelProtein™又发挥了它抓取特征预测多点突变的强大能力,不少多点突变表现出更强的耐碱性、亲和力和热稳定性,甚至基于其学习到的复杂的上位效应,设计出了两个阴性突变组合后变成阳性突变的序列,这是传统设计方法不可能做到的事情。
此外,相较于传统蛋白质工程理性设计,AccelProtein™能自动理解上位效应,巧妙地将阴性点位加入突变体使得“语义更通顺”,这是全领域的一个根本创新,极大地放大了蛋白质工程的设计能力和想象空间。
最终,天鹜科技仅历时4个月,经AccelProtein™大模型设计后的单域抗体,在蛋白小试环节就被证明:经0.5M NaOH处理24小时以后,断裂比例就由改造前(野生型)的60%减少至15%,这意味着耐碱性提高了4倍;和生长激素的结合能力是改造前的2倍;热稳定性相比改造前提高8℃。
天鹜科技设计抗体与野生型抗体各方面数据的对比,图源天鹜科技
更值一提的是,相较于目前产业中真正作为耐碱的亲和填料配基蛋白ProteinA,科研人员曾耗时近10年才实现工业可用,但适用范围仍只针对抗体。天鹜科技在不到1年时间里,将一个普通的非耐碱单域抗体的耐碱性提升了4倍,并应用在5000升的放大生产中,标志着通过AI大模型定制化开发高耐碱亲和填料技术的成熟。
放大生产过程,图源天鹜科技
该项技术可以将任何单域抗体进化成工业上可以使用的耐碱亲和填料,在任何生物分子的纯化上,例如GLP-1、细胞基因治疗载体蛋白、AAV病毒颗粒等,都可以应用亲和层析的方式,代替无标签蛋白多步层析步骤,解决了这一类分子纯化难度高,生产效率低的问题,是全球范围内首创的下游工艺的重大技术革新。
以生物医药赛道为切入口
布局生物制造全产业链
事实上,蛋白质设计工程的应用远不止设计抗体。基于蛋白质设计通用大模型AccelProtein™,可布局抗体治疗、疫苗预防、体外诊断、细胞治疗、基因治疗等医药应用领域,还可布局营养保健、食品饮料、美容护肤、洗涤纺织、生物农业等合成生物学领域。
提及为何先以壁垒高、周期长、风险大的医疗赛道作为AI蛋白质设计应用的产业化切入口,洪亮教授笑着形容天鹜科技是“兔子爱吃窝边草”。
真实情况是,洪亮教授深耕AI+生物研究多年,在 AI 蛋白质设计领域有多年研究经验。其博士时期在美国阿克伦大学高分子科学系从事蛋白质生物物理方面的机制研究,在美国橡树岭国家实验室完成博士后研究后,洪亮博士来到上海交通大学,带领团队将实验和计算生物学方法结合,继续对蛋白质的性能进行研究。
洪亮教授解释,“此前的科研特性让团队在医药和体外诊断领域积累了丰富的经验和资源,所以天鹜科技一开始顺其自然以生物医药赛道作为切入口,让技术、产品和服务迅速得到了闭环验证。此外,AccelProtein™在分子设计层面具有通用性,基于该大模型生成的蛋白质突变体,其活性、稳定性、选择性、特异性等较自然界野生型有大幅提升,适用于生物制造领域中的多个细分场景。”
因此,提及未来发展,洪亮教授表示,不管是布局哪个应用场景,天鹜科技所瞄准的都是基于AI蛋白质工程挖掘出的增量市场,而非已经充满竞争的存量市场或还未发展成熟的不真实的市场。
为了应对接下来的高速发展,天鹜科技正在开启新一轮融资,以加强平台的建设能力、产业化能力,自主挖掘和合作承担更多有价值的项目。期待天鹜科技基于AI蛋白质设计平台,为产业赋能,为生物制造领域带来更多降本增效的产品和服务。