医药研发“一哄而上”?中国超算引领新药创新研发
“十四五”开新局·破难题
◎本报记者 张佳星
医药产业是一个在“十四五”发展规划中多次被“点名”的产业。无论是“加强原创性引领性科技攻关”还是“构筑产业体系新支柱”,医药产业都被寄予厚望。
这个产业的凶险也人尽皆知。高投入、高风险这样朴实的词汇已经很难概括一个原创新药的“九死一生”。
“全球数据统计显示,新药研发的成功率已经从10%下降到现在的2%—3%。”中国科学院计算所哲源图灵达尔文实验室副主任赵宇用数据说话,这个几率低于“九死一生”,达到50活1的比例。
这样的情况下,产业行业更加青睐风险低的跟随式创新。例如,PD1相关的研发项目由于获得2018年诺贝尔奖再度频繁上马,CAR-T技术由于治好了美国前总统的肿瘤声名大噪,也令药企趋之若鹜。
研发资源一哄而上地跟随创新使得我国药品领域“供给侧”矛盾突出:高端好药新药严重不足,低端仿制药却过剩。
驱动医药产业主动走向真正的创新,必须要让科研院所、制药企业解决新药研发过程中的痛点,让创新主体尝到原始创新的“甜头”。
有效性临床试验失败是新药研发失败的主要原因,业内形象地称其为“死亡谷”。走进“死亡谷”面对的最大困惑是,理论上明明有效地针对了靶点,为什么在上人体的时候却无效了?
现在进行的临床试验阶段的方案设计、人群选择目前仍带有盲目性。中科院计算所西部高等技术研究院常务副院长张春明表示,事实上,现有已经发表的大量论文中蕴藏着这些问题的答案,但是浩如烟海,人的能力是无法分析的。
换句话说,读懂所有的文献,就能找到答案,但这项工作单凭人力是做不到的。
“单单去年一年,能够检索到的与新冠病毒相关的论文已经从0增长到11万篇,这个体量的学习是人力无法穷尽的。”赵宇说。
基于超级计算机的人工智能却可以做到。张春明解释,依托中科院高性能计算机研究中心的中国超算,研发团队从全球发表的所有生命科学论文中获得数据,并将其变成知识。根据全数据和人工智能算法生成模型,建立起药物数字研发平台。
这个平台如何工作呢?举个例子,它通过分析患者外显子基因数据等,把个性化的基因在药物数字平台内与细胞内事件建立联系,模拟信号通路的打通,可以预判这个患者体内的信号通路是不是像理论一样被激活,进而预测一个临床试验药物到达某个患者体内的作用效果。
通过人工智能的判断,能够找到药物有效的特定人群。赵宇说:“以治疗癌症的抗血管生成药物为例,目前普遍有效率为20%,但哪些有效哪些无效的机制机理目前无解。我们的机制性研究通过建立判断模型、提前预判的人群,获得将近90%的有效率。”
新冠疫情期间,从中国超算中诞生的药物研发AI发现了两种药物对新冠肺炎治疗有效,后均被临床研究证实。
如果能在3期临床进行新药适用人群的细分,那么有效性验证的“死亡之谷”将不再难走。而由超算支撑的人工智能现在能够提供400多个功能模型,解决创新药研发过程中的靶点预判、有效成分筛选预判、临床试验效果预判等多方面问题,至少可以让药物的研发时间减半、投入减半,成功率提高一倍,到了临床以后有效率提高一倍。
张春明认为,中国医药需要颠覆性、变革性的创新才能实现产业乃至整个行业的“变道超车”,而依托人工智能搭建起“计算医学”体系有望担起重任。
据介绍,依托中国超算的新药数字研发平台由中科院计算所持续20年研发而成,期间获得国家“863”基因组学数据处理技术、国家“973”建立基因数据计算模型、科技部重点研发专项医学大数据融合模型等国家项目的支持。