【云驻共创】AI助力新冠疫情药物研发
药物筛选的挑战和关键问题
药物研发的流程
新药研发的流程包括药物发现、预临床研究、临床研究、审批和上市。从成千上万个化合物筛选到数百个化合物,到临床研究阶段,就筛选到了5-10个化合物,直到最后一个化合物的上市。研发的本质是:针对指定靶点,不断设计、筛选、优化化合物;从成百上千万个化合物中选择出对目标靶点有效应的化合物,并且满足对人体的安全性要求。
药物发现的挑战和关键问题
新药研发的挑战和特点可以用四个字来概括,就是三高一长,高风险,高投入,高回报,长周期。
高投入的话15年前平均一个新药上市,投入大概是8亿美元,5年前达到了26亿美元。
长周期是指平均一个新药研发到上市平均需要12年的时间,如果从药物靶标发现开始计算时间就更加漫长,而且前期探索性的内容比较多。
效率低,传统方法以逐步实验筛选为主,失败率高,数据获取技术堡垒高、成本高、保密性强。
转化慢,药物发现的工作,及靶标发现的工作多由大学和科研机构进行,后经过成果转化,被药企收购,转化很慢。
AI开发套件如何助力药物筛选提升10倍效率
近年来,药物研发领域新的实验技术快速发展,比如冷冻电镜,DNA编码化合物库,各种组学技术等等,产生了海量的数据,信息技术的快速发展使得我们可以更好的收集,整合,分析这些大数据,AI技术使得我们可以更深入的挖掘这些数据,所以IT和BT的融合有可能成为新药研发新的范式。
麦肯锡公司预测人工智能领域十大发展趋势:通过AI技术可以快速、低成本获得新型药物和治疗方法。AI药物研发是一个复杂的系统工程,涉及到了大量物理,化学,生物,数学,以及工程技术的问题,每一个子领域,每一个问题,都可以用到AI技术,都有更进一步的提升和突破。如大分子抗体的优化,蛋白质结构的预测,多组学分析,生物标记物发现等,后面我会介绍一些我们做的AI药物研发课题和方向。
人工智能药物研发这一概念从2016年左右开始被提出来,到19年已经开始得到验证。包括Exscientia与日本住友制药的AI合作项目进入临床,发现优化过程仅用了一年。Recursion Pharmaceuticals与武田制药的AI合作,对六种罕见病找到新的候选药物,用时1.5年。去年InsilicoMedicine利用AI平台快速发现DDR1候选药,从立项到发现候选药仅仅用了46天,而这一流程通常需要几年的时间。这一案例也显示了AI能够显著提升药物研发的效率
基于华为医疗智能体AI平台,上海药物研究所与华为团队开展了多个合作项目。该平台基于华为云AI昇腾集群服务、ModelArts一站式AI开发与管理平台的强大AI能力,集成了医药领域众多算法、工具、AI模型和自动化流水线,目标是打造一个全栈、开放、专业的医疗行业企业级AI研发平台。
对于小分子药物研发来说,靶标蛋白质的结构是非常重要的,我们经常把靶标蛋白质比喻成一把锁,药物就像是一把钥匙,如果锁的结构不清楚,寻找钥匙就非常困难。例如这次的新冠病毒就是一个全新的病毒,在没有实验解析出新冠病毒相关靶蛋白的情况下,研究人员是很难准确进行药物设计的。利用开放数据库Protein Data Bank里面的高质量实验解析的蛋白质3D结构,可以通过AI算法,将蛋白质一级序列与3D结构之间的关系预测出来,从而为未知结构的蛋白预测3D结构。去年年底谷歌的alphafold2在蛋白质结构预测上取得了很好的结果,但还有一些问题没有解决,比如小分子药物结合诱导的蛋白质构象变化,蛋白-蛋白的相互作用等,我们也在后续的研究中重点解决这些问题。
因为药物研发的周期长,投入高,如果研发后期失败代价非常大。那有一个最高效的方法就是老药新用,也叫药物重定向,去发现老药新的适应症,新的应用。因为已经上市的药物一定已经通过了副作用、安全性的评估,在此基础上去继续开发会大大加快药物研发进程。比较著名的例子比如沙利度胺用于多发性骨髓瘤的治疗。我们利用癌症基因组数据预测抗癌药物的敏感度和协同作用,我们的AI算法显著优于原有方法。
上海药研所与华为的AI科学家一起合作开发了一个多组学自动建模工具AutoOmics,用来快速发现生物标志物,加速临床研究。生物标志物广义上讲可以是基因、蛋白质或任何内源物质,通过测量它水平可以反应出是否有某种疾病,疾病的严重情况,疾病的预后怎么样。可以用于临床方案的设计,精准用药等等各个方面。提出了一种新的多模型整合的方法,可以有效的整合任意多个组学的数据,并且通过引入AutoML算法,使得AI模型的构建和训练可以完全自动的进行。药物研发临床阶段的投入是最大,因此在这一阶段效率的微小提升可能会带来巨大的回报。
此外,药物研发也有它的行业特点。药物研发的数据背后有巨大的商业价值,获取数据的成本高代价大,一般被认为是商业机密,在不同机构之间基本不会共享。数据孤岛现象普遍存在,很多企业内部的数据都是量少而且高度有偏的。为高质量的AI药物研发模型带来了很大的挑战。2016 年由谷歌提出的联邦学习,可以很好的解决这一问题。联邦学习本质上是一种分布式机器学习技术,他的目标是在保证数据隐私安全及合法合规的基础上,实现共同建模,提升AI模型的效果。简单来说,核心思想就是模型共享而不是数据共享。构建了基于个性化联邦学习策略FedAMP的架构,并且针对药物研发过程中常见的预测任务构建了模型,如药物ADME/T预测,药物激酶活性预测,药物分子结构生成等等,这些预测任务都可以通过药物联邦学习来进一步提升模型的准确性
利用计算机进行药物筛选,寻找有效治愈疾病的分子是药物研发人员最关心的工作。这种筛选是根据疾病靶点和小分子药物的3D结构,计算病毒蛋白与药物之间的结合能量,实现从海量的小分子化合物库中筛选出与目标蛋白结合最紧密的候选药物,从而快速为药物研究和临床试验提供方向。通过华为云15,000核超大算力,完成了新冠21个蛋白质靶点与8500个已上市药物的筛选工作。将筛选时长从30天缩短到1天。抗新冠病毒药物筛选工作,作为ACS期刊JCIM 封面文章发表。
以已知药物为出发点是效率最高的,上海药研所根据现有药物和活性天然产物的结构,利用官能团转化得到了一个规模在1亿左右的化合物库DrugspaceX,分析了这个库的性质,无论是新颖性,多样性还是可成药性都比较好,为进行药物筛选提供了很好的基础。
去年疫情期间,上海药研所与包括华为在内的多家单位密切配合,开展了应急药物研发。包括去年1月19号成立抗击新冠联合攻关团队,1月26号解析了首个新冠病毒的靶标Mpro蛋白质晶体结构(Nature 的封面文章)。根据该结构利用华为云进行虚拟筛选,公布了30种可能具有抗新冠活性的老药、中药和天然产物结构。
2月份筛选得到了新型抗病毒候选分子DC402234,并测得了小分子和Mpro的复合物晶体结构(Science的封面文章),去年7月份与中国的药监局和美国FDA申请了临床研究,7月底获得了美国的FDA批件,今年3月15日已经启动了美国的I期临床实验
此外利用华为云针对新冠病毒的其他靶点进行了高通量虚拟筛选。除了3CL水解酶,还包括木瓜类蛋白酶,RNA多聚酶,等,筛选老药、天然产物和商品化合物等一百八十余万化合物,发现候选化合物3143个;已测试的化合物中,378个化合物具有分子水平活性;针对具有抗病毒活性的212种化合物,总结出4类调控结合模式。
除了直接抑制新冠病毒靶标的抑制剂研发,作用于宿主靶标的抗新冠肺炎药物研究同样重要;我们通过老药新用的预测,发现人源二氢乳盐脱氢酶(DHODH)抑制剂可能用于治疗新冠肺炎。
上海药物所联合华为云发布医疗智能体药物筛选服务
上海药物所联合华为团队,开发了大规模药物虚拟筛选的云服务。利用华为云端万核超大算力,可以实现十倍的药物筛选效率提升;服务内置原创的iFitDock算法,可同时实现刚性和柔性对接,真实反映蛋白质的生理状态和功能;并且提供亿级规模的DrugSpaceX药物筛选库,这是当前最大的人工可合成药物库,可追溯反应路径,快速实现药物生成。希望这个平台能够为医药企业、科研单位提供更好的服务,助力我们的新药研发,为健康中国贡献力量。相信在未来AI的协助下,医疗诊断会更加准确、医生工作量会越来越少、医疗行业会发展的更好。
视频链接:https://live.huawei.com/hdc2021/meeting/cn/8305.html
- 点赞
- 收藏
- 关注作者
评论(0)