导读:Alphabet的DeepMind破解了一个长期困扰生物学家的问题,在医疗保健领域掀起了一场技术军备竞赛。
Alphabet的DeepMind破解了一个长期困扰生物学家的问题,在医疗保健领域掀起了一场技术军备竞赛。
机器学习技术在国际象棋比赛中击败了人类,并在全球范围内引起轰动。在给毫无戒心的人打诈骗电话时,它惊人的逼真人声模仿能力得到了展示,一时在网上掀起了轩然大波。
谷歌母公司Alphabet旗下人工智能子公司DeepMind在两年一度的生物大会上展示的一项不太引人注目的技术,可能会颠覆制药商发现和开发新药的方式。它还可能加大对全球最大制药公司的压力,迫使它们为一场技术军备竞赛做好准备。以科技为依托的制药新秀已经加入了这场混战。
去年12月,在墨西哥里维埃拉举行的CASP13会议上,DeepMind的新技术在预测蛋白质的形状方面击败了经验丰富的生物学家。蛋白质是疾病的基本组成部分。这一看似深奥的研究有着重要的意义:一种能够精确模拟蛋白质结构的工具可以加速新药的开发。
“这绝对令人震惊,”一名科学家在原始结果发布到网上后发推说道。会议创始人、马里兰大学计算生物学家John Moult表示:“它完全是一个惊喜。与我们自身能够做到的成果相比,它的前景不可限量。”
为了找到药物治疗疾病的方法,对蛋白质结构进行分类是一个极其复杂的工程。研究人员还没有完全理解蛋白质是如何形成的。同时,还有一个数学问题:蛋白质的形状可能比宇宙中的原子还多,这使得预测成为一项艰巨的计算任务。四分之一个世纪以来,计算生物学家一直在努力设计出能胜任这项任务的软件。
DeepMind在蛋白质折叠(蛋白质获得三维形状的物理过程)方面经验有限,但凭借最新的神经网络算法,DeepMind完成了全球50个顶级实验室所能完成的事情。
在会议举行的玛雅主题度假村,与会者的兴奋之情溢于言表。两位DeepMind的演讲者被科学家们一直追问他们是如何做到这一点的。几小时后,英国《卫报》表示,DeepMind的人工智能可能“开启医学进步的新时代”。在一篇博客文章中,该公司夸口说,它的蛋白质模型“比以前的任何模型都精确得多”,“为药物发现带来了新的潜力”。
DeepMind在一封电子邮件中表示,该公司的科学家“完全专注于他们的研究”,无法接受采访。
DeepMind的模拟还不能够产生对药物发现非常重要的原子水平的分辨率。尽管许多公司都在寻找利用计算机识别新药物的方法,但很少有基于机器学习的药物发展到可以在人体上进行测试的地步。还需要花费数年的时间,人们才能知道这样的软件是否能定期发现有希望的治疗方法,而这些方法是研究人员可能会错过的。
人工智能是医疗保健领域一个非常热门的词汇,经常被吹捧为一剂包治百病的灵丹妙药。它被认为是一个潜在的解决方案,可以修复繁琐的电子病历,加快诊断速度,使手术更加精确等。DeepMind的成功表明,该技术有可能在制药行业最昂贵、最容易失败的领域之一得到实际应用。
一些观察人士表示,一个由外部人士组成的团队能够在解决生物学中最棘手的问题之一上取得如此重大的进展,这令该领域的研究人员大失颜面。对制药行业来说,这也可能是其遭受冲击的一个预兆。制药行业在研发上投入了数十亿美元,但却被科技公司打了个措手不及。
参加这次会议的哈佛大学计算生物学研究员Mohammed AlQuraishi在一篇博客文章中写道,大型制药公司没有在蛋白质折叠方面投入大量精力,基本上是把这个领域让给了科技公司。当制药公司还在犹豫不决时,“Alphabet突然进来搅局,在他们的专属领地开辟了自己的区域,”他写道。
众所周知,找到新药并将其推向市场是非常困难的。据估计,大型制药公司至少需要花费超过25亿美元才能为病人提供一种新药。进入人体临床试验的10种疗法中,最终只有一种能够进入药店。同时,医疗科学进展缓慢:在人类基因组测序后的近20年里,研究人员仅仅发现了治疗大约7000种已知罕见疾病中的一小部分的方法。
此外,大约有2万个基因会以至少十万种方式发生病变,并且产生的蛋白质之间可能存在数百万种相互作用。对于制药行业来说,手工检测所有这些组合几乎是不可能的。
“如果我们想了解人类生物学中的其他97%,我们将不得不承认对我们来说太复杂了,”Chris Gibson说。他是Recursion Pharmaceuticals的联合创始人兼首席执行官,该公司是一家位于盐湖城的创企,利用机器学习来寻找新的治疗方法。
Recursion这样的公司正在迅速吸引投资者。数据提供商PitchBook的数据显示,风险投资家去年向专注于药物研发的人工智能和机器学习初创企业投入了10.8亿美元,高于2016年的2.37亿美元,今年迄今已投入6.99亿美元。
Recursion周一表示,在最近一轮融资中,已从Intermountain Ventures和明尼苏达大学董事会等投资者那里筹集了1.21亿美元。据PitchBook的数据,它的估值为6.46亿美元。“这是一家雄心勃勃的公司。他们正在考虑从根本上改变这个行业,”领投此次融资的苏格兰Baillie Gifford & Co.的投资经理Marina Record说。
而那些老牌制药商正竞相与从事类似工作的公司结盟。
今年4月,Gilead Sciences与前斯坦福大学机器学习专家Daphne Koller领导的初创公司Insitro达成协议,寻找治疗纳什肝病的方法。与此同时,AstraZeneca也与英国的BenevolentAI进行了合作,其研究旨在确定肾脏疾病和肺纤维化的治疗方法。今年6月,GlaxoSmithKline与加州大学基因编辑专家合作,斥资6700万美元,使用人工智能进行目标搜索。
“你还能接受十分之一的成功率吗?如果我们能将这一比例提高一倍达到20%,那将是惊人的,”GlaxoSmithKline高级副总裁Tony Wood说,他是这家英国制药巨头的医药科学和技术负责人。
默克公司负责计算化学的副总裁Juan Alvarez表示,机器学习方法对药物发现“至关重要”。这家制药巨头正在开发人工智能工具,以帮助其化学家加快制造化学物质,以缩短异常蛋白质搜索的艰苦过程。Alvarez说,早期的机器学习发展已经为人类测试药物做出了贡献,而第一批基于更先进的神经网络方法的药物可能在几年内投入临床试验。
人工智能可以被用来扫描数以百万计的高分辨率细胞图像,以发现能够以意想不到的方式使患病细胞更健康的疗法,这个数量比人类能够自己处理的还要多。
Recursion是最早使用这种方法的初创公司之一。每周,机器人都会在40万到50万个微型实验中,将数千种潜在的药物应用到不同类型的病变细胞上,生成500万到1000万张细胞图像。然后,机器学习算法扫描图像,寻找在不损害健康细胞的情况下破坏疾病的化合物。
最初的算法是手工编程来解释基本的细胞特征,但Recursion越来越多地使用直接解析图像的神经网络方法,并可能发现人类程序员不会寻找的模型。在此过程中,计算机科学家与实验室里的生物学家紧密合作,以改进解析算法。
该公司已同意与武田制药有限公司和赛诺菲达成罕见病方面的协议。过去几年,赛诺菲生成了超过2.5PB的数据,总量超过了好莱坞所有故事片的容量。
公司创始人Gibson说,公司现在的做法“在六、七年前根本行不通”。
Gibson最初转向机器学习是在犹他大学读研究生时,当时他正在寻找治疗大脑海绵状畸形的方法。根据血管瘤联盟的数据,大约每500个人中就有1个人患有这种疾病,虽然患者常常表现正常,但却可能导致癫痫发作、语言或视力障碍,以及严重的脑出血。
大约四分之一的患者有这种疾病的遗传形式,更有可能导致多种畸变。尽管导致这种疾病的三种基因是已知的,但目前还没有药物可供治疗。Gibson在犹他大学测试的一种药物是基于对这种疾病的普遍理解,但却使动物的症状更加严重。
沮丧之余,Gibson和他的同事使用开源的机器学习软件扫描细胞图像,以探测2100种化合物的效果,寻找那些能够改善携带坏基因的血管细胞外观和功能的化合物。这些算法指出,在动物实验中,一种意想不到的化学物质可以将血管渗漏减少50%。这种药物将于明年进入人体试验的第二阶段,它是Gibson决定创立Recursion的原因之一。
Alphabet的其他部门,以及社交媒体巨头Facebook旗下的人工智能研究部门也正在慢慢进入制药行业。Facebook在4月份悄悄地发表了一篇论文,使用深度学习技术分析了2.5亿个蛋白质序列。今年春天,谷歌的人工智能研究人员推出了一种神经网络算法,可以根据序列预测蛋白质的功能。