机械进修和年夜数据赞助化学家在浩大的化学药品宇宙中寻觅更好的药物
在2016年,Sunovion制药公司交给一些老员工一项特别义务。在美国马萨诸塞州的公司总部,化学家们被请求停止一项寻觅新药最好先导化合物的游戏。在他们的任务站中有包含几百种化学构造的网格,个中只要十种标有相干生物学信息。专家们必需基于他们辛劳学到的化学构造及生物常识来选出其他能够作为候选药物的份子。在11位选手中,10位为这项义务冥思苦想了数小时,但剩下的一位选手却在几毫秒内就轻松完成,由于这名选手是一种盘算机算法。
系内行星Ross 128b绕一颗高温矮星运转,它的外面能够存在液态水。图片起源:Vasava
这一盘算机法式由Willem van Hoorn发明,他是应用人工智能设计药物的新公司Exscientia的化学信息学担任人。这一公司位于英国邓迪,愿望能与Sunovion树立初步协作关系,为此下了很高的赌注。“我的信用危在夙夜迟早。”Hoorn表现。二十轮游戏停止后,他高分胜出,也终究松了一口吻。他的算法仿佛是应用了一些化学黑魔法;由于最初唯一一名药物发明专家击败了机械。
从那时起,Exscientia公司便和Sunovion持续协作开辟精力病医治药物。Sunovion的盘算化学主管Scott Brown表现:“这场比赛切实其实赞助我们收买了化学研讨决议计划者。”
Exscientia公司是工业和学术界中一日千里的、应用盘算机摸索辽阔化学药品宇宙的浩瀚团队之一。化学家们估量约有10^60种具有药物特征的化合物可以或许被分解,这些小份子的数量乃至跨越了太阳系一切原子的总数。他们愿望经由过程盘算机算法对有数的化合物停止挂号、分类并比拟其特征,从而赞助研讨者疾速、低本钱地找到针对某一靶点的最好候选药物。支撑者们表现如许的战略可以或许使药物更平安,削减在临床试验中掉败的药物数目,同时使得新医治办法的发明成为能够。另外还有助于开启未摸索过和曾被以为无价值的化学范畴。
但是仍有很多药物化学家对此持疑惑立场,不信任奥妙、庞杂的化学可以或许简略缩减为几行代码。乃至某些人工智能的拥戴者也认可很多测验考试都以掉败了结:盘算机生成的化合物中充满着难以分解的构造,如3-或4-原子环,同时还有很多不平安的活性基团。van Hoorn以为:“假如研讨者不懂得该范畴,只是简略履行某些盘算办法会发生掉败成果,他们想出的化合物纯属笑话。”但他也表现专业人员的介入也许可以或许赞助这些热情的设计者。“我认为假如盘算机迷信家与真实的化学家协作,某些设法主意是可以或许完成的。”
摸索化学宇宙
在化合物的宇宙中飞行须要有地图的赞助。在2001年,瑞士伯尔尼年夜学的化学家Jean-Louis Reymond开端应用盘算机来绘制一幅尽量周全的化学宇宙地图。经由16年尽力,他构建降生界上最年夜的小份子数据库,即一个包括1660亿种化合物的宏大虚拟聚集。这一数据库被定名为GDB-17,包含全体相符化学道理的、由少于17个原子组成的无机份子,这一数量是Reymond的盘算性能够处置的下限。Reymond表现:“仅仅是用盘算机构成数据库中化合物的清单就须要10个小时以上。”
为了理清多余的潜伏药物原始信息,Reymond想出了一种使化合物宇宙体系化的方法。受元素周期表的启示,他将各化合物在多维空间内分类,相邻化合物具有邻近特征。各化合物的地位由42种特征来决议,例如每种化合物中所含的碳原子数。
每种投放到市场中的药物都有不计其数种与其化学构造根本雷同的化合物,其差异仅仅在于一个氢原子或一个双键。这个中某些化合物能够比获批的药物后果更好。化学家弗成能在没有外界赞助的情形下斟酌到一切这些变体。正如Reymond所言:“仅用纸笔毫不能够获得一切这些异构体。”
而Reymond和他的团队可以或许经由过程搜刮化合物之间类似性,来判定与已同意药物邻近、有潜伏医治价值的其他化合物。以某种药物作为动身点,团队可以或许在三分钟内挑选数据库中的1660亿种化合物来寻觅后续候选药物。在一次概念验证明验中,Reymond以一种能与乙酰胆碱受体(与神经体系和肌肉功效掉调相干的主要靶点)联合的已知份子为动身点 ,编制出包含344种化合物的名单。该团队分解了个中三种化合物,而且发明两种可以或许有用激活受体,也许可以或许用于医治老年人肌肉萎缩。Reymond表现这类办法像是应用地图来找金子,他说:“你须要某种方法来选择去哪里挖。”
别的一种方法用盘算机在多个地位寻觅金子,而不用太在乎终点。用药物发明的专业术语来讲,这意味着用盘算机挑选宏大的化合物库来寻觅能与特定卵白联合的小份子。起首,研讨者必需应用X射线晶体学取得某个卵白的快照,来决议它联合位点的外形。然后,应用份子对接算法,盘算化学家可以或许从化合物库中寻觅出给定位点的最好婚配。
跟着盘算机技巧飞速成长,这些算法的才能也获得了晋升。加州年夜学旧金山分校的化学家们在Brian Shoichet的率领下在2016年经由过程寻觅一种新型止痛药展示了这类办法的潜力。该团队从300万种市场上买获得的化合物中挑选可以或许选择性激活μ-阿片受体旌旗灯号通路的候选药物,以此来加重痛苦悲伤同时不捣乱亲密相干的β-克制卵白旌旗灯号通路,该通路与阿片类药物的反作用(如呼吸频率降低及便秘)相干。研讨者们敏捷将规模从一个伟大的化合物库减少到唯一23种高排名的化合物用于后续研讨。
化学药物宇宙 图片起源:nature
在一个试管中,七种候选化合物显示出幻想的活性。个中一种在后续研讨中被制成化合物PZM21,可以或许感化于μ-阿片受体而不激活β-克制卵白。位于旧金山、由Shoichet配合创建的生物科技公司Epiodyne正在依据这些发明开辟更平安的止痛药。Shoichet筹划应用异样的办法寻觅可以或许调理其他G卵白偶联受体(GPCRs)的化合物, 该家族的卵白在一切药物靶点中占到40%。
他的团队同时对含有一亿种化合物的虚拟星云停止类似的试验,这些化合物从未被分解但其分解进程应当较简略。工业药物开辟者也在用异样的办法停止测试:位于马萨诸塞州的生物科技公司Nimbus Therapeutics将一些存在于天然界却难以从情况(如泥土)平分离的虚拟化合物归入对接挑选。能否可以或许发明药物还没有定论,但该公司的首席履行官Don Nicholson针对至多一项药物设计法式表现:“这将是我们全体婚配药物的起源。”
这些虚拟挑选的初步成果摇动了Shoichet关于化学药物宇宙的焦点假定之一:只要完美的、药物丰硕的区域才是值得存眷的。已划分的份子星系充满着有生物活性的化合物,以致于一些人以为在其他处所寻觅是糟蹋时光。“在我的职业生活中我一直信任推理进程,这么做是有事理的,虽然能够没有许多证据来证实。” Shoichet表现。但是他还没有揭橥的、对一亿种化合物的挑选成果惹起了他对化学药物宇宙中很少被摸索区域的兴致。“我开端以为那些星系中藏满了金子。”
盘算机的“聪明”
这些数据搜刮办法被实验和测试,但用于任务的盘算机只能屈服剧本指令。盘算药物发明的最前沿是机械进修,算法可以或许应用数据和经历来告知本身哪一种化合物与哪一个靶点联合,发明人类没法发觉的形式。十几家公司纷纭开端发明药物搜刮算法,并与年夜型制药企业协作停止测试。
Exscientia的首席履行官Andrew Hopkins为这些办法的才能做出了强无力的证实。临床前测试发明和优化候选药物均匀须要4.5年,化学家们经常分解上千种化合物能力获得有价值的先导化合物(即便如许真正投入市场的愿望也异常迷茫)。Exscientia办法应用了多种算法(个中包含给Sunovion公司研发高管留下深入印象的那一种)也许可以或许将时光线延长到一年,同时缩减药物发明项目中须要斟酌的化合物数量。
在2015年,Exscientia完成了年夜日本住友制药公司(位于日本年夜阪, Sunovion是其旗下的公司)为期12个月的研发项目。研讨者练习他们的人工智能对象来寻觅同时调理两个G卵白偶联受体的小份子,发明要找到一种好的候选药物仅须要分解小400种化合物。Hopkins表现最初挑选到的药物如今已预备停止精力疾病的临床实验。从蒲月起,公司曾经与巴黎赛诺菲公司和英国葛兰素史克公司签订了数亿美元的合约。
除判定先导化合物以外,机械进修算法还能赞助药物开辟者决议将哪些化合物抹杀在摇篮中,加利福尼亚州圣布鲁诺一家人工智能药物设计公司Numerate的首席技巧官Brandon Allgood表现。假如一种化合物没法经由过程毒性或接收性测试,那从一开端就没有需要制造或测试它。“人工智能只须要几毫秒来决议能否消除这类化合物。” Allgood说,在开端应用人工智能对象研讨化学物资宇宙前,他曾进修宇宙学。Numerate本年已与制药公司杀青两笔生意业务,个中一笔与位于法国叙雷讷的施维雅公司协作,将人工智能发明的药物投入心脏衰竭和心律掉常的临床试验中。
虽然工业投资疾速增加,但盘算办法仍有待证实。固然Reymond的数据库比其他库加倍宏大,但它仅包含了化学药物宇宙中渺小的一部门(拜见“化学药物宇宙”)。虽然他的数据库中已包含1660亿种化合物,但他仍须要持续摸索,正如一个测验考试数清夜空中一切星星的宇航员才方才只数了一个。基于将样品与卵白相婚配的挑选须要精确的晶体构造能力获得最好的成果,而生成这些数据须要时光、金钱和经历。
这些办法同时很难处置静态的卵白,没法靠得住地对候选者的优秀性停止排序。从机械进修算法的角度而言,它们的表示取决于为其供给基础的培训数据集,当它们碰到与之前见过的份子类似度极低的化合物,算法的表示便会很蹩脚。除此以外,全部法式好像黑箱功课,没法得知机械进修为什么猜测某个化合物是优越的婚配。
很多盘算办法还有一个末路人的地方就是经常给出难以在试验室分解的化合物。化学家不能不辛苦的想方法分解候选化合物,能够要消费几个月乃至更长。即使如斯,分解的份子也不克不及包管有感化。Reymond的办法今朝猜测化合物活性的精确率唯一5~10%,这意味着化学家不能不辛劳测验考试多达20种化合物来找到个中一种相符希冀的。Reymond 表现:“我们摸索化学药物宇宙的瓶颈是在于分解化合物的才能。”为懂得决这个成绩,他比来将他的化学物资宇宙缩减到1000万种易分解,同时仍笼罩普遍特点的份子。
美国马萨诸塞州Relay Therapeutics公司的首席迷信官Mark Murcko以为盘算化学家应当少存眷新的算法战略而将留意力放在进步算法的培训数据集。他表现:“我所晓得的让一个猜测模子变得更精确的好办法之一就是给它更多更好的数据。” Relay和其他公司勉励化学家和盘算迷信家亲密协作,分解由人类和算法配合建议的化合物,同时依据获得的成果来进改良将来的决议计划。
关于Hopkins,如许的协作相当主要。盘算机迷信家曾消费数十年来写可以或许克服围棋年夜师的法式。在1997年,IBM的深蓝击败了Garry Kasparov。但是如许的掉败其实不意味着围棋的停止。相反,Kasparov设置了一场双人竞赛,每队有一小我类一小我工智能。Hopkins 表现:“人类和人工智能一路能胜过任何人,异样也胜过任何算法。” 他愿望用异样的方法将数据剖析、发明性和知识相联合来转变药物发明,“我信任我们如今正处在Kasparov与深蓝结合的时辰”。
*原文以The drug-maker's guide to the galaxy为题目,宣布在2017年12月26日的《天然》消息特写上。原文作者为阿谢尔?穆拉德(Asher Mullard)。