美国麻省理工学院和塔夫茨大学研讨人员设计出一种依据大型言语模型(如ChatGPT)的人工智能算法,这种称为ConPLex的新模型可将方针蛋白与潜在的药物分子相匹配,而无需履行核算分子结构的密集型进程。相关论文发表在最新一期《美国国家科学院院刊》上。

}05UKIHE73V}R]DU$XNC]37.png

  使用这种办法,研讨人员可在一天内挑选超越1亿种化合物,比任何现有模型都要多得多。这项成果解决了对当时药物挑选的需求,其可扩展性还能够评价脱靶效应、药物再利用以及确认突变对药物结合的影响。

  近年来,科学家在依据氨基酸序列猜测蛋白质结构方面取得了巨大进步。然而,要猜测大型潜在药物库如何与致癌蛋白相互作用,依然具有挑战性,因为核算蛋白质三维结构需求很多时刻和核算才能。

  麻省理工学院团队以他们2019年初次开发的蛋白质模型为根底,此次将模型应用于确认蛋白质序列将与特定药物分子的相互作用。他们用已知的蛋白质—药物相互作用对网络进行训练,使其能学习将蛋白质特定特征与药物结合才能联系起来,而无需核算任何分子的三维结构。

  经过挑选包括约4700种候选药物分子的库,团队测试了他们的模型,并确认了这些药物与51种蛋白激酶结合的才能。

  从抢手成果中,研讨人员挑选了19组“药物—蛋白质对”进行实验测试,最终12对具有很强的结合亲和力,而简直一切其他或许的药物—蛋白质对都没有亲和力。

  研讨人员表示,药物研制本钱之所以如此昂扬,部分原因是它的失败率很高。如果能事先猜测这种结合不或许见效,就能减少失败率,从而大大下降新药开发的本钱。

  在咱们普通人还在用言语模型聊天和写作时,科研人员现已看到了它在药物挑选方面的变革性潜力。药物研制耗时漫长且适当贵重,要做很多的“无用功”。人工智能现已被引进这一枯燥漫长的进程,协助缩短分子配对的时刻。文中介绍的新模型ConPLex能够分析很多文本,并找到最或许呈现在一起的组合。这种依据言语模型研讨的思路,逾越了目前最先进的算法,可在一天内挑选超越1亿种化合物。论文现已对挑选成果进行了实验检测,成果也令人欢喜。