当前位置:首页 > 文章列表 > 科技周边 > 人工智能 > 多模态 DNN 模型在药物相互作用预测任务中的应用

多模态 DNN 模型在药物相互作用预测任务中的应用

来源:51CTO.COM 2023-05-18 13:32:27 0浏览 收藏

编程并不是一个机械性的工作,而是需要有思考,有创新的工作,语法是固定的,但解决问题的思路则是依靠人的思维,这就需要我们坚持学习和更新自己的知识。今天golang学习网就整理分享《多模态 DNN 模型在药物相互作用预测任务中的应用》,文章讲解的知识点主要包括,如果你对科技周边方面的知识点感兴趣,就不要错过golang学习网,在这可以对大家的知识积累有所帮助,助力开发能力的提升。

多模态 DNN 模型在药物相互作用预测任务中的应用

一、背景介绍

首先和大家分享下药物发现的相关背景。

1、背景介绍

多模态 DNN 模型在药物相互作用预测任务中的应用

药物发现领域近几年非常火热,特别是借助 AI 来辅助药厂的药物发现工作,包括药物研发。药物研发过程的周期非常长,通常某类临床疾病的首创药的研发过程需要消耗几十亿的经费以及十多年的时间。主要分为以下几个阶段:

(1)研究疾病靶点,疾病核心蛋白的确认。

(2)在临床试验前验证药物的有效性:包括药物毒性、有效性、服用方式等方面的研究。

(3)临床试验。

(4)FDA 审批认证。

所以传统药物研发流程周期非常长。此外,从初识的 10000 多种药物,到 5 种药物进入临床试验阶段,最后到只用 1 种药物批准上市。在这个背景下,如何辅助药厂更快的从候选药物中筛选出有效药物,且能在临床测试阶段更快的预研药物可能带来的影响、作用、有效性等成为了比较热门的研究领域,其中 AI 特别是深度神经网络技术能大大加速药物研发流程。

多模态 DNN 模型在药物相互作用预测任务中的应用

今天分享的内容不涉及药物筛选,主要集中在候选药物的副作用和疗效,主要研究目的是降低药物毒性,提高药物有效性。

如上图所示,DDI(Drug-Drug Interaction)是指药物与药物间的相互作用。将研究药物与已有药物进行交叉分析,发现研究药物的副作用,如对身体的影响等,通过试验提前进行发现归类。简单举例,“是药三分毒”,药物的毒性主要体现在哪里?很多情况下是因为药物与其他药物联用产生的,两种或多种药物间产生了化学作用。右下角图中展示了 3 种药物,其中伊曲康唑(Itraconazole)是治疗肿瘤相关药物,如果将它和阿贝西利(abemaciclib)混合服用将会引起很严重的副作用,如肝衰竭,肝肾功能不全的患者使用这两种药物将会引起严重后果。如果将阿贝西利和达拉非尼(Dabrafenib)混用,将会导致血清浓度下降从而引发其他疾病。故在研发新药的过程中需要进行大量的试验,但不可能用真人进行试验,只能用小白鼠或其他动物进行试验。

今天分享的内容即是,通过多模态神经网络基于已有的(包括正在研发和已知的)药物成分、过敏情况等,对药物 DDI 进行提前预测。

2、问题提出

多模态 DNN 模型在药物相互作用预测任务中的应用

如上图所示,可以将药物相互作用归纳为 DDI 矩阵,矩阵中描述了药物相互作用的结果,如药物 d1(阿贝西利)和 d2(达拉非尼)会导致 y1(血清浓度下降)。本研究中纳入了 37264 条 DDI 数据,其中涉及了 572 种药物(d)及 65 种反应结果(y,如血清浓度下降等)。并基于此数据构建了药物知识图谱(DKG,Drug Knowledge Graph):其中节点是药物,边是药物间的关系。DKG 三元组是 {D:药物, R:药物间关系, T:尾实体}。

除了以上数据,多模态模型还融合了药物的异构特征(HF,Heterogeneous Features):{Target:作用靶点,substructure:组成成分/化学结构, enzyme:酶},每个特征的维度不同,如靶点信息是一种蛋白。最后将 DDI 矩阵,DKG 和 HF 融合在同一个概率分布上进行建模。

二、MDNN 模型介绍

接下来将介绍异构多模态 MDNN 模型的框架。

1、MDNN 整体框架

多模态 DNN 模型在药物相互作用预测任务中的应用

本模型简称 MDNN,基础数据主要分为 DDI 矩阵和异构数据两个部分,模型框架主要由以下三个部分组成:

(1)基于 DKG 部分:主要是通过构建药物知识图谱来表达药物本身的成分(有效成分、毒性成分)、药物间关系等的信息。

(2)基于 HF 部分:通过整合靶点、酶、分子结构等异构特征数据来描述药物自身的基础特征信息。

(3)多模态融合神经网络:将 DKG 和 HF 两部分特征数据进行有效融合,对融合数据进行统一建模。

2、DKG 模块构建

下面将介绍基于 DKG 的构建过程。

多模态 DNN 模型在药物相互作用预测任务中的应用

上图展示了药物知识图谱的主要内容,左图是 DDI 矩阵,矩阵中包含了接近 600 种药物,这些药物的成分和作用信息都存储在数据库(DrugBank,即“药物银行”)中。右图举例展示了“药物银行”中的药物信息,如酶、载体、靶点等异构基础特征,其中有 4 种特征是比较重要的,以药物 DB05812 为例,除靶点(target)、酶(enzyme)、分子结构以外,还有载体(carrier)和转运体(transporter),但这两种数据相对比较稀疏,没有其他特征那么多的维度,在目前数据集上的区分度不大,故暂时未采用这两种数据。主要使用数据为靶点、酶、分子结构。

多模态 DNN 模型在药物相互作用预测任务中的应用

如上图所示,知识图谱主要由节点和边组成,其中节点为药物和成分,边为关系。示例中三元组展示的关系为毒性成分关系,即节点药物 “DB05812” 与节点成分 “P02768” 间存在毒性成分关系。基于“药物银行”中获取的药物成分关系三元组构成了 DKG 知识图谱,其中包含 572 种药物,三元组的边(关系)称为语义关系(semantic relation),共有 157 种关系类型,成分尾实体节点有 1043 种。每次 DKG 可根据任务需求从“药物银行”中抽取相应的信息进行构建,故 DKG 相当于是“药物银行”知识图谱中的子图。

多模态 DNN 模型在药物相互作用预测任务中的应用

基于 DKG,总结了两种信息,上图展示了语义关系信息模型的构建。基于毒性成分,首先计算上一层药物(d)和关系(r)的内积,通过当前层权重(W1)进行求和得到 π 函数,即药物的边和节点信息通过 π 函数求和到一起,再将 π 函数和上一层成分(t)进行加权求和得到 e,即获得了边的信息。

多模态 DNN 模型在药物相互作用预测任务中的应用

类似的,上图展示了图的拓扑结构信息模型的构建。药物除了毒性成分外,还可能包含其他多种成分关系,可以将同一药物的多种关系(边,即 e)及其对应的权重 W2 连接起来,最终得到每个药物对应的 E。通过上述方式将 DKG 边和拓扑结构信息进行了有效的融合表示。

3、HF 模块构建

如下图,除上述提到的边信息和 DDI 信息外,药物还存在着非常丰富的多模态信息:同一种药物可以对多个靶点起作用;各种药物也有各自不同的分子结构,代表了其对应的分子特性;药物在不同酶的作用下会和不同的靶点结合。将这三种信息进行向量化表示,然后通过简单的 Jaccard 相似度来度量药物间的相似度,得到对应的相似度矩阵。

多模态 DNN 模型在药物相互作用预测任务中的应用

多模态 DNN 模型在药物相互作用预测任务中的应用

最后融合三种相似度矩阵得到每种药物对应的 E',即获得了药物基于异构特征的信息。本特征向量的维度也不大,包括了 1162 种靶点,583 种结构和 202 种酶的信息。

4、多模型融合层

多模态 DNN 模型在药物相互作用预测任务中的应用

如上图所示,最终通过融合层对每个药物的 DKG 结果 E 和 HF 结果 E' 进行拼接融合得到:

多模态 DNN 模型在药物相互作用预测任务中的应用

再通过 softmax 函数得到输出层:

多模态 DNN 模型在药物相互作用预测任务中的应用

多模态 DNN 模型在药物相互作用预测任务中的应用

整个模型框架如上图,框架结构并不复杂,但对药物信息进行了相对有效的结合。

三、MDNN 模型效果

接下来和大家分享一下模型效果。

多模态 DNN 模型在药物相互作用预测任务中的应用

上图展示了与当前应用较为普遍的算法的对比结果,MDNN 算法在 Acc、AUC、F1、AUPR、Precision、Recall 等评价指标上均取得了 State of the Art 的结果。(以上算法没有纳入 GNN 算法。)

多模态 DNN 模型在药物相互作用预测任务中的应用

上图展示了 MDNN 融合 DKG、HK 和不融合的效果间差异。很容易看出,融合后的结果比单独使用某一种方法的效果要更好。

多模态 DNN 模型在药物相互作用预测任务中的应用

关于多模态调参,即参数敏感度的分析如上图,分别展示了神经网络层数 l,节点数 Ns等参数变化时,各个评价指标对应的波动情况。

多模态 DNN 模型在药物相互作用预测任务中的应用

此外还进行了多任务分析,任务 A 预测模型通过训练集构建,来预测训练集药物和测试集药物间的 DDI;任务 B 的预测模型也通过训练集构建,但预测测试集药物间的 DDI。即将训练集和测试集药物严格分开的的话,模型预测效果有显著下降。

在药物研发领域还存在许多亟待解决的问题:如何有效的发现/筛选药物,而不是局限于研究 DDI。

四、总结

最后总结一下本次分享的内容,MDNN 算法本身不算复杂,最重要的工作是利用了多模态数据和结构信息:

多模态 DNN 模型在药物相互作用预测任务中的应用

(1)基于药物效果构建了药物知识图谱,基于药物本身特性(靶点、分子结构、酶)构建了多模态数据特征,最终融合这两部分特征构建了 MDNN 模型。

(2)对 DDI 的预测问题进行了改进;

(3)与已有方法对比,MDNN 在数据集上的效果最好。

但在实际应用上,MDNN 模型还存在很多需要进一步优化和改进的地方,如更好的方法论或更好的数据。

五、问答环节

Q1:“药物银行”数据集是公开数据集吗?

A1:本研究知识图谱数据集是公开的,原始数据集“药物银行”也是公开数据集。但根据每个研究领域的药物的不同,所构建的知识图谱数据集也会有差异,没有一个统一通用的知识图谱。

Q2:所分享的研究方法如知识图谱、多模态融合等,在制药领域以外还有什么应用?如蛋白质、免疫等?

A2:除生物制药外,在电商领域的应用非常多。如 User-Item 类的数据集,User 有很多多模态信息,如职业、年龄、购物标签等,Item 商品也有很多信息,它们间的关系也有非常多,如购物、评价、收藏夹、点击等行为。领域数据如果符合异构形态,都可以尝试使用这些方法进行分析,难点在于构建特定领域的知识图谱。

文中关于AI,DNN 模型的知识介绍,希望对你的学习有所帮助!若是受益匪浅,那就动动鼠标收藏这篇《多模态 DNN 模型在药物相互作用预测任务中的应用》文章吧,也可关注golang学习网公众号了解相关技术文章。

版本声明
本文转载于:51CTO.COM 如有侵犯,请联系study_golang@163.com删除
研究人员训练人工智能解码人类思想研究人员训练人工智能解码人类思想
上一篇
研究人员训练人工智能解码人类思想
公司高管们担心与ChatGPT意外共享公司数据
下一篇
公司高管们担心与ChatGPT意外共享公司数据
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    508次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    497次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • AI Make Song:零门槛AI音乐创作平台,助你轻松制作个性化音乐
    AI Make Song
    AI Make Song是一款革命性的AI音乐生成平台,提供文本和歌词转音乐的双模式输入,支持多语言及商业友好版权体系。无论你是音乐爱好者、内容创作者还是广告从业者,都能在这里实现“用文字创造音乐”的梦想。平台已生成超百万首原创音乐,覆盖全球20个国家,用户满意度高达95%。
    24次使用
  • SongGenerator.io:零门槛AI音乐生成器,快速创作高质量音乐
    SongGenerator
    探索SongGenerator.io,零门槛、全免费的AI音乐生成器。无需注册,通过简单文本输入即可生成多风格音乐,适用于内容创作者、音乐爱好者和教育工作者。日均生成量超10万次,全球50国家用户信赖。
    19次使用
  •  BeArt AI换脸:免费在线工具,轻松实现照片、视频、GIF换脸
    BeArt AI换脸
    探索BeArt AI换脸工具,免费在线使用,无需下载软件,即可对照片、视频和GIF进行高质量换脸。体验快速、流畅、无水印的换脸效果,适用于娱乐创作、影视制作、广告营销等多种场景。
    20次使用
  • SEO标题协启动:AI驱动的智能对话与内容生成平台 - 提升创作效率
    协启动
    SEO摘要协启动(XieQiDong Chatbot)是由深圳协启动传媒有限公司运营的AI智能服务平台,提供多模型支持的对话服务、文档处理和图像生成工具,旨在提升用户内容创作与信息处理效率。平台支持订阅制付费,适合个人及企业用户,满足日常聊天、文案生成、学习辅助等需求。
    21次使用
  • Brev AI:零注册门槛的全功能免费AI音乐创作平台
    Brev AI
    探索Brev AI,一个无需注册即可免费使用的AI音乐创作平台,提供多功能工具如音乐生成、去人声、歌词创作等,适用于内容创作、商业配乐和个人创作,满足您的音乐需求。
    23次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码