当前位置:首页 > 文章列表 > 科技周边 > 人工智能 > 性能远超当前SOTA,首个可解释RNA的AI植物基础模型来了,整合1124种植物RNA信息

性能远超当前SOTA,首个可解释RNA的AI植物基础模型来了,整合1124种植物RNA信息

2024-12-18 09:06:57 0浏览 收藏

从现在开始,努力学习吧!本文《性能远超当前SOTA,首个可解释RNA的AI植物基础模型来了,整合1124种植物RNA信息》主要讲解了等等相关知识点,我会在golang学习网中持续更新相关的系列文章,欢迎大家关注并积极留言建议。下面就先一起来看一下本篇正文内容吧,希望能帮到你!

植物RNA的复杂序列蕴含着丰富的生物调控信息,这些信息在植物生长发育和环境适应中扮演着关键角色。近期,基于基础模型(FM)的最新研究成果展现了其在解读生物学“语言”方面的巨大潜力。来自东北师范大学、英国约翰·英尼斯中心和埃克塞特大学的研究团队开发了PlantRNA-FM,一款专为植物设计的、高性能且可解释的RNA基础模型。

图片

该模型整合了来自1124种植物物种的RNA序列和结构信息,在植物特异性下游任务中表现出色,其基因区域注释F1评分高达0.974,显著优于现有最佳模型(0.639)。PlantRNA-FM拥有强大的可解释性框架,能够识别具有生物学功能的RNA序列和结构基序,包括跨转录组的二级和三级结构基序,从而帮助植物学家破译植物中的RNA密码。这项研究成果已发表在《Nature Machine Intelligence》杂志上。

图片

研究团队通过实验验证了PlantRNA-FM在识别植物翻译相关RNA基序方面的能力,并强调了这些功能性RNA基序在基因区域位置信息的重要性。

PlantRNA-FM模型详解

随着AI领域基础模型的兴起,生命科学研究也迎来了新的机遇。基础模型通常包含数百万甚至数十亿个参数,通过自监督学习方式对海量未标记数据进行预训练,这为生物学研究提供了理想的数据基础。更重要的是,基础模型具有高度适应性,可以微调以解决复杂的生物学问题。

为了理解RNA,研究人员利用RNA序列信息对PlantRNA-FM进行预训练。然而,仅有序列信息是不够的,因为RNA的二级和三级结构基序对其功能至关重要。PlantRNA-FM创新性地整合了来自1124种植物物种的RNA序列、注释和结构信息,全面捕捉了植物转录组的多样性。

图片

图1:PlantRNA-FM预训练阶段示意图。

PlantRNA-FM在转录组水平上鉴定了对翻译功能至关重要的RNA基序,包括RNA序列以及二级和三级结构基序。这一成果标志着在解读转录组中核苷酸复杂调控密码方面取得了重大进展,为基于RNA的基因调控研究开辟了新的途径。

卓越性能与实际应用

研究团队利用1124个物种的转录组测序数据构建了PlantRNA-FM的预训练数据集,并针对RNA理解而非生成进行了优化。其标记化方法确保了在预训练过程中RNA结构基序的完整性。此外,他们还整合了RNA注释信息(CDS和UTR)并采用了先进的预训练技术。

PlantRNA-FM在多个数据集上的F1评分分别为0.750、0.924和0.981,显著高于其他模型。得益于对RNA结构信息的整合,PlantRNA-FM能够更准确地预测RNA结构。在与其他四个先进FM的基准测试中,PlantRNA-FM在植物特异性数据集上的基因区域注释预测中,F1评分领先第二名近50%。

图片

图2:在植物特异性数据集上微调PlantRNA-FM。

研究团队还建立了一个可解释性框架,并开发了真实模型和背景模型进行对比分析,结果表明真实模型成功学习了相关RNA特征。

图片

图3:模型可解释框架揭示了翻译相关的RNA特征。

通过注意力对比矩阵和无监督分层聚类策略,研究团队进一步确定了与翻译相关的RNA二级结构基序,并发现了高GC碱基对的低翻译相关基序与GC和AU碱基对比例平衡的高翻译相关基序之间的差异。PlantRNA-FM还能够识别转录组中的功能性RNA三级结构基序,例如rG4s。

开创性意义

PlantRNA-FM能够全面分析功能性RNA基序的类型、基因位置及其对基因表达的调控作用,这比传统的基因分析方法更具优势。该模型的开发是AI技术在植物科学领域的重大突破,有望推动植物科学研究和创新,并可能应用于其他生物学研究领域,对作物改良和下一代基于AI的基因设计产生深远影响。PlantRNA-FM是首个整合RNA序列和结构信息的可解释RNA基础模型,它为破译RNA密码,理解和调控植物基因表达提供了全新的视角。

原文链接:https://www.nature.com/articles/s42256-024-00946-z

相关报道:https://phys.org/news/2024-12-ai-rna-language-life.html

源代码:https://huggingface.co/yangheng/PlantRNA-FM

以上就是《性能远超当前SOTA,首个可解释RNA的AI植物基础模型来了,整合1124种植物RNA信息》的详细内容,更多关于理论,植物,生物学,RNA的资料请关注golang学习网公众号!

合并排序:大型数据集的分而治之合并排序:大型数据集的分而治之
上一篇
合并排序:大型数据集的分而治之
国轩高科:拟合计25.14亿欧元投建斯洛伐克和摩洛哥新能源电池生产基地
下一篇
国轩高科:拟合计25.14亿欧元投建斯洛伐克和摩洛哥新能源电池生产基地
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    508次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    497次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • SEO标题协启动:AI驱动的智能对话与内容生成平台 - 提升创作效率
    协启动
    SEO摘要协启动(XieQiDong Chatbot)是由深圳协启动传媒有限公司运营的AI智能服务平台,提供多模型支持的对话服务、文档处理和图像生成工具,旨在提升用户内容创作与信息处理效率。平台支持订阅制付费,适合个人及企业用户,满足日常聊天、文案生成、学习辅助等需求。
    9次使用
  • Brev AI:零注册门槛的全功能免费AI音乐创作平台
    Brev AI
    探索Brev AI,一个无需注册即可免费使用的AI音乐创作平台,提供多功能工具如音乐生成、去人声、歌词创作等,适用于内容创作、商业配乐和个人创作,满足您的音乐需求。
    9次使用
  • AI音乐实验室:一站式AI音乐创作平台,助力音乐创作
    AI音乐实验室
    AI音乐实验室(https://www.aimusiclab.cn/)是一款专注于AI音乐创作的平台,提供从作曲到分轨的全流程工具,降低音乐创作门槛。免费与付费结合,适用于音乐爱好者、独立音乐人及内容创作者,助力提升创作效率。
    9次使用
  • SEO标题PixPro:AI驱动网页端图像处理平台,提升效率的终极解决方案
    PixPro
    SEO摘要PixPro是一款专注于网页端AI图像处理的平台,提供高效、多功能的图像处理解决方案。通过AI擦除、扩图、抠图、裁切和压缩等功能,PixPro帮助开发者和企业实现“上传即处理”的智能化升级,适用于电商、社交媒体等高频图像处理场景。了解更多PixPro的核心功能和应用案例,提升您的图像处理效率。
    9次使用
  • EasyMusic.ai:零门槛AI音乐生成平台,专业级输出助力全场景创作
    EasyMusic
    EasyMusic.ai是一款面向全场景音乐创作需求的AI音乐生成平台,提供“零门槛创作 专业级输出”的服务。无论你是内容创作者、音乐人、游戏开发者还是教育工作者,都能通过EasyMusic.ai快速生成高品质音乐,满足短视频、游戏、广告、教育等多元需求。平台支持一键生成与深度定制,积累了超10万创作者,生成超100万首音乐作品,用户满意度达99%。
    12次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码