AI生物学家:当「基础模型」撞上「生物学混沌」,谁才是解谜高手?
欢迎各位小伙伴来到golang学习网,相聚于此都是缘哈哈哈!今天我给大家带来《AI生物学家:当「基础模型」撞上「生物学混沌」,谁才是解谜高手?》,这篇文章主要讲到等等知识,如果你对科技周边相关的知识非常感兴趣或者正在自学,都可以关注我,我会持续更新相关文章!当然,有什么建议也欢迎在评论留言提出!一起学习!
编辑丨toileter
在当今蓬勃发展的AI生物学领域,“基础模型”成为最热门的词汇。研究者们纷纷尝试将海量数据输入更大规模的模型,以期实现突破性的计算和测试。
人们憧憬着虚拟细胞模型能够预测细胞对化学扰动的反应,蛋白质语言模型能够识别更高效的塑料降解酶或具有更佳药物特性的蛋白质结合剂。这些模型建立在日益丰富的基因组数据之上,预示着生物学研究的光明前景。
然而,FutureHouse联合创始人兼首席执行官Sam Rodriques持有不同观点。他认为,真正的生物学研究并非如此。例如,在NeurIPS(神经信息处理系统会议)等AI生物学会议上,真正的生物学家参与度并不高。他亲身经历了上个月在温哥华举办的会议。
将这些旨在推动生物发现的基础模型的宏伟蓝图与《Nature》和《Science》期刊近期发表的论文进行对比,我们会发现一些有趣的现象:
- 一篇关于长链非编码RNA(eRNA)如何通过形成R环来塑造情绪体验并诱导行为适应的论文——研究人员在小鼠实验中发现了一种IncRNA,这种RNA响应神经元活动表达,调节染色质的三维结构,从而激活参与神经元可塑性的基因。研究进一步证实,这种IncRNA对于某些形式的学习至关重要。
论文链接:https://www.science.org/doi/10.1126/science.adp1562
- 一篇关于癌细胞如何损害单核细胞介导的T细胞刺激以逃避免疫系统的论文——研究人员发现,小鼠黑色素瘤细胞分泌一种脂质代谢物,这种代谢物阻止单核细胞激活CD8+T细胞。
论文链接:https://www.nature.com/articles/s41586-024-08257-4
- 一篇关于钙调磷酸酶和PKA之间突触后竞争如何调节哺乳动物睡眠-觉醒周期的论文——通过构建小鼠基因敲除系,研究人员确定了对调节睡眠-觉醒周期至关重要的磷酸酶和激酶,并表明其作用机制是通过调节兴奋性突触后位点的蛋白质。
论文链接:https://www.nature.com/articles/s41586-024-08132-2
Sam坦言,他难以想象这些发现是如何从多模态生物学基础模型中直接获得的。这并非危言耸听。基础模型或许能够识别第一篇论文中的IncRNA,但它无法解释IncRNA与染色质重塑之间的联系。
同样,具有足够数据的多模态基础模型或许能够识别与接受特定治疗的黑色素瘤细胞相关的代谢变化,但Sam并不认为该模型能够解释这些代谢物在抑制CD8+T细胞活化中的作用。实际上,他认为目前正在开发的任何基础模型都无法产生这些论文中描述的那种丰富的新生物学见解,而这些见解正是新疗法的源泉。
Sam认为,问题在于机器学习模型擅长处理结构化数据,因此所有正在构建的基础模型都高度结构化。它们以蛋白质序列作为输入,并产生蛋白质序列作为输出;以细胞状态和化学扰动作为输入,并产生新的细胞状态作为输出。
然而,生物学的结构性很差。IncRNA的发现就是一个很好的例子:研究人员该如何用结构化表示来描述IncRNA在调节染色质结构中的作用?蛋白质模型无法表示它,DNA模型也无法表示它,虚拟细胞模型同样无法表示它。或许一个包含RNA表达和三维基因组状态的模型可以尝试,但该模型又该如何表示单核细胞的脂质调节呢?
Sam担心,每一个发现可能都需要它自己独特的表示空间。事实上,生物学的本质决定了,如果没有整个有机体的原子分辨率真实空间模型,可能就没有足够多样性的表示来描述与疾病相关的生物现象。而这样的全生物模型还遥不可及——目前还没有任何计算机模型能够完全模拟单个活细胞的复杂性。
当然,自然语言是个例外,它已经发展到能够表示人类所能思考的所有概念。事实上,Sam认为自然语言最终将成为生物学研究中不可或缺的工具,因为它目前是唯一一种既具有适合机器学习的结构,又足够灵活地表示生物概念全部多样性的媒介。
将语言和生物学结合起来的一种方法是使用代理,例如FutureHouse构建的代理。语言代理是一种语言模型(例如ChatGPT),它可以使用文献检索工具(例如PubMed)、蛋白质结构预测工具(例如AlphaFold)、DNA分析工具(例如BLAST)等,以与人类相同的方式分析生物数据,但速度更快,规模更大。
FutureHouse最近部署了一个名为PaperQA2的代理,用于搜索文献,并为人类基因组中几乎所有蛋白质编码基因撰写准确且有参考文献支持的维基百科风格的文章。未来,语言代理将能够自动分析实验数据和临床报告,从而提出详细的生物学假设,类似于上述《Nature》和《Science》论文中的假设。
文章链接:https://wikicrow.ai/ZMYM3
还有一些其他的方法可以将语言和生物学结合起来。将自然语言与蛋白质、DNA、转录组学数据等结合训练的模型也可能非常有效,前提是添加结构化数据类型不会限制它们表示非结构化概念的能力。
生物学的发展史建立在人类在自然界中发现并用于研究生物现象的工具之上,CRISPR就是一个最新的有力例子。Sam如是说道。
正如所有生物学家都知道的那样,试图从头开始设计事物几乎总是行不通的,有效的方法是在自然界中寻找事物并加以利用。如果事实证明FutureHouse的工程方法不足以用于生物学研究,而古老的自然语言恰好是我们发现的另一种自然工具,必须用于解开生物学的奥秘,那么这在美学上将是令人愉悦的。
好了,本文到此结束,带大家了解了《AI生物学家:当「基础模型」撞上「生物学混沌」,谁才是解谜高手?》,希望本文对你有所帮助!关注golang学习网公众号,给大家分享更多科技周边知识!

- 上一篇
- ios小圆点在哪设置?小编教你在ios11.2中开启小圆点的方法

- 下一篇
- 发现高能钠离子电池成分,机器学习简化最佳材料搜索过程
-
- 科技周边 · 人工智能 | 4分钟前 | 特斯拉 销量 Cybertruck 美国市场 库存积压
- 特斯拉库存告急!全美紧急征用停车场,销量真相曝光
- 318浏览 收藏
-
- 科技周边 · 人工智能 | 9分钟前 |
- AI生成证件照?未来趋势与发展全解析
- 114浏览 收藏
-
- 科技周边 · 人工智能 | 11分钟前 |
- 理想高管曝被催单!MEGAHome火了,产能加速提升
- 147浏览 收藏
-
- 科技周边 · 人工智能 | 22分钟前 | 准确率 知识库 局限性 NotionAIQ&A 问答
- NotionAIQ&A功能详解:手把手教你从知识库揪出精准答案
- 391浏览 收藏
-
- 科技周边 · 人工智能 | 23分钟前 |
- Perplexity+谷歌表格,手把手教你实现网络数据自动填充!
- 430浏览 收藏
-
- 科技周边 · 人工智能 | 42分钟前 |
- 豆包AI手把手教学,用代码轻松玩转OpenCV图像处理!
- 119浏览 收藏
-
- 科技周边 · 人工智能 | 52分钟前 | 字节跳动 TikTokShop 美国电商 人事调整 禁令期限
- TikTokShop大变革!中国区员工或成核心力量
- 462浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 484次学习
-
- 茅茅虫AIGC检测
- 茅茅虫AIGC检测,湖南茅茅虫科技有限公司倾力打造,运用NLP技术精准识别AI生成文本,提供论文、专著等学术文本的AIGC检测服务。支持多种格式,生成可视化报告,保障您的学术诚信和内容质量。
- 93次使用
-
- 赛林匹克平台(Challympics)
- 探索赛林匹克平台Challympics,一个聚焦人工智能、算力算法、量子计算等前沿技术的赛事聚合平台。连接产学研用,助力科技创新与产业升级。
- 100次使用
-
- 笔格AIPPT
- SEO 笔格AIPPT是135编辑器推出的AI智能PPT制作平台,依托DeepSeek大模型,实现智能大纲生成、一键PPT生成、AI文字优化、图像生成等功能。免费试用,提升PPT制作效率,适用于商务演示、教育培训等多种场景。
- 105次使用
-
- 稿定PPT
- 告别PPT制作难题!稿定PPT提供海量模板、AI智能生成、在线协作,助您轻松制作专业演示文稿。职场办公、教育学习、企业服务全覆盖,降本增效,释放创意!
- 99次使用
-
- Suno苏诺中文版
- 探索Suno苏诺中文版,一款颠覆传统音乐创作的AI平台。无需专业技能,轻松创作个性化音乐。智能词曲生成、风格迁移、海量音效,释放您的音乐灵感!
- 97次使用
-
- GPT-4王者加冕!读图做题性能炸天,凭自己就能考上斯坦福
- 2023-04-25 501浏览
-
- 单块V100训练模型提速72倍!尤洋团队新成果获AAAI 2023杰出论文奖
- 2023-04-24 501浏览
-
- ChatGPT 真的会接管世界吗?
- 2023-04-13 501浏览
-
- VR的终极形态是「假眼」?Neuralink前联合创始人掏出新产品:科学之眼!
- 2023-04-30 501浏览
-
- 实现实时制造可视性优势有哪些?
- 2023-04-15 501浏览