重磅发布,「类脑科学」或是人工智能大语言模型算力消耗与上下文长度问题最优解!
今日不肯埋头,明日何以抬头!每日一句努力自己的话哈哈~哈喽,今天我将给大家带来一篇《重磅发布,「类脑科学」或是人工智能大语言模型算力消耗与上下文长度问题最优解!》,主要内容是讲解等等,感兴趣的朋友可以收藏或者有更好的建议在评论提出,我都会认真看的!大家一起进步,一起学习!
在一场科幻与科学的盛会上,科幻突然照进了现实。
近日,在深圳先进院,深圳理工大学教育基金会和科学与幻想成长基金开办了一场以科幻和AI涌现为背景的活动。一个来自深圳名为陆兮科技的团队,首次公开发布了他们的人工智能大语言模型---NLM(Neuromorphic Generative Pre-trained Language Model),一个不基于Transformer的大语言模型。
与国内外众多的大模型不同的是,该团队以类脑科学与类脑智能为核心,同时融合循环神经网络的特性,以大脑的高效运算特性为启发开发大语言模型。
更惊人的是,该模型在同级别参数下的算力消耗为Transformer架构的1/22;在上下文长度问题上,NLM也交出了满分答卷:上下文长度窗口可以实现无限增长,无论是开源LLM的2k限制,又或是其他32k,100k的上下文长度限制都不在话下。
什么是类脑计算?
类脑计算是一种模仿人脑结构和功能的计算模式,它在架构、设计原理和信息处理方式上模拟人脑的神经网络连接。这种计算不仅仅是简单地尝试模拟生物神经网络的表面特征,而是深入到如何模拟生物神经网络的基本构造方式——即通过神经元和突触的大规模互联来处理和存储序列信息。
与传统的基于规则的算法不同,类脑计算依赖于大量的互联神经网络自主学习和提取信息,就像人类大脑一样。这种方法允许计算系统从经验中学习、适应新情况、理解复杂的模式,并能进行高级决策和预测。
由于其高度的自适应性和并行处理能力,类脑计算系统在处理大数据、图像和语音识别、自然语言处理等领域表现出了极高的效率和准确性。这些系统不仅能快速处理复杂多变的信息,而且在能耗和计算资源上远远低于传统的计算架构,因为它们不需要进行大量的预先编程和数据输入。
总的来说,类脑计算开辟了一种全新的计算范式。它超越了传统的人工神经网络,向着能够自我学习、自我组织、甚至具有一定自我意识的高级智能系统迈进。
类脑大模型的先进性
在活动上,陆兮团队的周芃博士详细解释了类脑大模型的实现机理。
作为新一代的神经网络模型,又称类脑神经网络,它突破了前两代神经网络的缺点。
-第一代神经网络(又称:MLP多层感知机),在传输信号上为0和1,无法处理过于复杂的任务,算力开销也不多。
-第二代神经网络,也就是人工神经网络,将传输信号变为了[0-1]的连续区间,有了足够的复杂度,但是算力开销也飙升。
- 第三代神经网络,也就是类脑神经网络,将信号变成了脉冲序列,拥有足够复杂度的同时,也将算力开销变得可控。这种脉冲序列是模仿神经结构中的动力学特性得以实现的。同时,序列意味着时间,第三代神经网络可以有效的将信息中的时间信息融合和输出。
-相较于前两代神经网络,它更有效地处理有时间维度的序列信息,更有效地认识真实世界。
基于类脑算法的大模型,在推理时的原理也和Transformer迥然不同。在推理过程中,Transformer模型和类脑模型的运作机制存在显著差异。每当Transformer模型进行推理时,其将会综合考虑全部的上下文信息以产生下一个token。这一操作可以类比为在聊天过程中,每当我们说出一个字时,都需要回想当天所有的经历。这也是目前大型模型在参数持续增长的同时,其计算成本随之上升的主要原因。
相对而言,类脑模型在推理时只需要依赖其内部状态和一个token。这可以比喻为,我们在说话时脱口而出下一个字是什么,而不必具体回忆之前的所有情境,说话内容也与之前的经历有内在关联。此种机制是NLM能大幅减少算力开销的关键,使其能更接近人类大脑的运作方式,并因此显著提高了其性能。
同样因为脑启发的特性,上下文长度有限也不再是令人困扰的问题。使用第三代神经网络的NLM大模型由于处理下一个token时需要的算力并不跟上下文长度相关,所以不存在上下文长度的瓶颈。公开可用的Transformer架构的大语言模型上下文长度仅为100k,向上增加上下文长度不仅仅是算力开销的问题,更是“能不能”的问题。
NLM无限长度的上下文将可以打开大语言模型应用的想象力之门,无论是研究复杂的财报、阅读数十万字的小说,亦或是通过长度无限的上下文来使大模型“更懂你”,都可以成为现实。
陆兮团队眼中的AI
在这次活动上,陆兮科技的创始人CTO周芃博士阐释了团队在当下的使命-赋智万物。
一个人工智能时代,需要人工智能处处普及,正如互联网和电力已经在我们的身边处处可见。目前的人工智能在能力上虽然令人惊叹,但其运行成本却为企业和消费者带来巨大负担。绝大多数手机、手表、平板和笔记本电脑在当前技术下无法完整、系统、高效、高质量地运行生成式人工智能大语言模型,研发大模型应用的门槛也让许多有志于此的优秀开发者望而却步。
在活动现场,陆兮科技向观众展示了如何在一台普通安卓手机的离线模式下使用「NLM-GPT」大模型完成工作与生活中常见的各项任务,将活动推向了高潮。
- 参与演示的手机搭载了市面上常见的芯片架构,与C端市场常见安卓机型的性能相仿。在手机处于飞行模式、未连接网络的前提下,陆兮科技展示了「NLM- GPT」大模型在这台手机上与用户实时对话、回答用户提出的问题、完成包括诗词创作、菜谱撰写、知识检索、文件解读等复杂程度高、对手机硬件性能参数要求较高、传统意义上需要联网才能完成的各项指令。
- 整个演示过程中,手机的能耗平稳,对正常待机时长影响极低,对手机整体使用性能未造成任何影响。
-该演示成功证明了「NLM-GPT」大模型拥有在诸如智能手机、平板电脑等小型C端商用设备中全场景、高效率、低功耗、零流量消耗运行的潜力。这意味着,得益于「NLM-GPT」大模型的赋能,手机、手表、平板、笔记本电脑等设备可以更加准确高效地理解人类的真实意图,在办公、学习、社交、娱乐等各类应用场景下更高质量地完成人类提出的各项指令与任务,极大地提升社会生产和人类生活的效率与质量。
陆兮科技认为,「类脑科技」驱动的「生成式人工智能大语言模型」将全面拓展人类在学习、工作和生活等各个领域的思维力、感知力和行动力,提升全人类的整体智慧。得益于类脑科技的赋能,人工智能将不再是替代人类的新智能体,而是会成为人类改变世界、创造更加美好未来的高效智能工具。
正如古人训练了猎犬和猎鹰,但猎人这一职业并不会因为猎犬和猎鹰的出现而消失。相反,猎人因此获益,掌握了猎犬和猎鹰所拥有的、人类自身并不具有的力量,更高效地获取猎物、为人类族群的壮大和人类文明的发展提供了动力和养分。
在未来,在日常工作生活中应用人工智能大语言模型将不再是一项复杂的多流程系统工程,而是将如同「结账时打开付款码」、「拍照时按下快门」、「刷短视频时一键三连」一般简单、自然、流畅。陆兮团队将会持续耕耘于类脑计算领域,深入研究大脑这个大自然送给人类最宝贵的礼物,将类脑智能带入日常生活。
也许,在不久的将来,人类会拥有更多的人工智能新伙伴。他们身体里不流淌血液,他们的智慧不会取代人类。在类脑技术的加持下,他们将会与我们一起,共同探索宇宙的奥秘,拓宽社会的边界,创造更加美好的未来。
来源:生活报
(来源:undefined)
更多精彩资讯请在应用市场下载“极目新闻”客户端,未经授权请勿转载,欢迎提供新闻线索,一经采纳即付报酬。24小时报料热线027-86777777。
今天关于《重磅发布,「类脑科学」或是人工智能大语言模型算力消耗与上下文长度问题最优解!》的内容就介绍到这里了,是不是学起来一目了然!想要了解更多关于的内容请关注golang学习网公众号!

- 上一篇
- 生成式人工智能在软件开发过程现代化中的作用

- 下一篇
- AI算法可检测针对军用无人驾驶车辆的中间人攻击
-
- 科技周边 · 人工智能 | 7小时前 |
- MistralAI发布多模态模型MistralMedium3
- 446浏览 收藏
-
- 科技周边 · 人工智能 | 8小时前 |
- 一季度中国车出口TOP10:俄罗斯位列第三
- 318浏览 收藏
-
- 科技周边 · 人工智能 | 8小时前 |
- 即梦ai导出4K视频攻略超清分辨率设置教程
- 241浏览 收藏
-
- 科技周边 · 人工智能 | 8小时前 |
- 用豆包A/生成的表情包如何赚钱
- 326浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 484次学习
-
- PPTFake答辩PPT生成器
- PPTFake答辩PPT生成器,专为答辩准备设计,极致高效生成PPT与自述稿。智能解析内容,提供多样模板,数据可视化,贴心配套服务,灵活自主编辑,降低制作门槛,适用于各类答辩场景。
- 12次使用
-
- Lovart
- SEO摘要探索Lovart AI,这款专注于设计领域的AI智能体,通过多模态模型集成和智能任务拆解,实现全链路设计自动化。无论是品牌全案设计、广告与视频制作,还是文创内容创作,Lovart AI都能满足您的需求,提升设计效率,降低成本。
- 13次使用
-
- 美图AI抠图
- 美图AI抠图,依托CVPR 2024竞赛亚军技术,提供顶尖的图像处理解决方案。适用于证件照、商品、毛发等多场景,支持批量处理,3秒出图,零PS基础也能轻松操作,满足个人与商业需求。
- 26次使用
-
- PetGPT
- SEO摘要PetGPT 是一款基于 Python 和 PyQt 开发的智能桌面宠物程序,集成了 OpenAI 的 GPT 模型,提供上下文感知对话和主动聊天功能。用户可高度自定义宠物的外观和行为,支持插件热更新和二次开发。适用于需要陪伴和效率辅助的办公族、学生及 AI 技术爱好者。
- 25次使用
-
- 可图AI图片生成
- 探索快手旗下可灵AI2.0发布的可图AI2.0图像生成大模型,体验从文本生成图像、图像编辑到风格转绘的全链路创作。了解其技术突破、功能创新及在广告、影视、非遗等领域的应用,领先于Midjourney、DALL-E等竞品。
- 52次使用
-
- GPT-4王者加冕!读图做题性能炸天,凭自己就能考上斯坦福
- 2023-04-25 501浏览
-
- 单块V100训练模型提速72倍!尤洋团队新成果获AAAI 2023杰出论文奖
- 2023-04-24 501浏览
-
- ChatGPT 真的会接管世界吗?
- 2023-04-13 501浏览
-
- VR的终极形态是「假眼」?Neuralink前联合创始人掏出新产品:科学之眼!
- 2023-04-30 501浏览
-
- 实现实时制造可视性优势有哪些?
- 2023-04-15 501浏览