当前位置:首页 > 文章列表 > 科技周边 > 人工智能 > 220亿晶体管,IBM机器学习专用处理器NorthPole,能效25倍提升

220亿晶体管,IBM机器学习专用处理器NorthPole,能效25倍提升

来源:机器之心 2023-10-23 15:11:33 0浏览 收藏

珍惜时间,勤奋学习!今天给大家带来《220亿晶体管,IBM机器学习专用处理器NorthPole,能效25倍提升》,正文内容主要涉及到等等,如果你正在学习科技周边,或者是对科技周边有疑问,欢迎大家关注我!后面我会持续更新相关内容的,希望都能帮到正在学习的大家!

IBM 再度发力。


随着 AI 系统的飞速发展,其能源需求也在不断增加。训练新系统需要大量的数据集和处理器时间,因此能耗极高。在某些情况下,执行一些训练好的系统,智能手机就能轻松胜任。但是,执行的次数太多,能耗也会增加。

幸运的是,有很多方法可以降低后者的能耗。IBM 和英特尔已经试验过模仿实际神经元行为设计的处理器。IBM 还测试了在相变存储器中执行神经网络计算,以避免重复访问 RAM。

现在,IBM 又推出了另一种方法。该公司的新型 NorthPole 处理器综合了上述方法的一些理念,并将其与一种非常精简的计算运行方法相结合,从而创造出一种能高效执行基于推理的神经网络的高能效芯片。在图像分类或音频转录等方面,该芯片的效率是 GPU 的 35 倍。

220亿晶体管,IBM机器学习专用处理器NorthPole,能效25倍提升

官方博客:https://research.ibm.com/blog/northpole-ibm-ai-chip

NorthPole 的不同之处 

NorthPole 与传统的 AI 处理器不同

首先,NorthPole 对训练神经网络的需求没有任何帮助,它纯粹是为执行而设计的。
其次,它不是通用的 AI 处理器,而是专门为以推理为重点的神经网络设计的。所以,如果你想用它推理、找出图像或音频片段的内容等,那么它就对了。但如果你需要运行一个大型语言模型,这款芯片看起来就没有什么太大用处了。

最后,虽然 NorthPole 借鉴了神经形态计算芯片的一些理念,但它并不是神经形态硬件,因为它的处理单元执行的是计算,而不是模拟实际神经元使用的脉冲通信。

NorthPole 和之前的 TrueNorth 一样,由一个大型计算单元阵列(16×16)组成,每个单元都包含本地内存和代码执行能力。因此,神经网络中各种连接的所有权重都可以准确地存储在需要的地方。

他还有一个特点是广泛的片上网络,至少有四种不同的网络。其中一些网络将已完成计算的信息传送到下一个需要它们的计算单元。其他网络则用于重新配置整个计算单元阵列,在上一层计算仍在进行时,提供执行一层神经网络所需的神经权重和代码。最后,优化相邻计算单元之间的通信。这对于在图像中寻找物体边缘等情况非常有用。如果在输入图像时将相邻像素分配给相邻的计算单元,它们就能更轻松地合作识别出跨越相邻像素的特征。

除此之外,NorthPole 的计算资源也不同寻常。每个单元都经过优化,可执行精度较低的计算,精度从 2 bit 到 8 bit 不等。为了保证这些执行单元的使用,它们不能根据变量值执行条件分支。也就是说,使用者的代码不能包含 if 语句。这种简单的执行方式使每个计算单元都能进行大规模并行执行。在 2 bit 精度下,每个单元可并行执行 8000 多次计算。

配套软件

由于这些独特设计,NorthPole 团队需要开发自己的训练软件,以计算出每一层成功运行所需的最低精度水平。在芯片上执行神经网络也是一个相对不寻常的过程。

一旦神经网络的权重和连接被置于芯片上的缓冲区,执行时只需要一个外部控制器上传它要运行的数据,并告诉它开始运行。其他一切运行都无需中央处理器参与,这也限制了系统级功耗。

220亿晶体管,IBM机器学习专用处理器NorthPole,能效25倍提升

NorthPole 测试芯片采用 12 纳米工艺制造,远远落后于前沿技术。尽管如此,他们还是成功地在 220 亿晶体管上安装了 256 个计算单元,每个单元拥有 768 KB 的内存。当该系统与采用类似工艺制造的英伟达 V100 Tensor Core GPU 相比时,可以发现 NorthPole 在相同功耗下的计算能力是后者的 25 倍。

在相同的条件下,NorthPole 的性能比最先进的 GPU 高出约五倍。对该系统的测试表明,它还能高效执行一系列广泛使用的神经网络任务。

今天带大家了解了的相关知识,希望对你有所帮助;关于科技周边的技术知识我们会一点点深入介绍,欢迎大家关注golang学习网公众号,一起学习编程~

版本声明
本文转载于:机器之心 如有侵犯,请联系study_golang@163.com删除
明年IT投资前景看好:增速比GDP高三倍!75%的CIO要为AI多花钱明年IT投资前景看好:增速比GDP高三倍!75%的CIO要为AI多花钱
上一篇
明年IT投资前景看好:增速比GDP高三倍!75%的CIO要为AI多花钱
聚焦计算赋能创新,第三届智能计算创新论坛成功举行
下一篇
聚焦计算赋能创新,第三届智能计算创新论坛成功举行
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    508次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    497次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • 毕业宝AIGC检测:AI生成内容检测工具,助力学术诚信
    毕业宝AIGC检测
    毕业宝AIGC检测是“毕业宝”平台的AI生成内容检测工具,专为学术场景设计,帮助用户初步判断文本的原创性和AI参与度。通过与知网、维普数据库联动,提供全面检测结果,适用于学生、研究者、教育工作者及内容创作者。
    18次使用
  • AI Make Song:零门槛AI音乐创作平台,助你轻松制作个性化音乐
    AI Make Song
    AI Make Song是一款革命性的AI音乐生成平台,提供文本和歌词转音乐的双模式输入,支持多语言及商业友好版权体系。无论你是音乐爱好者、内容创作者还是广告从业者,都能在这里实现“用文字创造音乐”的梦想。平台已生成超百万首原创音乐,覆盖全球20个国家,用户满意度高达95%。
    29次使用
  • SongGenerator.io:零门槛AI音乐生成器,快速创作高质量音乐
    SongGenerator
    探索SongGenerator.io,零门槛、全免费的AI音乐生成器。无需注册,通过简单文本输入即可生成多风格音乐,适用于内容创作者、音乐爱好者和教育工作者。日均生成量超10万次,全球50国家用户信赖。
    27次使用
  •  BeArt AI换脸:免费在线工具,轻松实现照片、视频、GIF换脸
    BeArt AI换脸
    探索BeArt AI换脸工具,免费在线使用,无需下载软件,即可对照片、视频和GIF进行高质量换脸。体验快速、流畅、无水印的换脸效果,适用于娱乐创作、影视制作、广告营销等多种场景。
    29次使用
  • SEO标题协启动:AI驱动的智能对话与内容生成平台 - 提升创作效率
    协启动
    SEO摘要协启动(XieQiDong Chatbot)是由深圳协启动传媒有限公司运营的AI智能服务平台,提供多模型支持的对话服务、文档处理和图像生成工具,旨在提升用户内容创作与信息处理效率。平台支持订阅制付费,适合个人及企业用户,满足日常聊天、文案生成、学习辅助等需求。
    31次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码