图灵奖得主Jack Dongarra:超级计算顶部还有很大空间
怎么入门科技周边编程?需要学习哪些知识点?这是新手们刚接触编程时常见的问题;下面golang学习网就来给大家整理分享一些知识点,希望能够给初学者一些帮助。本篇文章就来介绍《图灵奖得主Jack Dongarra:超级计算顶部还有很大空间》,涉及到,有需要的可以收藏一下
超级计算机可以说是科学计算界的奥运冠军。通过数值模拟,超级计算机丰富了我们对世界的理解:无论是宇宙中数光年之外的恒星、地球的天气和气候,还是人体的运作机理。
四十多年来,Jack Dongarra 一直是高性能计算领域的推动者。今年早些时候,2021 年 ACM A.M. 图灵奖授予 Dongarra,以表彰 "他对数值算法和工具库的开创性贡献,让高性能计算软件在四十多年里能够跟上硬件的指数式发展"。
本文作者 Bennie Mols 于 9 月在德国举行的第九届海德堡桂冠论坛期间见到了 Dongarra,并探讨了高性能计算的当下和未来。现年 72 岁的 Dongarra 是田纳西大学的特聘教授,自 1989 年以来一直是美国能源部橡树岭国家实验室的特聘研究人员。Bennie Mols 是驻荷兰阿姆斯特丹的科学和技术作家。
以下是采访内容
Q1:几十年来,您进行科学研究的动力是什么?
A:我主攻的是数学方面的研究,尤其是数值线性代数方面,我所有的工作都源于此。对于诸如物理和化学这类需要计算——尤其是解线性方程组——的学科来说,一款能计算答案的软件无疑是非常重要的。同时,你还必须确保软件的运行与机器的架构相一致,这样才能真正获得机器所能达到的高性能。
Q2:对于在超级计算机上运行的软件来说,最重要的要求是什么?
A:我们希望该软件的计算结果是准确的。我们希望科学界能够使用和理解这个软件,甚至可以对其改进作出贡献。我们希望软件性能良好,可以在不同的机器上移植。我们希望代码是可读的、可靠的。最后,我们希望软件能够提高使用它的人的生产力。
开发满足所有这些要求的软件是一个非同小可的过程。这种级别的工程往往有数百万行的代码,而且大约每隔 10 年,我们就会看到机器架构发生一些重大变化。这将导致我们需要对算法和体现这些算法的软件进行重构。软件跟着硬件走,在超级计算的顶层仍有很大的空间,来达到更好的机器性能。
Q3:目前在高性能计算方面有什么令你兴奋的发展?
A:我们的高性能超级计算机是建立在第三方元件上的,比方说你和我也能买到高端芯片,只是高性能计算机上需要很多。通常我们在高性能计算机上面以 GPU 的形式使用一些加速器。我们将多个芯片开发板放在一个机架上,许多这样的机架一起组成一台超级计算机。我们使用第三方元器件的原因在于它更便宜,但如果你专门设计芯片来做科学计算,你会得到性能更好的超级计算机,这是一个令人兴奋的想法。
事实上,这正是亚马逊、Facebook、谷歌、微软、腾讯、百度和阿里巴巴等公司正在做的事情;他们正在制造自己的芯片。他们可以这样做,因为他们有庞大的资金,而高校的资金是有限的,因此不幸地不得不使用第三方的产品。这与我的另一个担忧有关:我们如何将人才留在科学领域,而不是看到他们去为报酬更高的大公司工作?
Q4:对于高性能计算的未来,还有哪些重要的发展?
A:确实有一些重要的事情。很明显,机器学习已经对科学计算产生了重要影响,而且这种影响只会越来越大。我认为机器学习是一种工具,有助于解决计算科学家想要解决的问题。
这与另一个重要的发展相辅相成。传统上,我们的硬件使用 64 位浮点运算,所以数字也用 64 位表示。但是,如果你使用更少的比特,例如 32、16、甚至 8 比特,你可以加快计算速度。但是加快计算速度,就会失去精度。然而,人工智能的计算看起来往往可以用更少的比特,16 甚至 8 比特来完成。这是一个需要探究的领域,我们需要找出在什么情况下缩减位数效果好,什么情况下效果不好。
另一个研究领域是关于如何从低精度的计算开始,得到一个近似值,然后再使用更高精度的计算来细化结果。
Q5:超级计算机的功耗如何?
A:现在性能最好的超级计算机消耗 20 或 30 兆瓦,以达到每秒百亿亿次浮点运算的速度。如果地球上的每个人每秒钟做一次计算,那么需要四年多的时间才能完成超大规模计算机在一秒钟内完成的工作。可能在 20 年内,我们要达到 zettaflop 的规模,也就是 10 的 21 次方次浮点数运算。然而,功耗可能会成为限制性因素。你将需要一个 100 或 200 兆瓦的机器,目前来看这太耗能了。
Q6:您如何看待量子计算在未来高性能计算中的作用?
A:我认为量子计算能解决的问题是有限的,它不会解决像三维偏微分方程这样的问题,我们在这方面经常使用超级计算机,如气候建模。
在未来,我们将构建一个包含不同类型计算工具的集成工具。我们将有处理器和加速器,我们将有帮助机器学习的工具,我们很可能有以大脑的方式进行神经形态计算的设备,我们将有光学计算机,此外,我们将有量子计算机来解决特定的问题。
以上就是本文的全部内容了,是否有顺利帮助你解决问题?若是能给你带来学习上的帮助,请大家多多支持golang学习网!更多关于科技周边的相关知识,也可关注golang学习网公众号。

- 上一篇
- 这就是修复 Windows 11 的 WSL 错误的方法

- 下一篇
- 工业机器人来焊接,优势在哪里?
-
- 科技周边 · 人工智能 | 1小时前 |
- 手机DeepSeek入驻腾讯会议:实时转录功能实测!
- 198浏览 收藏
-
- 科技周边 · 人工智能 | 1小时前 |
- 拼多多商家看过来!DeepSeek营销话术生成秘籍
- 261浏览 收藏
-
- 科技周边 · 人工智能 | 1小时前 |
- 印象笔记DeepSeek强强联手,文档归档检索效率飞升!
- 127浏览 收藏
-
- 科技周边 · 人工智能 | 1小时前 |
- DeepSeek与微博内容创作结合 热点自动追踪生成指南
- 403浏览 收藏
-
- 科技周边 · 人工智能 | 2小时前 |
- Jaaz— 开源AI设计工具,可以智能生成设计提示
- 255浏览 收藏
-
- 科技周边 · 人工智能 | 2小时前 |
- 抗压方案合集!六种稳定访问DeepSeek满血版的核心技术方案
- 271浏览 收藏
-
- 科技周边 · 人工智能 | 2小时前 |
- 即梦AI画质修复秘籍:模糊变清晰,大神教你!
- 464浏览 收藏
-
- 科技周边 · 人工智能 | 2小时前 | 三代半
- 碳化硅龙头传破产 转单来了
- 405浏览 收藏
-
- 科技周边 · 人工智能 | 2小时前 |
- 即梦ai如何导出高清视频 即梦ai视频导出格式教程
- 443浏览 收藏
-
- 科技周边 · 人工智能 | 2小时前 |
- B站UP主必备:DeepSeek智能视频策划全攻略
- 360浏览 收藏
-
- 科技周边 · 人工智能 | 2小时前 |
- 即梦ai如何添加粒子特效 即梦ai动态元素生成攻略
- 388浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 484次学习
-
- 互联网信息服务算法备案系统
- 了解互联网信息服务算法备案系统,掌握如何进行算法备案的详细步骤和要求,确保您的互联网服务合规运营。
- 56次使用
-
- 魔匠AI
- SEO摘要魔匠AI专注于高质量AI学术写作,已稳定运行6年。提供无限改稿、选题优化、大纲生成、多语言支持、真实参考文献、数据图表生成、查重降重等全流程服务,确保论文质量与隐私安全。适用于专科、本科、硕士学生及研究者,满足多语言学术需求。
- 102次使用
-
- PPTFake答辩PPT生成器
- PPTFake答辩PPT生成器,专为答辩准备设计,极致高效生成PPT与自述稿。智能解析内容,提供多样模板,数据可视化,贴心配套服务,灵活自主编辑,降低制作门槛,适用于各类答辩场景。
- 132次使用
-
- Lovart
- SEO摘要探索Lovart AI,这款专注于设计领域的AI智能体,通过多模态模型集成和智能任务拆解,实现全链路设计自动化。无论是品牌全案设计、广告与视频制作,还是文创内容创作,Lovart AI都能满足您的需求,提升设计效率,降低成本。
- 237次使用
-
- 美图AI抠图
- 美图AI抠图,依托CVPR 2024竞赛亚军技术,提供顶尖的图像处理解决方案。适用于证件照、商品、毛发等多场景,支持批量处理,3秒出图,零PS基础也能轻松操作,满足个人与商业需求。
- 122次使用
-
- GPT-4王者加冕!读图做题性能炸天,凭自己就能考上斯坦福
- 2023-04-25 501浏览
-
- 单块V100训练模型提速72倍!尤洋团队新成果获AAAI 2023杰出论文奖
- 2023-04-24 501浏览
-
- ChatGPT 真的会接管世界吗?
- 2023-04-13 501浏览
-
- VR的终极形态是「假眼」?Neuralink前联合创始人掏出新产品:科学之眼!
- 2023-04-30 501浏览
-
- 实现实时制造可视性优势有哪些?
- 2023-04-15 501浏览