当前位置：首页 > 文章列表 > 科技周边 > 人工智能 > 超级编程AI登上Science封面！AlphaCode编程大赛卷趴一半程序员

超级编程AI登上Science封面！AlphaCode编程大赛卷趴一半程序员

来源：51CTO.COM 2023-04-14 07:14:56 0浏览收藏

最近发现不少小伙伴都对科技周边很感兴趣，所以今天继续给大家介绍科技周边相关的知识，本文《超级编程AI登上Science封面！AlphaCode编程大赛卷趴一半程序员》主要内容涉及到等等知识点，希望能帮到你！当然如果阅读本文时存在不同想法，可以在评论中表达，但是请勿使用过激的措辞~

这个12月，正当OpenAI的ChatGPT势头正旺时，那个曾经卷趴一半程序员的AlphaCode登上Science封面了！

论文链接：https://www.science.org/doi/10.1126/science.abq1158

说到AlphaCode，想必大家并不陌生。

早在今年2月，它就在著名的Codeforces上，悄悄地参加了10场编程比赛，并一举击败了半数的人类码农。

卷趴一半码农

我们都知道，程序员中非常流行这样一种测试——编程竞赛。

在竞赛中，主要考察的就是程序员通过经验进行批判性思维，为不可预见的问题创建解决方案的能力。

这体现了人类智能的关键，而机器学习模型，往往很难模仿这种人类智能。

但DeepMind的科学家们，打破了这一规律。

YujiA Li等人，使用自监督学习和编码器-解码器转换器架构，开发出了AlphaCode。

AlphaCode的开发工作，还是在居家期间完成的

虽然AlphaCode也是基于标准的Transformer编解码器架构，但DeepMind对它进行了「史诗级」的强化——

它使用基于Transformer的语言模型，以前所未有的规模生成代码，然后巧妙地筛出了一小部分可用的程序。

具体步骤为：

1）多问询注意力：让每个注意力块共享键和值的头，并同时结合编码器-解码器模型，使AlphaCode的采样速度提高了10倍以上。

2) 掩码语言建模（MLM）：通过在编码器上加入一个MLM损失，来提高模型的解决率。

3）回火：让训练分布更加尖锐，从而防止过拟合的正则化效应。

4）值调节和预测：通过区分CodeContests数据集中正确和错误的问题提交，来提供一个额外的训练信号。

5）示范性异策略学习生成（GOLD）：通过将训练的重点放在每个问题最可能的解决方案上，让模型为每个问题产生正确方案。

结果嘛，大家都知道了。

凭借着1238的Elo得分，AlphaCode让自己在这10场比赛中的排名达到了前54.3%。放眼之前的6个月，这一成绩更是达到了前28%。

要知道，为了达到这个排名，AlphaCode必须「过五关斩六将」，解决融合了批判性思维、逻辑、算法、编码和自然语言理解相结合的种种新问题。

从结果来看，AlphaCode不仅解决了CodeContests数据集中29.6%的编程问题，而且其中有66%是在第一次提交时解决的。（总提交次数限制在10次）

相比起来，传统的Transformer模型求解率都比较低，只有个位数。

对于这个结果，就连Codeforces创始人Mirzayanov都非常惊讶。

毕竟，编程比赛考验的是发明算法的能力，这一直是AI的弱项，人类的强项。

我可以肯定地说，AlphaCode的结果超出了我的预期。开始我持怀疑态度，因为即使在简单的竞赛问题中，不仅需要实施算法，而且还需要发明算法（这是最困难的部分）。AlphaCode已经让自己成为很多人类的强劲对手。我迫不及待地想知道，未来会发生什么！

——Mike Mirzayanov，Codeforces 创始人

所以，AlphaCode这是能抢程序员的饭碗了？

当然还不行。

AlphaCode还只能完成简单的编程任务，如果任务变得更复杂，问题更加「不可预见」，只会将指令翻译成代码的AlphaCode就束手无策了。

毕竟，1238的得分从某种角度来说，也就相当于一个初学编程的中学生菜鸟的水平。这个level，还威胁不到真正的编程大牛。

但毫无疑问的是，这类编码平台的开发，会对程序员的生产力产生巨大的影响。

甚至，整个编程文化都可能会被改变：或许，以后人类只要负责制定问题就可以，而生成和执行代码的任务，就可以交给机器学习了。

编程竞赛有啥难的？

我们知道，虽然机器学习在生成和理解文本方面取得了巨大进步，但是大部分AI目前仍然局限于简单的数学和编程问题。

它们会做的，更多是检索和复制现有的方案（这一点相信最近玩过ChatGPT的人都深有体会）。

那么，让AI学习生成正确的程序，为什么这么困难呢？

1. 要生成解决指定任务的代码，就需要在所有可能的字符序列中搜索，这是一个海量的空间，而其中只有一小部分对应有效的正确程序。

2. 、一个字符的编辑，可能会完全改变程序的行为，甚至会导致崩溃，而且每个任务都有许多截然不同的有效解决方案。

对于难度极高的编程比赛，AI需要理解复杂的自然语言描述；需要对以前从未见过的问题进行推理，而不是简单地记住代码片段；需要掌握各种算法和数据结构，并精确地完成可能长达数百行的代码。

此外，为了评估自己生成的这些代码，AI还需要在一套详尽的隐藏测试上执行任务，并且检查执行速度和边缘情况的正确性。

（A）问题1553D，中等难度评分为1500；（B）AlphaCode生成的问题解决方案

就拿这个1553D问题来说，参赛者需要找到一种方法，使用一组有限的输入将一串随机重复的s和t字母转换成另一串相同的字母。

参赛者不能只是输入新的字母，而必须使用「退格」命令删除原始字符串中的几个字母。赛题具体如下：

对此，AlphaCode给出的解决方案如下：

并且，AlphaCode的「解题思路」也不再是黑箱，它还能显示代码和注意力高亮的位置。

AlphaCode的学习系统

参加编程比赛时，AlphaCode面临的主要挑战是：

（i）需要在巨大的程序空间中搜索，（ii）只能获得约13,000个用于训练的示例任务，以及（iii）每个问题的提交数量有限。

为了应对这些问题，AlphaCode整个学习系统的构建分为三个环节，预训练、微调、采样与评估，如上图所示。

预训练

在预训练阶段，利用在GitHub收集的715GB人类码农的代码快照，对模型进行预训练，并使用交叉熵next-token预测损失。在预训练过程中，随机地将代码文件分成两部分，将第一部分作为编码器的输入，并训练模型去掉编码器生成第二部分。

这种预训练为编码学习了一个强大的先验，使随后的特定任务的微调能够在一个更小的数据集上进行。

微调

在微调阶段，在一个2.6GB的竞争性编程问题数据集上对模型进行了微调和评估，数据集是DeepMind创建的，命名为CodeContests公开发布。

CodeContests数据集中包括问题以及测试案例。训练集包含13,328个问题，每个问题平均有922.4个提交答案。验证集和测试集分别包含117个和165个问题。

在微调过程中，将自然语言的问题陈述编码为程序注释，以使其看起来与预训练期间看到的文件更加相似（其中可以包括扩展的自然语言注释），并使用相同的next-token预测损失。

采样

为了选出10个最好的样本进行提交，采用过滤和聚类的方法，利用问题陈述中包含的例子测试来执行样本，并删除未能通过这些测试的样本。

通过过滤筛除了近99%的模型样本，再对剩下的候选样本进行聚类，在一个单独的transformer模型生成的输入上执行这些样本，并将在生成的输入上产生相同输出的程序归为一类。

然后，从10个最大的聚类中各挑选一个样本进行提交。直观地说，正确的程序行为相同，并形成大的聚类，而不正确的程序的失败方式是多种多样的。

评估

上图所示为在10@k指标上，模型性能是如何随着更多的样本量和计算量而变化的。从对采样结果的性能评估上看，研究人员得出了以下4点结论：

1. 解决率随着更大的样本量而呈对数线性扩展；

2. 更好的模型在比例曲线上有更高的斜率；

3. 解决率与更多的计算量呈对数线性比例；

4. 样本选择对解决率的扩展至关重要。

纯粹的「数据驱动」

毫无疑问，AlphaCode的提出，代表了机器学习模型在发展上已经迈出了实质性的一步。

有趣的是，AlphaCode并不包含关于计算机代码结构的明确的内置知识。

相反，它依靠一种纯粹的「数据驱动」方法来编写代码，也就是通过简单地观察大量现有代码来学习计算机程序的结构。

文章地址：https://www.science.org/doi/10.1126/science.add8258

从根本上说，使AlphaCode在竞争性编程任务上胜过其他系统的原因归结为两个主要属性：

1. 训练数据

2. 候选解决方案的后处理

但计算机代码是一个高度结构化的媒介，程序必须遵守定义的语法，并且必须在解决方案的不同部分中产生明确的前、后条件。

而AlphaCode在生成代码时采用的方法，却和生成其他文本内容时完全一样——一次一个token，并且只在整个程序写完后检查程序的正确性。

鉴于适当的数据和模型的复杂性，AlphaCode可以生成连贯的结构。然而，这个顺序生成程序的最终配方被深埋在LLM的参数中，难以捉摸。

不过，无论AlphaCode是否真的能「理解」编程问题，它的确在代码竞赛方面达到了人类的平均水平。

「解决编程竞赛的问题是一件非常困难的事情，需要人类具有良好的编码技能和解决问题的创造力。AlphaCode能够在这一领域取得进展，给我留下了深刻的印象，我很高兴看到，该模型如何利用其语句理解来生成代码，并引导其随机探索以创建解决方案。」
——Petr Mitrichev，谷歌软件工程师和世界级竞技程序员

AlphaCode在编程竞赛中名列前54%，展示了深度学习模型在需要批判性思维的任务中的潜力。

这些模型优雅地利用现代机器学习，将问题的解决方案表达为代码，这就回到几十年前AI的符号推理根源。

而这，仅仅是一个开始。

在未来，还会诞生更多解决问题的强大AI，或许这一天已经不远了。

好了，本文到此结束，带大家了解了《超级编程AI登上Science封面！AlphaCode编程大赛卷趴一半程序员》，希望本文对你有所帮助！关注golang学习网公众号，给大家分享更多科技周边知识！

AI 编程

版本声明

本文转载于：51CTO.COM 如有侵犯，请联系study_golang@163.com删除

一文简述无人驾驶的现状与展望

一文简述无人驾驶的现状与展望

上一篇: 一文简述无人驾驶的现状与展望

为什么开源是对话式人工智能未来的关键

下一篇: 为什么开源是对话式人工智能未来的关键

查看更多

最新文章

科技周边 · 人工智能 | 25秒前 |

一篇文章看懂2025年AI工具趋势

454浏览收藏
科技周边 · 人工智能 | 2分钟前 | 商务沟通 CaktusAI 个性化邮件模板定制智能迭代

CaktusAI如何生成个性化邮件？商务模板定制指南

386浏览收藏
科技周边 · 人工智能 | 6分钟前 |

长安汽车首场媒体会召开，朱华荣定下500万目标

436浏览收藏
科技周边 · 人工智能 | 8分钟前 |

B站UP主必看：DeepSeek视频策划指南

421浏览收藏
科技周边 · 人工智能 | 24分钟前 |

工信部曝光东风日产N6，尺寸越级售价12-15万

159浏览收藏
科技周边 · 人工智能 | 36分钟前 | 电商转化率智能修图绘蛙AI修图商品精修图

绘蛙AI修图教程：电商精修技巧全解析

310浏览收藏
科技周边 · 人工智能 | 40分钟前 |

PerplexityAI代码搜索与语法解析全解析

390浏览收藏
科技周边 · 人工智能 | 1小时前 | 豆包AI AI摄影特摄大片智能构图玩具摄影

AI+豆包拍出大片教程分享

384浏览收藏
科技周边 · 人工智能 | 1小时前 |

多模态AI能生成视频？实测视频创作效果

165浏览收藏
科技周边 · 人工智能 | 1小时前 |

Qwen-Image发布：阿里文生图模型上线

236浏览收藏
科技周边 · 人工智能 | 1小时前 |

通灵义码使用教程：高效操作指南

207浏览收藏
科技周边 · 人工智能 | 1小时前 |

ChatGPT代码优化技巧分享

253浏览收藏

查看更多

课程推荐

前端进阶之JavaScript设计模式

设计模式是开发人员在软件开发过程中面临一般问题时的解决方案，代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景，打造一站式知识长龙服务，适合有JS基础的同学学习。

542次学习
GO语言核心编程课程

本课程采用真实案例，全面具体可落地，从理论到实践，一步一步将GO核心编程技术、编程思想、底层实现融会贯通，使学习者贴近时代脉搏，做IT互联网时代的弄潮儿。

511次学习
简单聊聊mysql8与网络通信

如有问题加微信：Le-studyg；在课程中，我们将首先介绍MySQL8的新特性，包括性能优化、安全增强、新数据类型等，帮助学生快速熟悉MySQL8的最新功能。接着，我们将深入解析MySQL的网络通信机制，包括协议、连接管理、数据传输等，让

498次学习
JavaScript正则表达式基础与实战

在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。

487次学习
从零制作响应式网站—Grid布局

本系列教程将展示从零制作一个假想的网络科技公司官网，分为导航，轮播，关于我们，成功案例，服务流程，团队介绍，数据部分，公司动态，底部信息等内容区块。网站整体采用CSSGrid布局，支持响应式，有流畅过渡和展现动画。

484次学习

查看更多

AI推荐

千音漫语

千音漫语，北京熠声科技倾力打造的智能声音创作助手，提供AI配音、音视频翻译、语音识别、声音克隆等强大功能，助力有声书制作、视频创作、教育培训等领域，官网：https://qianyin123.com

164次使用
MiniWork

MiniWork是一款智能高效的AI工具平台，专为提升工作与学习效率而设计。整合文本处理、图像生成、营销策划及运营管理等多元AI工具，提供精准智能解决方案，让复杂工作简单高效。

155次使用
NoCode

NoCode (nocode.cn)是领先的无代码开发平台，通过拖放、AI对话等简单操作，助您快速创建各类应用、网站与管理系统。无需编程知识，轻松实现个人生活、商业经营、企业管理多场景需求，大幅降低开发门槛，高效低成本。

166次使用
达医智影

达医智影，阿里巴巴达摩院医疗AI创新力作。全球率先利用平扫CT实现“一扫多筛”，仅一次CT扫描即可高效识别多种癌症、急症及慢病，为疾病早期发现提供智能、精准的AI影像早筛解决方案。

166次使用
智慧芽Eureka

智慧芽Eureka，专为技术创新打造的AI Agent平台。深度理解专利、研发、生物医药、材料、科创等复杂场景，通过专家级AI Agent精准执行任务，智能化工作流解放70%生产力，让您专注核心创新。

174次使用

查看更多

相关文章

GPT-4王者加冕！读图做题性能炸天，凭自己就能考上斯坦福

2023-04-25 501浏览
单块V100训练模型提速72倍！尤洋团队新成果获AAAI 2023杰出论文奖

2023-04-24 501浏览
ChatGPT 真的会接管世界吗？

2023-04-13 501浏览
VR的终极形态是「假眼」？Neuralink前联合创始人掏出新产品：科学之眼！

2023-04-30 501浏览
实现实时制造可视性优势有哪些？

2023-04-15 501浏览

Golang学习网：公益在线Go学习平台，帮助Go学习者快速成长！

技术交流群

Copyright 2023 http://www.17golang.com/ All Rights Reserved ｜苏ICP备2023003363号-1

关注公众号

Golang学习网

微信登录更方便

密码登录
注册账号

登录即同意用户协议和隐私政策

返回登录

重置密码