当前位置:首页 > 文章列表 > 科技周边 > 人工智能 > GPT-5要停?OpenAI凌晨发文回应:保障AI安全,我们没有「偷工减料」

GPT-5要停?OpenAI凌晨发文回应:保障AI安全,我们没有「偷工减料」

来源:51CTO.COM 2023-04-15 06:56:45 0浏览 收藏

对于一个科技周边开发者来说,牢固扎实的基础是十分重要的,golang学习网就来带大家一点点的掌握基础知识点。今天本篇文章带大家了解《GPT-5要停?OpenAI凌晨发文回应:保障AI安全,我们没有「偷工减料」》,主要介绍了,希望对大家的知识积累有所帮助,快点收藏起来吧,否则需要时就找不到了!

近些天,对 OpenAI 来说,可谓是一个「多事之秋」。

由于 ChatGPT 及 GPT-4 可能引发的安全问题,OpenAI 受到了来自外界的一些指责和阻挠:

  • 马斯克等上千人联名呼吁 「所有人工智能实验室应立即暂停训练比 GPT-4 更强大的大模型,这一时间至少为 6 个月」;
  • 意大利禁用 ChatGPT,OpenAl「必须在 20 天内通过其在欧洲的代表向他们通报公司执行这一要求而采取的措施」;
  • ChatGPT 大面积封号;
  • ChatGPT Plus 停售;
  • ......

这些事件表明,尽管 AI 已经证明有能力为人类社会带来诸多好处,但技术总是一把双刃剑,也会为人类社会带来带来真正的风险,AI 也不例外。

4 月 6 日,OpenAI 官方发布了一篇名为「Our approach to AI safety」的博客文章,探讨了如何「安全地构建、部署和使用人工智能系统」的方法。

图片

OpenAI 致力于保持强大的人工智能安全和(人类社会的)广泛受益。我们的人工智能工具为今天的人们提供了许多好处。

来自世界各地的用户告诉我们,ChatGPT 有助于提高他们的生产力,增强他们的创造力,并提供量身定制的学习体验。

我们也认识到,像任何技术一样,这些工具也有真正的风险——所以,我们努力确保在各个层面上将安全纳入我们的系统。

1. 建立越来越安全的人工智能系统

在发布任何新系统之前,我们都会进行严格的测试,让外部专家参与反馈,努力利用人类反馈的强化学习等技术改善模型的行为,并建立广泛的安全和监测系统。

例如,在我们最新的模型 GPT-4 完成训练后,我们所有员工花了 6 个多月的时间使其在公开发布前更加安全和一致。

我们认为,强大的人工智能系统应该接受严格的安全评估。需要有监管来确保这种做法被采纳,我们积极与政府接触,探讨这种监管可能采取的最佳形式。

2. 从真实世界的使用中学习,以改进保障措施

我们努力在部署前预防可预见的风险,然而,我们在实验室中能学到的东西是有限的。尽管进行了广泛的研究和测试,我们无法预测人们使用我们技术的所有有益方式,也无法预测人们滥用技术的所有方式。这就是为什么我们相信,随着时间的推移,从现实世界的使用中学习是创建和发布越来越安全的人工智能系统的一个关键组成部分。

在有大量的保障措施下,我们谨慎地逐步发布新的人工智能系统,将其推送给一个稳步扩大的人群,并根据我们学到的经验不断改进。

我们通过我们自己的服务和 API 提供我们最有能力的模型,这样开发者就可以直接在他们的应用程序中使用这种技术。这使我们能够监测滥用情况并采取行动,并不断建立缓解措施,以应对人们滥用我们的系统的真实方式,而不仅仅是关于滥用可能是什么样子的理论。

现实世界的使用也使我们制定了越来越细微的政策,以防止那些对人们构成真正风险的行为,同时还允许我们的技术有许多有益的用途。

至关重要的是,我们相信社会必须有时间来更新和调整,以适应能力越来越强的人工智能,而且每个受这种技术影响的人都应该在人工智能的进一步发展中拥有重要的发言权。迭代部署帮助我们将各种利益相关者带入关于采用人工智能技术的对话中,比他们没有亲身经历过这些工具的情况下更有效。

3. 保护儿童

关于安全的一个关键工作是保护儿童。我们要求使用我们的人工智能工具的人必须是 18 岁或以上,或 13 岁或以上并得到父母的批准,我们正在研究验证选项。

我们不允许我们的技术被用来产生仇恨、骚扰、暴力或成人内容,以及其他(有害)类别。我们的最新模型 GPT-4 与 GPT-3.5 相比,对不允许的内容请求的回应率降低了 82%,我们已经建立了一个强大的系统来监控滥用。GPT-4 现在可供 ChatGPT Plus 用户使用,我们希望随着时间的推移,能让更多人使用。

我们作出了很多努力,尽量减少我们的模型产生伤害儿童的内容的可能性。例如,当用户试图向我们的图像工具上传儿童安全虐待材料时,我们会阻止这一动作,并向国家失踪和受剥削儿童中心报告。

除了我们的默认安全护栏外,我们还与非营利性的可汗学院等开发商合作--该学院建立了一个由人工智能驱动的助手,既是学生的虚拟导师,也是教师的课堂助手--为他们的使用情况定制安全缓解措施。我们还在开发一些功能,使开发者能够为模型输出设定更严格的标准,以更好地支持那些希望获得这种功能的开发者和用户。

4. 尊重隐私

我们的大型语言模型是在一个广泛的文本语料库上训练出来的,其中包括公开的、授权的内容,以及由人类审查者产生的内容。我们不使用数据来销售我们的服务、广告或建立人们的档案,我们使用数据来使我们的模型对人们更有帮助。例如,ChatGPT 通过对人们与它的对话进行进一步的训练来提高能力。

虽然我们的一些训练数据包括公共互联网上的个人信息,但我们希望我们的模型能够了解这个世界,而不是私人。因此,我们努力在可行的情况下从训练数据集中删除个人信息,对模型进行微调,以拒绝对私人信息的请求,并对个人提出的从我们的系统中删除其个人信息的请求作出回应。这些步骤最大限度地减少了我们的模型可能产生包括私人信息的内容的可能性。

5. 提高事实的准确性

大型语言模型根据它们之前看到的模式,包括用户提供的文本输入,预测、产生接下来的一系列的词。在某些情况下,下一个最有可能的词可能在事实上并不准确。

提高事实准确性是 OpenAI 和许多其他人工智能开发者的一个重要工作,我们正在取得进展。通过利用用户对被标记为不正确的 ChatGPT 输出的反馈作为主要数据来源。

我们认识到,要进一步减少出现幻觉的可能性,以及引导公众了解这些人工智能工具目前的局限性,还有很多其他工作要做。

6. 持续的研究和参与

我们认为,解决人工智能安全问题的实用方法是投入更多的时间和资源来研究有效的缓解措施和调整技术,并针对现实世界的滥用进行测试。

重要的是,我们认为,提高人工智能的安全性和能力应该齐头并进。迄今为止,我们最好的安全工作来自与我们能力最强的模型之间的合作,因为它们更善于遵循用户的指示,更容易引导或「指导」。

随着能力更强的模型的创建和部署,我们将越来越谨慎,随着我们人工智能系统的进一步发展,我们将继续加强安全防范措施。

虽然我们为了更好地了解 GPT-4 的能力、好处和风险,等了 6 个多月才将其部署,但有时可能需要比这更长的时间来提高人工智能系统的安全性。因此,政策制定者和人工智能供应商将需要确保人工智能的发展和部署在全球范围内得到有效的管理,没有人会为了尽快取得成功而「偷工减料」。这是一个艰巨的挑战,需要技术和制度上的创新,但这也是我们渴望做出的贡献。

解决安全问题也需要广泛的辩论、实验和参与,包括在人工智能系统行为的界限上。我们已经并将继续促进利益相关者之间的合作和公开对话,以创建一个安全的人工智能生态系统。

以上就是本文的全部内容了,是否有顺利帮助你解决问题?若是能给你带来学习上的帮助,请大家多多支持golang学习网!更多关于科技周边的相关知识,也可关注golang学习网公众号。

版本声明
本文转载于:51CTO.COM 如有侵犯,请联系study_golang@163.com删除
这个实验性应用程序可以为您提供 Windows 10 上的亚克力菜单这个实验性应用程序可以为您提供 Windows 10 上的亚克力菜单
上一篇
这个实验性应用程序可以为您提供 Windows 10 上的亚克力菜单
美国银行称人工智能正迈入“iPhone 时刻”,未来七年为世界经济带来 15.7 万亿美元的增长
下一篇
美国银行称人工智能正迈入“iPhone 时刻”,未来七年为世界经济带来 15.7 万亿美元的增长
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    508次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    497次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • PPTFake答辩PPT生成器:一键生成高效专业的答辩PPT
    PPTFake答辩PPT生成器
    PPTFake答辩PPT生成器,专为答辩准备设计,极致高效生成PPT与自述稿。智能解析内容,提供多样模板,数据可视化,贴心配套服务,灵活自主编辑,降低制作门槛,适用于各类答辩场景。
    6次使用
  • SEO标题Lovart AI:全球首个设计领域AI智能体,实现全链路设计自动化
    Lovart
    SEO摘要探索Lovart AI,这款专注于设计领域的AI智能体,通过多模态模型集成和智能任务拆解,实现全链路设计自动化。无论是品牌全案设计、广告与视频制作,还是文创内容创作,Lovart AI都能满足您的需求,提升设计效率,降低成本。
    6次使用
  • 美图AI抠图:行业领先的智能图像处理技术,3秒出图,精准无误
    美图AI抠图
    美图AI抠图,依托CVPR 2024竞赛亚军技术,提供顶尖的图像处理解决方案。适用于证件照、商品、毛发等多场景,支持批量处理,3秒出图,零PS基础也能轻松操作,满足个人与商业需求。
    26次使用
  • SEO标题PetGPT:智能桌面宠物程序,结合AI对话的个性化陪伴工具
    PetGPT
    SEO摘要PetGPT 是一款基于 Python 和 PyQt 开发的智能桌面宠物程序,集成了 OpenAI 的 GPT 模型,提供上下文感知对话和主动聊天功能。用户可高度自定义宠物的外观和行为,支持插件热更新和二次开发。适用于需要陪伴和效率辅助的办公族、学生及 AI 技术爱好者。
    24次使用
  • 可图AI图片生成:快手可灵AI2.0引领图像创作新时代
    可图AI图片生成
    探索快手旗下可灵AI2.0发布的可图AI2.0图像生成大模型,体验从文本生成图像、图像编辑到风格转绘的全链路创作。了解其技术突破、功能创新及在广告、影视、非遗等领域的应用,领先于Midjourney、DALL-E等竞品。
    51次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码