OpenAI提供新的微调和定制选项
大家好,我们又见面了啊~本文《OpenAI提供新的微调和定制选项》的内容中将会涉及到等等。如果你正在学习科技周边相关知识,欢迎关注我,以后会给大家带来更多科技周边相关文章,希望我们能一起进步!下面就开始本文的正式内容~
微调在构建有价值的人工智能工具中起着至关重要的作用。这种使用更有针对性的数据集精炼预训练模型的过程可使用户大大增加模型对专业内涵的理解,允许用户为特定任务的模型增加现成知识。
虽然这个过程可能需要时间,但与从头开始训练模型相比,它的成本效益通常要高三倍。这一数值正如OpenAI最近宣布扩展其自定义模型程序以及为其微调API提供各种新功能所反映的那样。
自服务微调API的新特性
OpenAI于2023年8月首次宣布推出针对GPT-3的自助微调API,并受到了AI社区的热烈响应。据OpenAI报告称,成千上万的团体已经利用API来训练成千上万的模型,比如利用特定的编程语言生成代码,将文本总结为特定的格式,或根据用户行为创建个性化的内容。
自从2023年8月开始,工作匹配和招聘平台Indeed取得了重大成功。为了将求职者与相关的空缺职位相匹配,Indeed向用户发送个性化推荐。通过微调GPT 3.5 Turbo以生成更准确的流程解释,并能够将提醒中的令牌数量减少80%。这使得该公司每月发送给求职者的信息从不足100万条增加到大约2000万条。
新微调API特性建立在这个成功的基础上,希望为未来的用户改进功能:
基于epoch的检查点创建:在每个训练epoch自动生成一个完整的微调模型检查点,这减少了后续再训练的需要,特别是在过度拟合的情况下。
Comparity Playground:一个新的并行Playground UI,用于比较模型质量和性能,允许人工评估多个模型的输出或针对单个提示进行微调快照。
第三方集成:支持与第三方平台的集成(从权限重和偏差开始),使开发人员能够将详细的微调数据共享给堆栈的其余部分。
综合验证指标:能够计算整个验证数据集的损失和准确性等指标,从而更好地了解模型质量。
超级参数配置:能够从仪表板配置可用的超级参数(而不仅仅是通过API或SDK)。
微调仪表板改进:包括配置超级参数、查看更详细的训练指标以及从以前的配置中重新运行作业的能力。
基于过去的成功,OpenAI相信这些新功能将使开发人员对他们的微调工作有更细粒度的控制。
辅助微调和定制训练模型
OpenAI还在2023年11月在DevDay上发布的基础上,改进了自定义模型计划。其中一个主要变化是辅助微调的出现,这是一种利用API微调之外的有价值技术的手段,例如在更大范围内添加额外的超级参数和各种参数有效微调(PEFT)方法。
SK电信就是充分发挥这项服务潜力的一个例子。这家电信运营商在韩国拥有超过3000万用户,因此他们希望定制一种可以充当电信客户服务专家的人工智能模型。
通过与OpenAI合作对GPT-4进行微调,使其专注于韩国电信相关的对话,SK电信的对话摘要质量提高了35%,意图识别准确率提高了33%。当将他们的新微调模型与广义GPT-4进行比较时,他们的满意度得分也从3.6提高到4.5(满分5分)。
OpenAI还引入了为需要深度微调的特定领域知识模型的公司构建定制模型的能力。与法律人工智能公司Harvey的合作证明了这一功能的价值。法律工作需要大量阅读密集的文件,Harvey想用LLMs(大型语言模型)从这些文件中综合信息,并将其提交给律师进行审查。然而,许多法律是复杂的,并且依赖于上下文,Harvey希望与OpenAI合作建立一个定制训练的模型,该模型可以将新的知识和推理方法纳入基本模型。
Harvey与OpenAI合作,添加了相当于100亿令牌的数据来定制训练这个判例法模型。通过增加必要的背景深度来做出明智的法律判断,结果模型的事实性回答提高了83%。
人工智能工具从来都不是“包治百病”的解决方案。可定制性是这项技术有用性的核心,OpenAI在微调和定制训练模型方面的工作将有助于扩展已经从该工具中获得的组织。
好了,本文到此结束,带大家了解了《OpenAI提供新的微调和定制选项》,希望本文对你有所帮助!关注golang学习网公众号,给大家分享更多科技周边知识!

- 上一篇
- Java函数在教育领域有哪些创新性的应用?

- 下一篇
- win10怎么连接手机热点_win10连接手机热点的教程
-
- 科技周边 · 人工智能 | 2小时前 |
- 豆包会员权益详解:付费会员对比全攻略
- 118浏览 收藏
-
- 科技周边 · 人工智能 | 2小时前 |
- MemoAI官网使用教程详解
- 107浏览 收藏
-
- 科技周边 · 人工智能 | 3小时前 |
- AI知识库与自动化系统搭建指南
- 203浏览 收藏
-
- 科技周边 · 人工智能 | 3小时前 |
- AI+大模型短视频玩法与前景分析
- 406浏览 收藏
-
- 科技周边 · 人工智能 | 3小时前 |
- 豆包AI旧物改造,变废为宝技巧分享
- 476浏览 收藏
-
- 科技周边 · 人工智能 | 3小时前 |
- 豆包AI生成Web组件的技巧分享
- 482浏览 收藏
-
- 科技周边 · 人工智能 | 3小时前 |
- AI配音视频生成,一键制作解说短视频
- 499浏览 收藏
-
- 科技周边 · 人工智能 | 3小时前 |
- AI材料搭配技巧,豆包使用全攻略
- 252浏览 收藏
-
- 科技周边 · 人工智能 | 3小时前 |
- Midjourney+RunwayMLGen-2:静图变动态图神器
- 253浏览 收藏
-
- 科技周边 · 人工智能 | 3小时前 |
- Deepseek联手Descript打造专业播客内容
- 327浏览 收藏
-
- 科技周边 · 人工智能 | 3小时前 |
- Deepseek满血版+Elicit,文献调研高效攻略
- 228浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 511次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 498次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 484次学习
-
- 畅图AI
- 探索畅图AI:领先的AI原生图表工具,告别绘图门槛。AI智能生成思维导图、流程图等多种图表,支持多模态解析、智能转换与高效团队协作。免费试用,提升效率!
- 21次使用
-
- TextIn智能文字识别平台
- TextIn智能文字识别平台,提供OCR、文档解析及NLP技术,实现文档采集、分类、信息抽取及智能审核全流程自动化。降低90%人工审核成本,提升企业效率。
- 29次使用
-
- 简篇AI排版
- SEO 简篇 AI 排版,一款强大的 AI 图文排版工具,3 秒生成专业文章。智能排版、AI 对话优化,支持工作汇报、家校通知等数百场景。会员畅享海量素材、专属客服,多格式导出,一键分享。
- 25次使用
-
- 小墨鹰AI快排
- SEO 小墨鹰 AI 快排,新媒体运营必备!30 秒自动完成公众号图文排版,更有 AI 写作助手、图片去水印等功能。海量素材模板,一键秒刷,提升运营效率!
- 23次使用
-
- Aifooler
- AI Fooler是一款免费在线AI音频处理工具,无需注册安装,即可快速实现人声分离、伴奏提取。适用于音乐编辑、视频制作、练唱素材等场景,提升音频创作效率。
- 28次使用
-
- GPT-4王者加冕!读图做题性能炸天,凭自己就能考上斯坦福
- 2023-04-25 501浏览
-
- 单块V100训练模型提速72倍!尤洋团队新成果获AAAI 2023杰出论文奖
- 2023-04-24 501浏览
-
- ChatGPT 真的会接管世界吗?
- 2023-04-13 501浏览
-
- VR的终极形态是「假眼」?Neuralink前联合创始人掏出新产品:科学之眼!
- 2023-04-30 501浏览
-
- 实现实时制造可视性优势有哪些?
- 2023-04-15 501浏览