当前位置：首页 > 文章列表 > 科技周边 > 人工智能 > AI百科：ChatGPT的工作原理

AI百科：ChatGPT的工作原理

来源：51CTO.COM 2023-04-18 21:31:10 0浏览收藏

偷偷努力，悄无声息地变强，然后惊艳所有人！哈哈，小伙伴们又来学习啦~今天我将给大家介绍《AI百科：ChatGPT的工作原理》，这篇文章主要会讲到等等知识点，不知道大家对其都有多少了解，下面我们就一起来看一吧！当然，非常希望大家能多多评论，给出合理的建议，我们一起学习，一起进步！

AI百科：ChatGPT的工作原理

ChatGPT迅速获得了数百万人的关注，但许多人都持谨慎态度，因为都不了解它的工作原理。而本文就是试图将其分解，以便更容易理解。

然而，就其核心而言，ChatGPT是一个非常复杂的系统。如果想要玩ChatGPT或者想弄懂它是什么，核心界面是一个聊天窗口，可以在其中提问或提供查询，AI会做出回应。要记住的一个重要细节是，在聊天中，上下文会被保留，这意味着消息可以引用先前的信息，而ChatGPT将能够根据上下文地理解这一点。

当在聊天框中输入查询时会发生什么?

神经网络

首先，在ChatGPT的框架下，有很多东西待发现。机器学习在过去10年里一直在迅速发展，ChatGPT利用了许多最先进的技术来实现其结果。

AI百科：CHATGPT的工作原理

神经网络是相互连接的“神经元”层，每个神经元负责接收输入、处理输入，并将其传递给网络中的下一个神经元。神经网络构成了当今人工智能的支柱。输入通常是一组称为“特征”的数值，表示正在处理的数据的某些方面。例如，在语言处理的情况下，特征可能是表示句子中每个单词的含义的词嵌入。

词嵌入只是一种文本的数字表示，神经网络将使用它来理解文本的语义，然后可以将其用于其他目的，比如以语义逻辑的方式进行响应!

因此，在ChatGPT中按回车键后，该文本首先被转换为词嵌入，这些词嵌入是在整个互联网上的文本上进行训练的。然后有一个经过训练的神经网络，在给定输入词嵌入的情况下，输出一组合适的响应词嵌入。然后，使用应用于输入查询的逆操作将这些嵌入入翻译成人类可读的单词。这个解码后的输出就是ChatGPT打印出来的内容。

ChatGPT模型大小

转换和输出生成的计算成本非常高。ChatGPT位于GPT-3之上，GPT-3是一个拥有1750亿个参数的大型语言模型。这意味着在OpenAI使用其大型数据集调整的广泛神经网络中有1750亿个权重。

因此，每个查询至少需要两次1750亿次计算，这加起来很快。OpenAI可能已经找到了一种方法来缓存这些计算以降低计算成本，但不知道这些信息是否已经发布到任何地方。此外，预计将于今年年初发布的GPT-4，据称参数增加了1000倍!

计算复杂性会导致实际成本!如果ChatGPT很快成为付费产品，不必感到惊讶，因为OpenAI目前正在花费数百万美元免费运营它。

编码器、解码器和RNN

自然语言处理中常用的一种神经网络结构是编码器-解码器网络。这些网络的设计目的是将输入序列“编码”为紧凑表示，然后将该表示“解码”为输出序列。

传统上，编码器-解码器网络已经与循环神经网络(RNN)配对，用于处理顺序数据。编码器处理输入序列并产生固定长度的向量表示，然后将其传递给解码器。解码器处理这个向量并产生输出序列。

编码器-解码器网络已广泛应用于机器翻译等任务，其中输入是一种语言的句子，输出是将该句子翻译成另一种语言。它们也被应用于摘要和图像说明生成任务。

AI百科：CHATGPT的工作原理

变压器与注意力

与编码器-解码器结构类似，变压器包括两个组件;然而，转换器的不同之处在于它使用一种自关注机制，允许输入的每个元素关注所有其他元素，从而允许它捕获元素之间的关系，而不管它们彼此之间的距离如何。

变压器还使用多头注意力，允许它同时关注输入的多个部分。这使得它能够捕获输入文本中的复杂关系并产生高度准确的结果。

在2017年发表“Attention is All You Need”论文时，变压器取代了编码器-解码器架构，成为自然语言处理的最先进模型，因为它可以在较长的文本中实现更好的性能。

AI百科：CHATGPT的工作原理

变压器架构，来自https://arxiv.org/pdf/1706.03762.pdf

生成式预训练

生成式预训练是一种在自然语言处理领域特别成功的技术。它涉及以无监督的方式在海量数据集上训练广泛的神经网络，以学习数据的通用表示。这个预训练网络可以针对特定任务进行微调，比如语言翻译或问答，从而提高性能。

AI百科：CHATGPT的工作原理

生成式预训练架构，摘自《通过生成式预训练提高语言理解能力》

在ChatGPT的例子中，这意味着对GPT-3模型的最后一层进行微调，以适应在聊天中回答问题的用例，这也利用了人工标记。下图可以更详细地了解ChatGPT微调:

AI百科：CHATGPT的工作原理

ChatGPT 微调步骤，来自https://arxiv.org/pdf/2203.02155.pdf

把一切结合在一起

因此，在ChatGPT的框架下有许多活动部件，这些部件只会不断增长。看到它如何继续发展将是非常有趣的，因为许多不同领域的进步将帮助类似GPT的模型获得进一步的采用。

在接下来的一两年里，我们可能会看到这种新的使能技术带来的重大颠覆。

以上就是《AI百科：ChatGPT的工作原理》的详细内容，更多关于ChatGPT,人工智能的资料请关注golang学习网公众号！

ChatGPT 人工智能

版本声明

本文转载于：51CTO.COM 如有侵犯，请联系study_golang@163.com删除

如何在 Outlook 桌面应用程序中设置两步验证和添加 Microsoft 帐户

如何在 Outlook 桌面应用程序中设置两步验证和添加 Microsoft 帐户

上一篇: 如何在 Outlook 桌面应用程序中设置两步验证和添加 Microsoft 帐户

我把ChatGPT拉到微信群里来了，都可以对AI提问了！

下一篇: 我把ChatGPT拉到微信群里来了，都可以对AI提问了！

查看更多

最新文章

科技周边 · 人工智能 | 13分钟前 |

上班族AI工具夜校学习指南与课程推荐

432浏览收藏
科技周边 · 人工智能 | 18分钟前 | 效率提升小绿鲸文献阅读器英文文献笔记管理

小绿鲸文献阅读器使用技巧与教程

425浏览收藏
科技周边 · 人工智能 | 30分钟前 |

Deepseek联手Pictory，一键生成宣传片

362浏览收藏
科技周边 · 人工智能 | 34分钟前 | AI 大数据智能体百度App 高考志愿填报

高考志愿填报，AI对比更可靠

407浏览收藏
科技周边 · 人工智能 | 39分钟前 | 用户体验数据洞察动态定价时段划分供需平衡

360智图动态定价怎么设置

393浏览收藏
科技周边 · 人工智能 | 1小时前 |

苹果DeepSeek安装指南及步骤详解

368浏览收藏
科技周边 · 人工智能 | 1小时前 | 人工智能挑战 GPT-5 应用场景多模态

GPT-5全面升级，AI未来全新定义

125浏览收藏
科技周边 · 人工智能 | 1小时前 |

AI剪辑怎么用？新手教程+案例解析

331浏览收藏
科技周边 · 人工智能 | 1小时前 |

零基础AI剪辑教程，新手也能轻松上手

220浏览收藏
科技周边 · 人工智能 | 2小时前 |

AI乐器工具搭配豆包，轻松学演奏技巧

130浏览收藏
科技周边 · 人工智能 | 2小时前 |

DeepSeek写课脚本的5步技巧

251浏览收藏
科技周边 · 人工智能 | 2小时前 |

即梦AI模板特效使用攻略

356浏览收藏

查看更多

课程推荐

前端进阶之JavaScript设计模式

设计模式是开发人员在软件开发过程中面临一般问题时的解决方案，代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景，打造一站式知识长龙服务，适合有JS基础的同学学习。

542次学习
GO语言核心编程课程

本课程采用真实案例，全面具体可落地，从理论到实践，一步一步将GO核心编程技术、编程思想、底层实现融会贯通，使学习者贴近时代脉搏，做IT互联网时代的弄潮儿。

511次学习
简单聊聊mysql8与网络通信

如有问题加微信：Le-studyg；在课程中，我们将首先介绍MySQL8的新特性，包括性能优化、安全增强、新数据类型等，帮助学生快速熟悉MySQL8的最新功能。接着，我们将深入解析MySQL的网络通信机制，包括协议、连接管理、数据传输等，让

498次学习
JavaScript正则表达式基础与实战

在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。

487次学习
从零制作响应式网站—Grid布局

本系列教程将展示从零制作一个假想的网络科技公司官网，分为导航，轮播，关于我们，成功案例，服务流程，团队介绍，数据部分，公司动态，底部信息等内容区块。网站整体采用CSSGrid布局，支持响应式，有流畅过渡和展现动画。

484次学习

查看更多

AI推荐

千音漫语

千音漫语，北京熠声科技倾力打造的智能声音创作助手，提供AI配音、音视频翻译、语音识别、声音克隆等强大功能，助力有声书制作、视频创作、教育培训等领域，官网：https://qianyin123.com

224次使用
MiniWork

MiniWork是一款智能高效的AI工具平台，专为提升工作与学习效率而设计。整合文本处理、图像生成、营销策划及运营管理等多元AI工具，提供精准智能解决方案，让复杂工作简单高效。

221次使用
NoCode

NoCode (nocode.cn)是领先的无代码开发平台，通过拖放、AI对话等简单操作，助您快速创建各类应用、网站与管理系统。无需编程知识，轻松实现个人生活、商业经营、企业管理多场景需求，大幅降低开发门槛，高效低成本。

219次使用
达医智影

达医智影，阿里巴巴达摩院医疗AI创新力作。全球率先利用平扫CT实现“一扫多筛”，仅一次CT扫描即可高效识别多种癌症、急症及慢病，为疾病早期发现提供智能、精准的AI影像早筛解决方案。

224次使用
智慧芽Eureka

智慧芽Eureka，专为技术创新打造的AI Agent平台。深度理解专利、研发、生物医药、材料、科创等复杂场景，通过专家级AI Agent精准执行任务，智能化工作流解放70%生产力，让您专注核心创新。

244次使用

查看更多

相关文章

GPT-4王者加冕！读图做题性能炸天，凭自己就能考上斯坦福

2023-04-25 501浏览
单块V100训练模型提速72倍！尤洋团队新成果获AAAI 2023杰出论文奖

2023-04-24 501浏览
ChatGPT 真的会接管世界吗？

2023-04-13 501浏览
VR的终极形态是「假眼」？Neuralink前联合创始人掏出新产品：科学之眼！

2023-04-30 501浏览
实现实时制造可视性优势有哪些？

2023-04-15 501浏览

Golang学习网：公益在线Go学习平台，帮助Go学习者快速成长！

技术交流群

Copyright 2023 http://www.17golang.com/ All Rights Reserved ｜苏ICP备2023003363号-1

关注公众号

Golang学习网

微信登录更方便

密码登录
注册账号

登录即同意用户协议和隐私政策

返回登录

重置密码