当前位置：首页 > 文章列表 > 科技周边 > 人工智能 > GPT-4的人类化推理能力大幅提升！中国科学院提出「思维传播」，类比思考超越CoT，即刻应用

GPT-4的人类化推理能力大幅提升！中国科学院提出「思维传播」，类比思考超越CoT，即刻应用

来源：51CTO.COM 2023-10-13 16:46:13 0浏览收藏

本篇文章给大家分享《GPT-4的人类化推理能力大幅提升！中国科学院提出「思维传播」，类比思考超越CoT，即刻应用》，覆盖了科技周边的常见基础知识，其实一个语言的全部知识点一篇文章是不可能说完的，但希望通过这些问题，让读者对自己的掌握程度有一定的认识(B 数)，从而弥补自己的不足，更好的掌握它。

如今，GPT-4、PaLM等巨型神经网络模型横空出世，已经展现出惊人的少样本学习能力。

只需给出简单提示，它们就能进行文本推理、编写故事、回答问题、编程......

中国科学院和耶鲁大学的研究人员提出了一种新的框架，名为「思维传播」（Thought Propagation），旨在通过「类比思维」来增强LLM的推理能力

GPT-4的人类化推理能力大幅提升！中国科学院提出「思维传播」，类比思考超越CoT，即刻应用

论文地址：https://arxiv.org/abs/2310.03965

「思维传播」灵感来自人类认知，即当遇到一个新问题时，我们经常将其与我们已经解决的类似问题进行比较，以推导出策略。

因此，这种方法的关键是在解决输入问题之前，探索与输入相关的“类似”问题

最后，它们的解决方案可以拿来即用，或提取有用计划的见解。

可以预见的是，「思维传播」在为LLM逻辑能力的固有限制提出的全新思路，让大模型像人类一样用「类比」方法解决难题。

LLM多步推理，败给人类

显而易见，LLM擅长根据提示进行基本推理，但在处理复杂的多步骤问题时仍有困难，比如优化、规划。

反观人类，他们会汲取类似经验中的直觉来解决新问题。

大型模型无法实现这一点，是由于其固有的限制所决定的

因为LLM的知识完全来自于训练数据中的模式，无法真正理解语言或概念。因此，作为统计模型，它们很难进行复杂的组合泛化。

GPT-4的人类化推理能力大幅提升！中国科学院提出「思维传播」，类比思考超越CoT，即刻应用

LLM缺乏系统推理能力，无法像人类那样逐步推理，从而解决具有挑战性的问题，这是最最重要的

此外，由于大模型的推理是局部的和短视的，因此LLM很难找到最佳解决方案，并且在长时间范围内难以保持推理的一致性

总结起来，大模型在数学证明、战略规划和逻辑推理方面存在的问题主要可以归结为两个核心因素：

- 无法重用先前经验中的见解。

人类从实践中积累了可重复使用的知识和直觉，有助于解决新问题。相比之下，LLM在处理每个问题时都是「从0开始」，不会借鉴先前的解决方案。

多步骤推理中的复合错误指的是在进行多步骤推理过程中出现的错误

人类会监控自己的推理链，并在必要时修改最初的步骤。然而，LLM在推理的早期阶段所犯的错误会被放大，因为它们会将后续的推理引向错误的方向

以上这些弱点，严重阻碍了LLM应对需要全局最优或长期规划的复杂挑战中的应用。

研究人员针对这个问题提出了一种全新的解决方法，即思维传播

TP框架

通过类比思维，让LLM能够像人类一样进行推理

在研究者看来，从0开始推理无法重复使用解决类似问题的见解，而且会在中间推理阶段出现错误累积。

而「思维传播」可以探索与输入问题相关的类似问题，并从类似问题的解决方案中获得启发。

GPT-4的人类化推理能力大幅提升！中国科学院提出「思维传播」，类比思考超越CoT，即刻应用

下图展示了「思维传播」（TP）与其他代表性技术的比较。对于输入问题p，IO、CoT和ToT都需要从头开始推理，才能得出解决方案s

GPT-4的人类化推理能力大幅提升！中国科学院提出「思维传播」，类比思考超越CoT，即刻应用

具体来说，TP包括了三个阶段：

1. 提出类似问题：LLM通过提示生成一组与输入问题有相似之处的类似问题。这将引导模型检索潜在的相关先前经验。

2. 解决类似问题：通过现有的提示技术，如CoT，让LLM解决每个类似的问题。

3. 汇总解决方案：有2种不同的途径——根据类比解决方案，直接推断出输入问题的新解决方案；通过比较输入问题的类比解决方案，推导出高级计划或策略。

通过这种方式，大型模型可以利用先前的经验和启发式方法，并且可以将其初始推理与类比解决方案进行交叉检查，以进一步完善这些解决方案

值得一提的是，「思维传播」与模型无关，可以在任何提示方法的基础上进行单个问题解决步骤

这个方法的独特之处在于激发LLM类比思维，从而引导复杂的推理过程

「思维传播」究竟能让LLM多像人类，还得实操结果来说话。

中国科学院和耶鲁的研究人员在3个任务中进行了评估：

- 最短路径推理：需要在图中找到节点之间的最佳路径需要全局规划和搜索。即使在简单的图上，标准技术也会失败。

- 创意写作：生成连贯、有创意的故事是一个开放式的挑战。当给出高层次的大纲提示时，LLM通常会失去一致性或逻辑性。

- LLM智能体规划：与文本环境交互的LLM智能体与长期战略方面举步维艰。它们的计划经常会出现「漂移」或陷入循环。

最短路径推理

在最短路径推理任务中，现有的方法遇到了无法解决的问题

尽管（a）中的图形非常简单，但由于推理从0开始，这些方法只能让LLM找到次优解（b,c），甚至重复访问中间节点（d）

GPT-4的人类化推理能力大幅提升！中国科学院提出「思维传播」，类比思考超越CoT，即刻应用

以下是一个结合了TP和ToT使用的例子

由于中间推理步骤的错误累积，ToT (b) 无法解决 (a) 中的问题。基于类似问题的解决方案，TP (c) 完善了最初的次优解决方案，并最终找到了最优解决方案。

GPT-4的人类化推理能力大幅提升！中国科学院提出「思维传播」，类比思考超越CoT，即刻应用

通过与基线比较，TP在处理最短路径任务中的性能显著提升了12%，生成了最优和有效的最短路径。

此外，由于在线重写（OLR）的最低值，与基准线相比，生成的有效路径（TP）最接近最优路径

GPT-4的人类化推理能力大幅提升！中国科学院提出「思维传播」，类比思考超越CoT，即刻应用

此外，研究人员还对TP层数对最短路径任务的复杂性和性能进行了进一步研究

在不同设置下，1层TP的token成本与ToT类似。但是，1层TP在寻找最优最短路径方面，已经取得了非常有竞争力的性能。

此外，与0层TP（IO）相比，1层TP的性能增益也非常显著。图5 (a) 显示了2层TP的token成本增加。

GPT-4的人类化推理能力大幅提升！中国科学院提出「思维传播」，类比思考超越CoT，即刻应用

创意写作

下表2显示了TP和基线在GPT-3.5和GPT-4中的表现。在一致性上，TP都超过了基线。另外，在用户研究中，TP在创意写作中人类偏好提高了13%。

GPT-4的人类化推理能力大幅提升！中国科学院提出「思维传播」，类比思考超越CoT，即刻应用

LLM智能体规划

在第三个任务评估中，研究人员使用ALFWorld游戏套件，在134个环境中实例化LLM智能体规划任务。

TP在LLM智能体规划中任务完成率提高15%。这表明，在完成类似任务时，对成功规划的反思TP具有优越性。

GPT-4的人类化推理能力大幅提升！中国科学院提出「思维传播」，类比思考超越CoT，即刻应用

根据上述实验结果表明，「思维传播」可以应用于各种不同的推理任务，并且在所有这些任务中表现出色

增强LLM推理的关键

「思维传播」模型为复杂的LLM推理提供了一种全新的技术。

类比思维是人类解决问题能力的标志，它可以带来一系列系统性的优势，比如更高效的搜索和错误纠正

在类似的情况下，LLM也可以通过提示类比思维来更好地克服自身的弱点，比如缺乏可重用的知识和级联的局部错误等

然而，这些研究结果有一些限制

生成有用的类比问题并保持推理路径的简洁并不容易。此外，更长的链式类比推理路径可能会变得冗长而难以理解。同时，控制和协调多步推理链也是一个相当困难的任务

不过，「思维传播」还是通过创造性地解决LLM的推理缺陷，为我们提供了一个有趣的方法。

随着进一步的发展，类比思维可能会使LLM的推理能力变得更加强大。这也为在大型语言模型中实现更接近人类推理的目标指明了方向

作者介绍

Ran He（赫然）

GPT-4的人类化推理能力大幅提升！中国科学院提出「思维传播」，类比思考超越CoT，即刻应用

他是中国科学院自动化研究所模式识别国家实验室和中国科学院大学的教授，同时也是IAPR Fellow和IEEE高级会员

他之前在大连理工大学获得了学士和硕士学位，并于2009年在中国科学院自动化研究所获得了博士学位

他的研究方向是生物识别算法（人脸识别与合成、虹膜识别、人物再识别）、表征学习（使用弱/自监督或迁移学习预训练网络）、生成学习（生成模型、图像生成、图像翻译）。

他在国际期刊和会议上发表了200多篇论文，其中包括IEEE TPAMI、IEEE TIP、IEEE TIFS、IEEE TNN、IEEE TCSVT等知名国际期刊，以及CVPR、ICCV、ECCV、NeurIPS等顶级国际会议

他是IEEE TIP、IEEE TBIOM和Pattern Recognition编委会成员，还曾担任CVPR、ECCV、NeurIPS、ICML、ICPR和IJCAI等国际会议的区域主席

Junchi Yu（俞俊驰）

GPT-4的人类化推理能力大幅提升！中国科学院提出「思维传播」，类比思考超越CoT，即刻应用

俞俊驰是中国科学院自动化研究所的博士四年级学生，他的导师是赫然教授

他之前在腾讯人工智能实验室实习过，与Tingyang Xu博士、Yu Rong博士、Yatao Bian博士和Junzhou Huang教授一起工作过。现在，他是耶鲁大学计算机科学系的交流生，师从Rex Ying教授

他的目标是研发一种具有良好可解释性和可移植性的可信图学习（TwGL）方法，并探索其在生物化学领域的应用

到这里，我们也就讲完了《GPT-4的人类化推理能力大幅提升！中国科学院提出「思维传播」，类比思考超越CoT，即刻应用》的内容了。个人认为，基础知识的学习和巩固，是为了更好的将其运用到项目中，欢迎关注golang学习网公众号，带你了解更多关于模型,研究的知识点！

模型研究

版本声明

本文转载于：51CTO.COM 如有侵犯，请联系study_golang@163.com删除

【论文解读】基于图的自监督学习联合嵌入预测架构

【论文解读】基于图的自监督学习联合嵌入预测架构

上一篇: 【论文解读】基于图的自监督学习联合嵌入预测架构

微软AR眼镜专利：创新热插拔电池设计，解决续航问题

下一篇: 微软AR眼镜专利：创新热插拔电池设计，解决续航问题

查看更多

最新文章

科技周边 · 人工智能 | 3天前 | AI绘画

AI绘画工具安装与配置教程

339浏览收藏
科技周边 · 人工智能 | 3天前 |

海螺AI语音功能测评与体验分享

260浏览收藏
科技周边 · 人工智能 | 3天前 |

ChatGPT读不了加密PDF？先解密再上传

438浏览收藏
科技周边 · 人工智能 | 3天前 |

千问AI测试规范与覆盖率提升技巧

152浏览收藏
科技周边 · 人工智能 | 3天前 |

MiniMaxMusic2.0专业模式上线：音乐创作新神器

232浏览收藏
科技周边 · 人工智能 | 3天前 |

即梦AI音乐可视化效果评测

280浏览收藏
科技周边 · 人工智能 | 3天前 | 豆包AI 豆包AI助手

豆包AI写诗技巧与教程分享

152浏览收藏
科技周边 · 人工智能 | 3天前 | openclaw

OpenClawAI摘要生成技巧全解析

102浏览收藏
科技周边 · 人工智能 | 3天前 |

百度发布DuMate智能体，李彦宏解读DAA新定义

247浏览收藏
科技周边 · 人工智能 | 3天前 |

智谱清影制作鸟瞰街景镜头教程

306浏览收藏
科技周边 · 人工智能 | 3天前 | openclaw

OpenClaw框架解析与技术亮点揭秘

357浏览收藏
科技周边 · 人工智能 | 3天前 |

即梦AI美妆详情页提示词技巧

334浏览收藏

查看更多

课程推荐

前端进阶之JavaScript设计模式

设计模式是开发人员在软件开发过程中面临一般问题时的解决方案，代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景，打造一站式知识长龙服务，适合有JS基础的同学学习。

543次学习
GO语言核心编程课程

本课程采用真实案例，全面具体可落地，从理论到实践，一步一步将GO核心编程技术、编程思想、底层实现融会贯通，使学习者贴近时代脉搏，做IT互联网时代的弄潮儿。

516次学习
简单聊聊mysql8与网络通信

如有问题加微信：Le-studyg；在课程中，我们将首先介绍MySQL8的新特性，包括性能优化、安全增强、新数据类型等，帮助学生快速熟悉MySQL8的最新功能。接着，我们将深入解析MySQL的网络通信机制，包括协议、连接管理、数据传输等，让

500次学习
JavaScript正则表达式基础与实战

在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。

487次学习
从零制作响应式网站—Grid布局

本系列教程将展示从零制作一个假想的网络科技公司官网，分为导航，轮播，关于我们，成功案例，服务流程，团队介绍，数据部分，公司动态，底部信息等内容区块。网站整体采用CSSGrid布局，支持响应式，有流畅过渡和展现动画。

485次学习

查看更多

AI推荐

ChatExcel酷表

ChatExcel酷表是由北京大学团队打造的Excel聊天机器人，用自然语言操控表格，简化数据处理，告别繁琐操作，提升工作效率！适用于学生、上班族及政府人员。

6004次使用
Any绘本

探索Any绘本（anypicturebook.com/zh），一款开源免费的AI绘本创作工具，基于Google Gemini与Flux AI模型，让您轻松创作个性化绘本。适用于家庭、教育、创作等多种场景，零门槛，高自由度，技术透明，本地可控。

6424次使用
可赞AI

可赞AI，AI驱动的办公可视化智能工具，助您轻松实现文本与可视化元素高效转化。无论是智能文档生成、多格式文本解析，还是一键生成专业图表、脑图、知识卡片，可赞AI都能让信息处理更清晰高效。覆盖数据汇报、会议纪要、内容营销等全场景，大幅提升办公效率，降低专业门槛，是您提升工作效率的得力助手。

6232次使用
星月写作

星月写作是国内首款聚焦中文网络小说创作的AI辅助工具，解决网文作者从构思到变现的全流程痛点。AI扫榜、专属模板、全链路适配，助力新人快速上手，资深作者效率倍增。

8207次使用
MagicLight

MagicLight.ai是全球首款叙事驱动型AI动画视频创作平台，专注于解决从故事想法到完整动画的全流程痛点。它通过自研AI模型，保障角色、风格、场景高度一致性，让零动画经验者也能高效产出专业级叙事内容。广泛适用于独立创作者、动画工作室、教育机构及企业营销，助您轻松实现创意落地与商业化。

6822次使用

查看更多

相关文章

GPT-4王者加冕！读图做题性能炸天，凭自己就能考上斯坦福

2023-04-25 501浏览
单块V100训练模型提速72倍！尤洋团队新成果获AAAI 2023杰出论文奖

2023-04-24 501浏览
ChatGPT 真的会接管世界吗？

2023-04-13 501浏览
VR的终极形态是「假眼」？Neuralink前联合创始人掏出新产品：科学之眼！

2023-04-30 501浏览
实现实时制造可视性优势有哪些？

2023-04-15 501浏览

Golang学习网：公益在线Go学习平台，帮助Go学习者快速成长！

技术交流群

Copyright 2023 http://www.17golang.com/ All Rights Reserved ｜苏ICP备2023003363号-1

关注公众号

Golang学习网

微信登录更方便

密码登录
注册账号

登录即同意用户协议和隐私政策

返回登录

重置密码