当前位置:首页 > 文章列表 > 科技周边 > 人工智能 > 曾让Kimi「崩了」的探索版有多厉害?10倍搜索量、精读超500页面,一手实测来了

曾让Kimi「崩了」的探索版有多厉害?10倍搜索量、精读超500页面,一手实测来了

来源:机器之心 2024-10-19 09:01:05 0浏览 收藏

在科技周边实战开发的过程中,我们经常会遇到一些这样那样的问题,然后要卡好半天,等问题解决了才发现原来一些细节知识点还是没有掌握好。今天golang学习网就整理分享《曾让Kimi「崩了」的探索版有多厉害?10倍搜索量、精读超500页面,一手实测来了》,聊聊,希望可以帮助到正在努力赚钱的你。

AI好好用报道

编辑:杨文
Kimi国庆「憋」大招,「憋」出个探索版。

前不久,市场上就有传言称,月之暗面国庆「憋大招」。

至于这个「大招」具体是啥,众说纷纭:

有人说和多模态有关,还有人说是关于深度推理的。

不过,就在上周五,月之暗面高调宣布,上线 Kimi 探索版。

曾让Kimi「崩了」的探索版有多厉害?10倍搜索量、精读超500页面,一手实测来了

消息一出,不少体验者纷纷涌入官网,「Kimi 崩了」也一度登上热搜。

曾让Kimi「崩了」的探索版有多厉害?10倍搜索量、精读超500页面,一手实测来了

那么,这个探索版厉害在哪儿?它与 Kimi 普通版有啥区别?

这么说吧,Kimi 探索版的搜索量是普通版的 10 倍,一次搜索即可精读超过 500 个页面。

而且,它还能模拟人类的推理思考过程,多级分解复杂问题,并进行深度搜索,即时反思改进结果。

这似乎和 OpenAI 的 o1 有着异曲同工之妙。

Kimi 官方也很自信,「如果 Kimi 搜不到的信息,那大概率用户也很难自己通过传统搜索引擎找到」。

接下来,我们就实地测评一下,看看 10 倍搜索量、一次搜索可精读超 500 个页面的 Kimi 探索版,到底是搞噱头还是真实力?

Kimi 官网链接:https://kimi.moonshot.cn/

1. 中国票房过四十亿的电影都讲了什么故事?

我们先通过这个娱乐性的问题,一窥 Kimi 探索版的「脑回路」。

曾让Kimi「崩了」的探索版有多厉害?10倍搜索量、精读超500页面,一手实测来了

在答题之前,它会像分析师一样,预先规划解决问题的整体策略,将复杂问题分解为层次化的子问题,然后分步来执行。

具体来说,它先全网搜索中国票房过 40 亿的电影,然后查找这些电影的故事情节介绍。

在搜索过程中,它会把复杂提问转换成多个匹配的搜索关键词,并基于前一步的搜索结果来实时生成下一步的搜索关键词。

曾让Kimi「崩了」的探索版有多厉害?10倍搜索量、精读超500页面,一手实测来了

此外,它还能即时反思搜索结果,在发现第一次回答中的情节简介存在信息缺失时,会主动补充更多内容。

曾让Kimi「崩了」的探索版有多厉害?10倍搜索量、精读超500页面,一手实测来了

我们又让它来总结上榜的电影具体票房,其回答与搜索引擎上的结果一致。

曾让Kimi「崩了」的探索版有多厉害?10倍搜索量、精读超500页面,一手实测来了

那么,Kimi 普通版的表现如何呢?

其工作流程是先理解问题,然后通过较为粗略的关键词搜索网页。

曾让Kimi「崩了」的探索版有多厉害?10倍搜索量、精读超500页面,一手实测来了

从网页阅读数量来看,普通版仅阅读了 25 个网页,而探索版则是 40 个。

虽然普通版整体上回答没毛病,但是对于影片故事的介绍过于简单,也无法反思搜索结果。

曾让Kimi「崩了」的探索版有多厉害?10倍搜索量、精读超500页面,一手实测来了

2. 请帮我总结一下特斯拉发布会

前几天的特斯拉发布会算是科技圈的大新闻了。

我们就让它总结一下特斯拉发布会的情况。

曾让Kimi「崩了」的探索版有多厉害?10倍搜索量、精读超500页面,一手实测来了

它阅读了 11 个网页,并在界面右侧显示所有的搜索结果,从中提取出四大亮点,分别是 Robotaxi、Robovan、Optimus 机器人和 FSD 自动驾驶,还分条缕析地介绍了它们的功能、设计、成本等。

我们进行了一一比对,回答全部正确,没有出现满嘴跑火车的现象。

我们继续追问,特斯拉发布了无人驾驶出租车,为啥股票会跌?

Kimi 探索版不仅搜索了中文网站,还使用英文关键词,网罗了 CBS、CNN 等外文媒体报道。

曾让Kimi「崩了」的探索版有多厉害?10倍搜索量、精读超500页面,一手实测来了

如果我们点击它回答中的小引号,界面右侧则会显示出引用的原文信息,这极大地降低了幻觉发生的可能性。

曾让Kimi「崩了」的探索版有多厉害?10倍搜索量、精读超500页面,一手实测来了

3. 甄嬛的生日和薛宝钗的生日相差几天?

我们再来问个无厘头的问题。

一直以来,大模型都是重度偏科者,写小作文嘎嘎好使,但一到数学题就抓瞎 ——

9.9 和 9.11 谁大分不清,strawberry 几个 r 搞不明白。

不过,计算甄嬛和薛宝钗这俩八杆子打不着的影视人物的生日,Kimi 探索版有一套自己的解题思路。

曾让Kimi「崩了」的探索版有多厉害?10倍搜索量、精读超500页面,一手实测来了

在答题之前,Kimi 探索版先是全网搜索甄嬛和薛宝钗的生日分别是哪天,并在页面右侧显示所有的搜索结果。

然后来到重头戏,计算二者生日差值。

它先算出从正月二十一到四月十七,每个月有几天,然后分别算出总天数,全部相加即可。

不过,它的回答还是有瑕疵,因为农历月份长度以朔望月为准,正月的天数并不固定,因此最终的计算结果仍有偏差。

4.Elon Musk 的生日和 Sam AItman 的生日相差几天?详细介绍计算过程。

农历的计算方法过于复杂,我们也搞不清楚,因此,就让 Kimi 探索版再计算一下马斯克和奥特曼的生日差。

曾让Kimi「崩了」的探索版有多厉害?10倍搜索量、精读超500页面,一手实测来了

我们专门用日期计算器检验了一下,Kimi 探索版回答正确。

5. 奥利弗在星期五摘了 44 个猕猴桃。然后在星期六摘了 58 个猕猴桃。星期天,他摘的猕猴桃数量是星期五的两倍,但其中 5 个比平均大小要小。奥利弗有多少个猕猴桃?

前天,本站发布了一篇题为《给小学数学题加句「废话」,OpenAI o1 就翻车了,苹果新论文质疑 AI 推理能力》的文章。

我们就拿文中的数学题来测一下 Kimi 探索版。

先来个正常的:奥利弗在星期五摘了 44 个猕猴桃。然后在星期六摘了 58 个猕猴桃。星期天,他摘的猕猴桃数量是星期五的两倍,奥利弗有多少个猕猴桃?

曾让Kimi「崩了」的探索版有多厉害?10倍搜索量、精读超500页面,一手实测来了

Kimi 探索版先把思路梳理得清清楚楚,然后每一步的执行都相当准确。

我们又在这道题目中,加了一句废话「但其中 5 个比平均大小要小」,OpenAI 的 o1 就翻了车。

曾让Kimi「崩了」的探索版有多厉害?10倍搜索量、精读超500页面,一手实测来了

但是,Kimi 探索版竟然没有被误导,得出了正确答案。

曾让Kimi「崩了」的探索版有多厉害?10倍搜索量、精读超500页面,一手实测来了

目前,Kimi 探索版已覆盖全量用户。大家也抓紧去薅一波吧~

工具链接——

Kimi官网链接:https://kimi.moonshot.cn/

以后我们会带来更多好玩的AI评测,也欢迎大家进群交流。

曾让Kimi「崩了」的探索版有多厉害?10倍搜索量、精读超500页面,一手实测来了

以上就是本文的全部内容了,是否有顺利帮助你解决问题?若是能给你带来学习上的帮助,请大家多多支持golang学习网!更多关于科技周边的相关知识,也可关注golang学习网公众号。

版本声明
本文转载于:机器之心 如有侵犯,请联系study_golang@163.com删除
何时在 Java 中使用 lambda 表达式创建函数?何时在 Java 中使用 lambda 表达式创建函数?
上一篇
何时在 Java 中使用 lambda 表达式创建函数?
DNS 及其工作原理
下一篇
DNS 及其工作原理
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    508次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    497次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • 茅茅虫AIGC检测:精准识别AI生成内容,保障学术诚信
    茅茅虫AIGC检测
    茅茅虫AIGC检测,湖南茅茅虫科技有限公司倾力打造,运用NLP技术精准识别AI生成文本,提供论文、专著等学术文本的AIGC检测服务。支持多种格式,生成可视化报告,保障您的学术诚信和内容质量。
    131次使用
  • 赛林匹克平台:科技赛事聚合,赋能AI、算力、量子计算创新
    赛林匹克平台(Challympics)
    探索赛林匹克平台Challympics,一个聚焦人工智能、算力算法、量子计算等前沿技术的赛事聚合平台。连接产学研用,助力科技创新与产业升级。
    150次使用
  • SEO  笔格AIPPT:AI智能PPT制作,免费生成,高效演示
    笔格AIPPT
    SEO 笔格AIPPT是135编辑器推出的AI智能PPT制作平台,依托DeepSeek大模型,实现智能大纲生成、一键PPT生成、AI文字优化、图像生成等功能。免费试用,提升PPT制作效率,适用于商务演示、教育培训等多种场景。
    145次使用
  • 稿定PPT:在线AI演示设计,高效PPT制作工具
    稿定PPT
    告别PPT制作难题!稿定PPT提供海量模板、AI智能生成、在线协作,助您轻松制作专业演示文稿。职场办公、教育学习、企业服务全覆盖,降本增效,释放创意!
    134次使用
  • Suno苏诺中文版:AI音乐创作平台,人人都是音乐家
    Suno苏诺中文版
    探索Suno苏诺中文版,一款颠覆传统音乐创作的AI平台。无需专业技能,轻松创作个性化音乐。智能词曲生成、风格迁移、海量音效,释放您的音乐灵感!
    149次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码