Meta智能眼镜用上多模态Llama 3!国内AR眼镜机会来了
一分耕耘,一分收获!既然都打开这篇《Meta智能眼镜用上多模态Llama 3!国内AR眼镜机会来了》,就坚持看下去,学下去吧!本文主要会给大家讲到等等知识点,如果大家对本文有好的建议或者看到有不足之处,非常欢迎大家积极提出!在后续文章我会继续更新科技周边相关的内容,希望对大家都有所帮助!
科幻大片中的AR黑科技,竟走进了现实!
刚刚,Meta自家的雷朋智能眼镜已经开始支持多模态版的Llama 3了!要知道,Llama 3的开源版本还没有支持多模态呢。
最近,小扎还在谈论中承认了开源价值100亿美元的模型。不过,如果涉及到产品侧,那就是另一回事了。
诶,产品这不就来了么——
戴上这副智能眼镜,外出旅行坐车感到无聊时,可以让Meta来点音乐。
带着AR眼镜,还可以直接翻译不认识的语言。又或者在路上腾不出手时,Meta可以给好友发语音信息。
走到一座建筑前,呼叫Meta告诉自己关于它更多的信息。
甚至,视频电话、直播,科普等,只要是你能想到的,AR眼镜全可以做的到。
Meta介绍,去年12月便开始在雷朋Meta智能眼镜上,测试了多模态AI。目前,已经在美国和加拿大地区销售的眼镜上推出了这一新功能。
小扎也来炫技了
这款眼镜配备了一个1200万像素的摄像头和五个麦克风,集成Meta AI助手后,意味着带着它可以做更多的事。
你看到的任何东西,它都能描述出来。
只需说一句,「Hey Meta,看看这个,告诉我它是什么?」,语音命令即可控制。
看着厨房柜台上一堆食材,Meta能够迅速制作出相关的食谱。
更有意思的是,小扎本人还在Ins发布一个带上智能眼镜,为自己挑选衣服的视频。
他挑选了一个深色的衬衣,并问Meta我应该搭配个什么样的裤子。Meta给出了牛仔裤、短裤的建议。
他还让智能眼镜给一张萌宠的照片,配上了有趣的描述。
小扎手里拿着一种水果,智能眼镜能告诉他这是面包果。
而对于AR眼镜来说,实时翻译将成为一款杀手级应用。
当你旅行时,正在试着读一份法语菜单。不用查阅手机,智能眼镜就可以完成实时翻译。
它甚至可以阅读不同语言的手势,简直是旅行必备单品。
此外,除了得到多模态Llama 3的加持,Meta还公布了智能眼镜集成了WhatsApp和Messenger的免提视频通话。
与此同时,不同时尚款式的镜框设计,都可以专配处方镜使用。
不过,这款智能眼镜起价为300美元(2100元),并不便宜。
实测外出识物,比手机方便
蹭着更新的热乎劲儿,外媒The Verge发布了提前拿到内测资格的评测。
前段时间,Humane智能设备AI Pin因性能不如人意,全网陷入了非议之中。关键是700美元,根本不值。
作者表示,「我们要对Meta智能眼镜的期望值不要太高,因为它并非无所不能」。
测试中的一半的乐趣,就是找到它的极限在哪。
它能否正确识别街上这辆随机的汽车?(一辆Alfa Romeo Giulia Quadrifoglio和一辆Alfa Romeo Tonale)。
与大多数AI一样,Meta AI有时非常准确,有时又会出现幻觉。
它正确地识别出了Giulia。但Tonale也被识别为Giulia。
但有趣的是,这两款车几乎没有相似之处,Giulia是一款轿车,而Tonale是一款跨界SUV。
作者还让它识别自己种的多肉植物(由于有些是别人送的,自己也并不完全清楚具体品种)。
Meta回答的是,「Echeveria、aloe vera芦荟和Crassula品种」。
但其实,作者用可通过AI照片识别植物的应用程序Planta进行验证,发现植物当中没有一株是Echeveria。
最精彩的是,作者的爱人偶然看到邻居家后院一只大松鼠,戴上智能眼镜去要识别出是什么品种。
作者用手机拍下了照片,并用另一款应用试了一番。
果然,Meta识别错了,而作者使用的APP成功识别出它是土拨鼠。
然而,当再用智能眼镜去识别手机中的照片时,确给出了「土拨鼠」正确的答案。
这个案例中,说明了AR眼镜缺少「变焦」功能,才导致回答错误。
除了多模态识别能力之外,作者测试其与手机配对时,响应速度也是非常地快。同时,智能眼镜将声音功能集成一体,省去了戴眼镜的麻烦,让交互更加自然。
总得来说,Meta智能眼镜在户外活动,AI助手在识别事物上发挥了巨大的作用。
以往,作者外出看到感兴趣的东西时,需要掏出手机拍照在识别。
而现在,智能眼镜也可以很好地延伸手机的能力,前提是不要将想要识别的内容放大很多倍。
今天带大家了解了的相关知识,希望对你有所帮助;关于科技周边的技术知识我们会一点点深入介绍,欢迎大家关注golang学习网公众号,一起学习编程~

- 上一篇
- 将 CGO 中的字符串数组转换为 GO

- 下一篇
- 苹果新款iPad Pro 2024即将亮相:配备顶级OLED屏幕,更轻薄设计
-
- 科技周边 · 人工智能 | 1分钟前 |
- 豆包AI语音上传功能使用教程
- 230浏览 收藏
-
- 科技周边 · 人工智能 | 12分钟前 |
- 豆包AI编程指南 豆包开发辅助教程
- 106浏览 收藏
-
- 科技周边 · 人工智能 | 15分钟前 | 画中画 蒙版 VisionStory 视觉叙事 视频效果
- VisionStory画中画与蒙版使用全解析
- 349浏览 收藏
-
- 科技周边 · 人工智能 | 22分钟前 |
- 豆包AI语音合成解析与多音色设置教程
- 250浏览 收藏
-
- 科技周边 · 人工智能 | 34分钟前 |
- 豆包AI编程技巧全攻略
- 283浏览 收藏
-
- 科技周边 · 人工智能 | 1小时前 |
- Deepseek满血版联手Prepostseo,优化更高效
- 454浏览 收藏
-
- 科技周边 · 人工智能 | 1小时前 |
- ChatGPTAPI调用教程与接入指南
- 253浏览 收藏
-
- 科技周边 · 人工智能 | 1小时前 |
- 豆包AI编程教程与代码生成实战
- 149浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 511次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 498次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 484次学习
-
- 千音漫语
- 千音漫语,北京熠声科技倾力打造的智能声音创作助手,提供AI配音、音视频翻译、语音识别、声音克隆等强大功能,助力有声书制作、视频创作、教育培训等领域,官网:https://qianyin123.com
- 167次使用
-
- MiniWork
- MiniWork是一款智能高效的AI工具平台,专为提升工作与学习效率而设计。整合文本处理、图像生成、营销策划及运营管理等多元AI工具,提供精准智能解决方案,让复杂工作简单高效。
- 162次使用
-
- NoCode
- NoCode (nocode.cn)是领先的无代码开发平台,通过拖放、AI对话等简单操作,助您快速创建各类应用、网站与管理系统。无需编程知识,轻松实现个人生活、商业经营、企业管理多场景需求,大幅降低开发门槛,高效低成本。
- 169次使用
-
- 达医智影
- 达医智影,阿里巴巴达摩院医疗AI创新力作。全球率先利用平扫CT实现“一扫多筛”,仅一次CT扫描即可高效识别多种癌症、急症及慢病,为疾病早期发现提供智能、精准的AI影像早筛解决方案。
- 170次使用
-
- 智慧芽Eureka
- 智慧芽Eureka,专为技术创新打造的AI Agent平台。深度理解专利、研发、生物医药、材料、科创等复杂场景,通过专家级AI Agent精准执行任务,智能化工作流解放70%生产力,让您专注核心创新。
- 183次使用
-
- GPT-4王者加冕!读图做题性能炸天,凭自己就能考上斯坦福
- 2023-04-25 501浏览
-
- 单块V100训练模型提速72倍!尤洋团队新成果获AAAI 2023杰出论文奖
- 2023-04-24 501浏览
-
- ChatGPT 真的会接管世界吗?
- 2023-04-13 501浏览
-
- VR的终极形态是「假眼」?Neuralink前联合创始人掏出新产品:科学之眼!
- 2023-04-30 501浏览
-
- 实现实时制造可视性优势有哪些?
- 2023-04-15 501浏览