从AI@'22大会,看谷歌的生成式AI战略及进展
对于一个科技周边开发者来说,牢固扎实的基础是十分重要的,golang学习网就来带大家一点点的掌握基础知识点。今天本篇文章带大家了解《从AI@'22大会,看谷歌的生成式AI战略及进展》,主要介绍了,希望对大家的知识积累有所帮助,快点收藏起来吧,否则需要时就找不到了!
2022年是生成式AI发展进程中的重要一年。大型语言模型在生成文本和软件代码方面不断取得进展。与此同时,随着DALL-E2、Imagen和StableDiffusion等模型的引入,人们看到了文本到图像生成器的巨大进步。
2022年还标志着生成式AI模型的产品化加速。生成模型的科学和技术如今已经发展成熟到能够解决实际问题的地步。像微软和谷歌这样的公司正在寻求一个新市场中占据领先地位的方法,这可能会改变创造力的未来。
谷歌公司在其日前举办的AI@'22大会上,展示了在其产品利用生成模型的路线图。其战略可能是该领域的发展方向和未来竞争可能发生变化的前奏。
谷歌的生成模型进展
谷歌Parti使用Transformers从文本令牌创建图像
在AI@'22会议上,谷歌研究中心首席科学家Douglas Eck列出了该公司目前在四个领域对生成模型的研究:文本、源代码、音频、图像和视频。
谷歌目前正在所有这些领域运行测试项目,着眼于在未来创建产品。Wordcraft Writers Workshop致力于帮助作者在写作中从大型语言模型中获得帮助。这是一个使用语言模型LaMDA根据用户提供的提示生成文字的工具。该工具被设计成在一个迭代过程中使用模型,在这个过程中,作者和大型语言模型(LLM)进行交互,共同创建故事。
Eck说,“使用LaMDA来写一个完整的故事将成为了一个死胡同。当它用来增加趣味、为特定角色或增强故事的某个方面时,这可能是一个更有效的工具。用户界面也必须是正确的。Wordcraft工具是从头开始设计的,可以让作者与生成模型进行交互。”
学习代码是一个使用大型语言模型(LLM)为开发人员生成代码建议的项目。谷歌目前正在内部测试该工具,它包括单行和多行代码完成建议。
AudioLM使用语言模型生成音频。该模型将一个音频样本作为输入。它可以用来生成音乐和语音。
也许Eck在AI@'22会议上展示的最先进的模型是文本到图像模型Imagen和Parti。Imagen的工作原理类似于OpenAI的DALL-E2,它使用扩散模型将语言嵌入转化为图像。Parti使用Transformers架构从文本标记生成图像。DreamBooth是一个可以调优文本到图像生成器(如Imagen)的模型,以在不同的场景中显示主题。DreamFusion将扩散模型的功能与神经辐射场(NeRF)结合起来,神经辐射场(NeRF)是一种深度学习架构,可以从2D图像创建3D模型。
谷歌DreamBooth对生成模型进行微调,以在不同的环境中显示特定的主题
Eck还展示了谷歌与Imagen Video和Phenaki在视频生成方面的研究的预览。Imagen Video使用扩散模型创建一系列高分辨率图像,这些图像可以拼接在一起创建视频。Phenaki基于Transformers架构,将文本提示序列转换为图像序列。Imagen Video和Phenaki结合使用,可根据提示序列创建高分辨率视频。
谷歌的生成模型战略
Eck在会上演讲中明确表示,生成式模型并不意味着自动化或取代人类的创造力。“这不再是一个创造现实画面的生成模型,而是自己创造的东西。技术应该满足我们的需要,让我们对自己的工作有代理权和创造性的控制权。”
在讨论谷歌的“负责任的AI”战略时,他进一步强调了这一点,并在演讲结束时说:“创造力是使我们成为人类的重要组成部分。我认为在构建这些AI系统时,牢记这一点很重要。”
Eck的一些言论是为了缓解生成式AI模型取代人类创造力的恐惧(这在很大程度上被夸大了),强调积极的影响,将该领域转向以人为中心的AI。AI系统应该以一种提供透明度和控制的方式设计,以增强人类的能力。如果没有人类的控制和监督,生成模型等AI系统将表现不佳,因为它们无法像人类一样掌握基本概念。
谷歌能在生成式AI领域获得竞争优势吗?
AI研究和产品化之间的差距很难弥合。当然,谷歌的大型语言模型(LLM)和文本到图像模型的质量不会低于OpenAI的GPT-3和DALL-E2。但问题是,谷歌能否基于这些模式推出成功的产品?
在考虑将技术产品化时,需要考虑以下一些问题:这项技术会成为新产品的基础技术吗?如果没有,它会被集成到现有的产品中吗?它解决的是什么问题,目前存在的替代解决方案是什么?产品是否提供了足够的附加值来说服用户转换?它是否有助于巩固企业在现有市场中的地位?
企业通常会将技术带到他们擅长的领域或市场。在写作领域,微软领先于谷歌。Office 365的市场份额超过了GSuite,在将大型语言模型(LLM)集成到其产品中方面,微软公司已经领先一步。
微软在GitHub Copilot和Codex的编码方面也处于领先地位,它们已经进入生产模式,而不是谷歌的内部代码生成工具。谷歌最受欢迎的开发工具是Colab和Android Studio,这将为它提供一个测试和推出代码AI的场所。但这些集成开发环境(IDE)的市场份额无法与微软的Visual Studio Code和GitHub Codespaces(也属于微软)相提并论。
在图像、视频和音频领域,Adobe公司将成为生成式AI的赢家。Adobe公司已经拥有最大的市场份额和完善的工具,并定期更新AI功能。Adobe已经在其工具套件中尝试生成式AI工具。
然而,这并不意味着现有这些公司一定会主导生成式AI领域。目前,从目前使用的工具(如文字处理器、集成开发环境和图像编辑应用程序)的角度来看待生成模型。基本上,行业厂商正在研究生成模型如何自动化或改进已经在做的任务(完成句子、编写代码块、编辑或生成照片等等)。当他们创造新的工具系统和工作流程时,AI的真正潜力将得到充分发挥,这些工具和流程能够充分利用生成模型和AI的其他进步,以完全不同的方式来实现目标。
正如谷歌重塑了信息发现模式,亚马逊随着网络的普及重塑了购物模式那样,发现并拥抱AI新机遇的企业必然会改变市场现状或塑造新的市场。
好了,本文到此结束,带大家了解了《从AI@'22大会,看谷歌的生成式AI战略及进展》,希望本文对你有所帮助!关注golang学习网公众号,给大家分享更多科技周边知识!

- 上一篇
- 首届海淀“警学联盟·校园无诈”创意大赛开始啦!

- 下一篇
- 如何在 iPhone 上设置更强的密码
-
- 科技周边 · 人工智能 | 4小时前 |
- 宝马新设计语言全面普及,曾被质疑
- 447浏览 收藏
-
- 科技周边 · 人工智能 | 4小时前 | ChatGPT 展览文案
- ChatGPT怎么写展览文案?艺术策展技巧
- 241浏览 收藏
-
- 科技周边 · 人工智能 | 4小时前 |
- 官方认证!DeepSeek满血版入口及功能详解
- 141浏览 收藏
-
- 科技周边 · 人工智能 | 4小时前 | 豆包AI 报告生成
- 豆包AI生成报告步骤详解
- 284浏览 收藏
-
- 科技周边 · 人工智能 | 4小时前 |
- 豆包AI协程技巧深度解析
- 236浏览 收藏
-
- 科技周边 · 人工智能 | 5小时前 |
- 豆包AI能生成无障碍代码吗?
- 141浏览 收藏
-
- 科技周边 · 人工智能 | 5小时前 | 宁德时代
- 「全球能源循环计划」发布,电池产业将迎巨变?
- 485浏览 收藏
-
- 科技周边 · 人工智能 | 5小时前 |
- Premiere+DeepSeek:自动生成转场字幕方案
- 372浏览 收藏
-
- 科技周边 · 人工智能 | 5小时前 | 豆包AI
- 优化Python性能的3个实用技巧
- 414浏览 收藏
-
- 科技周边 · 人工智能 | 5小时前 |
- 设计神器DeepSeek+Canva快速出图教程
- 441浏览 收藏
-
- 科技周边 · 人工智能 | 5小时前 |
- Kimi-Dev:月之暗面开源模型解析
- 281浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 484次学习
-
- 茅茅虫AIGC检测
- 茅茅虫AIGC检测,湖南茅茅虫科技有限公司倾力打造,运用NLP技术精准识别AI生成文本,提供论文、专著等学术文本的AIGC检测服务。支持多种格式,生成可视化报告,保障您的学术诚信和内容质量。
- 144次使用
-
- 赛林匹克平台(Challympics)
- 探索赛林匹克平台Challympics,一个聚焦人工智能、算力算法、量子计算等前沿技术的赛事聚合平台。连接产学研用,助力科技创新与产业升级。
- 170次使用
-
- 笔格AIPPT
- SEO 笔格AIPPT是135编辑器推出的AI智能PPT制作平台,依托DeepSeek大模型,实现智能大纲生成、一键PPT生成、AI文字优化、图像生成等功能。免费试用,提升PPT制作效率,适用于商务演示、教育培训等多种场景。
- 160次使用
-
- 稿定PPT
- 告别PPT制作难题!稿定PPT提供海量模板、AI智能生成、在线协作,助您轻松制作专业演示文稿。职场办公、教育学习、企业服务全覆盖,降本增效,释放创意!
- 145次使用
-
- Suno苏诺中文版
- 探索Suno苏诺中文版,一款颠覆传统音乐创作的AI平台。无需专业技能,轻松创作个性化音乐。智能词曲生成、风格迁移、海量音效,释放您的音乐灵感!
- 174次使用
-
- GPT-4王者加冕!读图做题性能炸天,凭自己就能考上斯坦福
- 2023-04-25 501浏览
-
- 单块V100训练模型提速72倍!尤洋团队新成果获AAAI 2023杰出论文奖
- 2023-04-24 501浏览
-
- ChatGPT 真的会接管世界吗?
- 2023-04-13 501浏览
-
- VR的终极形态是「假眼」?Neuralink前联合创始人掏出新产品:科学之眼!
- 2023-04-30 501浏览
-
- 实现实时制造可视性优势有哪些?
- 2023-04-15 501浏览