当前位置:首页 > 文章列表 > 科技周边 > 人工智能 > 快手内测AI玩评:大模型与短视频的碰撞效应如何?

快手内测AI玩评:大模型与短视频的碰撞效应如何?

来源:搜狐 2023-09-26 09:21:03 0浏览 收藏

本篇文章主要是结合我之前面试的各种经历和实战开发中遇到的问题解决经验整理的,希望这篇《快手内测AI玩评:大模型与短视频的碰撞效应如何?》对你有很大帮助!欢迎收藏,分享给更多的需要的朋友学习~

“百模大战”近来又多了一个参与者,继上月推出了文生文的大语言模型“快意”后,快手方面不久前又上线了“文生图” 领域的自研大模型“可图”(Kolors)。作为短视频平台,快手的“可图”自然要用在自家的App上,依托可图大模型,快手方面也开始在短视频评论区内测“AI玩评”功能,试图解锁AIGC+短视频的新玩法。

快手内测AI玩评:大模型与短视频的碰撞效应如何?

据悉,快手的“AI玩评”是业内首次在大型App核心业务场景的评论区应用AIGC能力,该功能旨在提升用户在评论区的互动体验,用户可通过输入创意文字,即可轻松生成大量不同风格的图片,以丰富评论互动。用户只需要短视频的评论区输入6个字及以上的文字评论,点击评论框右下角的“AI”标识,就能一键生成评论配图,还可以点击“换换看”切换更多风格。

根据快手AI团队的说法,通过“AI玩评”功能,用户可以更准确、更有趣地表达自己的观点和情感,并在评论区进行更便捷的趣味互动,无需再寻找合适的图片或表情包,而是可以直接生成一张图片。据了解,AI玩评可以生成从赛博朋克、像素、写实动漫等常见风格,到新海诚、宫崎骏、大友克洋等个人风格浓厚的图片

快手内测AI玩评:大模型与短视频的碰撞效应如何?

通过分析用户输入的内容,绘制符合语义的图片已经成为Stable Diffusio、midjourney以及国内市场上各种拥有文生图功能的AI大模型的标配功能。换句话说,快手的AI玩评本质上是一个AI绘画工具,其背后的技术主要基于NLP自然语义处理,而准确识别用户想要表达的内容则是关键要素

AI玩评的效果取决于提示词(Prompt)。根据网友们的使用体验,如果文字评论中包含更多关于人物、景物、空间、动作等描述性内容,生成的图片就更符合实际情况。相反,如果评论中出现像“666”、“我的天!姐姐好厉害!”这样缺乏具体指代对象的模糊描述,AI生成的结果就无法看。因此,这个现实直接导致了AI玩评可能无法得到大多数用户的喜爱

快手内测AI玩评:大模型与短视频的碰撞效应如何?

问题来了,现阶段短视频平台的评论区是怎样的呢?实际上,这里是一个充满俏皮话、玩梗、抖机灵等情绪化内容的场景。由于短视频的特点,包括魔性洗脑的背景音乐、强烈刺激的画面和不确定的奖励机制,使得用户放弃思考,沉浸其中。因此,评论区里的评论通常只是简单的一句话,用户会用这句话来明确表达他们的好恶或观点

这一现实的结果,就是短视频评论区里用户输出的内容基本都是情绪化、缺乏定性的内容。试想一下,如果单纯是一堆形容词的堆砌,AI就会面临一个缺乏主体的困惑,也就是说最终AI生成的内容可能会与用户想要表达的差之千里。相信使用过Stable Diffusio、midjourney等工具的朋友都知道,如果Prompt是以形容词为主,那么缺乏名词的结果就是AI会放飞自我。

快手内测AI玩评:大模型与短视频的碰撞效应如何?

即便是目前最先进的GPT-4,在体验人类情感上其实也是有缺陷的,事实上,AI的情绪感知能力现阶段还是一个摆在所有AI研究者面前的难题。目前,一众AI大模型面向的领域不是严肃的生产力场景、就是与人类对话,几乎没有AI会涉及情绪化表达。所以这样一来,快手的AI玩评实际上很难做好本职工作,不给用户的评论拖后腿可能就不错了。

那么既然如此,快手又为什么要推出AI玩评呢?当然是为了让自家的文生图大模型“可图”,能有一个能落地的场景。而快手App本身几乎是快手唯一面向消费者的产品,所以“AIGC+短视频”就成为了他们几乎唯一能打出的牌。其实从这里就可以看到,快手作为移动互联网时代崛起的新巨头,在底蕴上相比BAT等传统巨头还是要逊色一些。

快手内测AI玩评:大模型与短视频的碰撞效应如何?

不同于几乎已经将自身打造成互联网水煤电的BAT,快手这一批在移动互联网时代成长起来的新巨头,目前几乎都呈现出业务线单一的“强干弱枝”特质,例如快手的核心业务基本上都是依托于快手App的,其他业务则几乎都还叫不上号。在这一轮AI概念爆发之前,一度曾被外界认为落寞的百度,除了搜索引擎之外、还做输入法,所以百度落地AI原生应用就可以被承载在百度输入法上。

可反观快手,现在除了快手App外,“可图”大模型还能用在哪里呢?如果要单独为AI大模型做一款App,快手就可能会失去先机。现在的情况,是国内市场各大AI大模型之间其实并没有在性能上拉开代差,各家的实际使用体验基本都差不多,而用户的选择往往也是有得用就行。即便是对于想要体验AI大模型魅力的用户,许多也都下载了有先发优势的百度文心一言。

快手内测AI玩评:大模型与短视频的碰撞效应如何?

事实上,要将AIGC与视频结合,B站可能做了个更好的示范。此前在今年夏季,B站推出了“AI视频小助理”账号,用户只需要在相应视频的评论区@AI视频小助理 ,后者就可以自动生成视频的文字摘要。对于B站的长视频而言,AI视频小助理的归纳和整理能够帮助用户在短时间完成信息提炼,所以自然就会受到许多用户的欢迎。

作为一款娱乐属性更为突出的产品,快手App想要更好地与AIGC结合,自然就要满足用户在娱乐方面的需求。比如根据评论智能生成表情包,可能就要远比在评论区里搞文生图更适合平台的氛围。

以上就是《快手内测AI玩评:大模型与短视频的碰撞效应如何?》的详细内容,更多关于AI评分,模型化学的资料请关注golang学习网公众号!

版本声明
本文转载于:搜狐 如有侵犯,请联系study_golang@163.com删除
10家单位共同发起成立“大零号湾”机器人创新联盟10家单位共同发起成立“大零号湾”机器人创新联盟
上一篇
10家单位共同发起成立“大零号湾”机器人创新联盟
解锁Microsoft查找我的设备锁定的计算机的方法
下一篇
解锁Microsoft查找我的设备锁定的计算机的方法
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    508次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    497次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • 毕业宝AIGC检测:AI生成内容检测工具,助力学术诚信
    毕业宝AIGC检测
    毕业宝AIGC检测是“毕业宝”平台的AI生成内容检测工具,专为学术场景设计,帮助用户初步判断文本的原创性和AI参与度。通过与知网、维普数据库联动,提供全面检测结果,适用于学生、研究者、教育工作者及内容创作者。
    12次使用
  • AI Make Song:零门槛AI音乐创作平台,助你轻松制作个性化音乐
    AI Make Song
    AI Make Song是一款革命性的AI音乐生成平台,提供文本和歌词转音乐的双模式输入,支持多语言及商业友好版权体系。无论你是音乐爱好者、内容创作者还是广告从业者,都能在这里实现“用文字创造音乐”的梦想。平台已生成超百万首原创音乐,覆盖全球20个国家,用户满意度高达95%。
    26次使用
  • SongGenerator.io:零门槛AI音乐生成器,快速创作高质量音乐
    SongGenerator
    探索SongGenerator.io,零门槛、全免费的AI音乐生成器。无需注册,通过简单文本输入即可生成多风格音乐,适用于内容创作者、音乐爱好者和教育工作者。日均生成量超10万次,全球50国家用户信赖。
    22次使用
  •  BeArt AI换脸:免费在线工具,轻松实现照片、视频、GIF换脸
    BeArt AI换脸
    探索BeArt AI换脸工具,免费在线使用,无需下载软件,即可对照片、视频和GIF进行高质量换脸。体验快速、流畅、无水印的换脸效果,适用于娱乐创作、影视制作、广告营销等多种场景。
    26次使用
  • SEO标题协启动:AI驱动的智能对话与内容生成平台 - 提升创作效率
    协启动
    SEO摘要协启动(XieQiDong Chatbot)是由深圳协启动传媒有限公司运营的AI智能服务平台,提供多模型支持的对话服务、文档处理和图像生成工具,旨在提升用户内容创作与信息处理效率。平台支持订阅制付费,适合个人及企业用户,满足日常聊天、文案生成、学习辅助等需求。
    27次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码