当前位置:首页 > 文章列表 > 科技周边 > 人工智能 > 谁能最早洞察AIGC的未来?独家专访昆仑万维董事长兼CEO方汉丨AI巡礼文娱行业

谁能最早洞察AIGC的未来?独家专访昆仑万维董事长兼CEO方汉丨AI巡礼文娱行业

来源:搜狐 2023-10-12 18:16:11 0浏览 收藏

欢迎各位小伙伴来到golang学习网,相聚于此都是缘哈哈哈!今天我给大家带来《谁能最早洞察AIGC的未来?独家专访昆仑万维董事长兼CEO方汉丨AI巡礼文娱行业》,这篇文章主要讲到等等知识,如果你对科技周边相关的知识非常感兴趣或者正在自学,都可以关注我,我会持续更新相关文章!当然,有什么建议也欢迎在评论留言提出!一起学习!

文/James

手机的出现让相机被颠覆,移动支付则取代了钱包……很多时候,对现有行业造成冲击,甚至将其彻底颠覆的,并不是来自同行业的竞争者,而是来自跨行业的“降维打击”

或许搜索引擎就是这样的

在今年年初,微软的必应搜索率先引入了大型语言模型,并提供了基于GPT-4的聊天界面,使其在市场份额和影响力方面一跃而出,成为谷歌无法忽视的竞争对手。尽管谷歌在人工智能研发方面一直处于行业前沿,但由于其搜索业务是其主要的收入来源,因此对于自身革新的态度相对保守

在中国,昆仑万维是众所周知的游戏开发和运营公司,他们在行业中率先推出了人工智能搜索引擎,这个搜索引擎的完成度相当高,足以给国内现有的搜索产品带来一种“跨界”的竞争压力

基于自研的天工大模型,昆仑万维已经推出了3款主要的C端产品,即AI对话、AI搜索和AI创作。这家公司还因对全球化和内容创作的前瞻性思考而引人关注。9月初,计算机视觉和机器学习领域的国际顶级专家颜水成教授加盟,而公司自主研发的一款AI UGC游戏平台Club Koala 也即将上市。

近日,娱乐资本论·视智未来专访昆仑万维董事长兼CEO方汉,深入探讨了公司在AI方面的最新动向及未来愿景。

谁能最早洞察AIGC的未来?独家专访昆仑万维董事长兼CEO方汉丨AI巡礼文娱行业

天工AI工具:AIGC不是都要做成聊天

短时间试用天工AI搜索,就可以给人留下深刻的印象。

在首批8款国产大模型通过备案之际,娱乐资本论·视智未来刚刚进行了第二次国产大模型横向评测,在其中可以看到天工AI搜索在特定内容生成任务方面有出色的表现。

谁能最早洞察AIGC的未来?独家专访昆仑万维董事长兼CEO方汉丨AI巡礼文娱行业

方汉解释说,昆仑万维的团队在搜索领域的经验积累比表面上看起来要长。团队花了六年的时间在搜索领域积累,然后逐渐将其整合成一个产品。

6年前,昆仑万维旗下一款名为"Opera News"的新闻推荐产品上线运营。这是一款主要面向海外市场的信息流产品,它汇集了几十个国家的几十万个网站上的信息处理与推送。这个过程实质上就是一个小型的搜索引擎。目前对重点网站的抓取频率已经提升到每分钟一次。

在过去的六年里,昆仑万维的技术团队已经积累了丰富的预训练数据收集、清洗和深度加工的能力。他们还在研究如何确保信息的真实性,例如对各种信息源网站进行评分。对于如何进行信息推送、如何调整内容以适应国内用户以及如何避免信息孤立等问题,团队已经积累了经验和应对策略

昆仑天工AI搜索的诞生是由于引入了两个千亿级别的模型,分别是千亿预训练基座模型和千亿 RLHF(Reinforcement Learning from Human Feedback)模型底座

方汉提到了一些有趣的用户案例,其中包括一个公务员写工作总结,以及使用AI搜索来学习如何给老师写检讨。这些案例让他意识到产品的应用场景更加广泛

天工AI搜索未来还将提供图片搜索、图片理解等功能。这些AI工具可能会通过广告来获得收入,但方汉认为,广告并不是最主要的盈利模式

除了AI搜索,天工还包括AI对话、AI创作产品。娱乐资本论·视智未来测试了同一个写作任务“西湖有哪些美食”,在天工三款不同产品中提问后各自的表现。

天工AI对话的结果相对简明,而天工AI创作的内容会更丰富,天工AI搜索则可能会加入一些其他平台如知乎专栏的内容,引用的内容均有明确来源

谁能最早洞察AIGC的未来?独家专访昆仑万维董事长兼CEO方汉丨AI巡礼文娱行业 (天工AI对话)

谁能最早洞察AIGC的未来?独家专访昆仑万维董事长兼CEO方汉丨AI巡礼文娱行业 (天工AI创作)

谁能最早洞察AIGC的未来?独家专访昆仑万维董事长兼CEO方汉丨AI巡礼文娱行业 (天工AI搜索)

天工AI搜索、天工AI对话、天工AI创作分别属于三个独立的界面,而不像其他同类产品那样集成在一个统一的聊天窗口中。这样设计的原因是方汉观察到,大多数用户并不会编写prompt,需要适当的引导。很多用户容易在对话界面中沉迷于“调戏AI”。改为搜索框后,用户输入的指令更加实用

方汉得出的一个结论是,普通用户更需要的是“生成端到端的内容”,直接得到的就是成品,而不是提供给他们一个工具,先做出半成品再调整。这中间的转化过程,需要“包装起来”。 重新写作: 方汉得出的一个结论是,普通用户更需要的是直接获得成品的“生成端到端的内容”,而不是提供给他们一个工具,让他们先制作半成品再进行调整。这个转化过程需要进行“包装”

因此,天工团队计划推出一款一键生成漫画、动画或短视频的工具作为他们的“下一个大招”。他们投入了大量的时间和精力,研究如何将剧本转化为分镜,然后再转化为漫画。这样一来,将来转换为AI动画就会更加自然顺畅

这类产品将首先在海外市场推出。方汉认为,海外的游戏玩家对内容不够准确问题的包容度较高,也比较期待具有创意和惊喜的输出结果。它们一开始就支持英、日、韩文,计划未来支持泰语、印地语等。

谁能最早洞察AIGC的未来?独家专访昆仑万维董事长兼CEO方汉丨AI巡礼文娱行业

AI游戏:自由世界和数字陪伴

不过,接下来要讨论的人工智能应用将会比前面提到的几种更加突破人们对人工智能的常规印象

8月25日,昆仑万维旗下的游戏工作室Play for Fun 在德国科隆展上展示了他们自主研发的AI UGC游戏平台Club Koala,这是中国首款进军国际市场的AI游戏

昆仑万维在海外市场运营了近20年,因此在国内游戏出海方面拥有相当的话语权。方汉认为,其中一个经验是在开发过程中更注重做“平台”而不是“剧情”。中国公司在工具和平台的开发方面相对擅长,并且可以避免第一方内容开发可能带来的潜在文化冲突

Club Koala是一个轻剧情的,自由世界方向的游戏,这实质上是一个UGC平台,提供工具,让用户自由创作,也符合他们对海外市场一贯的主要策略。

这款游戏几乎所有的元素,从NPC对话到衣服、家具、小游戏以及剧本等,都可以通过AI驱动来随机生成,或者由玩家自行创作。在捏道具的过程中,玩家甚至可以通过“动动嘴”的方式来创作内容,而不需要像以往那样手动调节甚至编写代码

Club Koala的目标是将人工智能应用于内容创作的整个过程中,以便让用户更轻松地创作内容并形成社区文化。方汉认为,尽管大部分用户创作的内容可能质量不高,但只要有一定比例的内容具备销售价值,就能够形成市场

AI NPC角色是Club Koala的另一个大胆创新。每个玩家都可以创建一个专属的陪伴角色,这个角色有自己的记忆、生涯,并且拥有海量的问题库,可以解答玩家的开放性问题。 AI NPC角色是Club Koala的另一个大胆创新。每个玩家都可以创建一个专属的陪伴角色,这个角色有自己的记忆、生涯,并且拥有海量的问题库,可以解答玩家的开放性问题

在多轮对话方面,目前在一些测试中已经接近Character.ai和Replika的效果。通过利用大型模型和工程能力来实现多轮对话的记忆,创造了一个类似于人类长时记忆和短时记忆的数据库

这个数据库通过大量的标签来组织向量数据。在对话中,会先定位标签,再细致分析解答,以提升响应速度。他们还会根据角色的性格等因素,对重要或不重要的记忆打权重和排序。最后,针对闲聊等场合还有一些专用的小模型。综合运用这些方法,它们规避了多次使用大模型的算力消耗。

花这么大力气设计一个游戏内的NPC,绝不是为了炫技这么简单。在方汉的规划中,这个AI驱动的数字陪伴项目,具有游戏之外的社会价值。

在Club Koala上市之初,首要任务是让用户愿意与NPC聊天;在测试顺利后,同一个角色将有希望登陆昆仑万维的其他游戏,甚至在其它非游戏产品和界面上也可以继续存在,成为一个全时陪伴的角色。从这个角度上讲,AI NPC是一个可以在所有游戏中使用的底座,而他们正在这个底座上进行实验。

方汉提到,AI游戏是一个全新的项目,对原有组织结构产生了影响。他们将整个工作室全面转向平台和产品,这个转型过程相对比较顺利,而员工们也对做AI游戏万分期待。

谁能最早洞察AIGC的未来?独家专访昆仑万维董事长兼CEO方汉丨AI巡礼文娱行业

大型B端应用与芯片版图相结合的重要性

昆仑万维早前宣布与蜜莱坞科技(映客的母公司)达成了一项价值千万以上的合作。他们的人工智能技术可以帮助主播们为他们的“前几万个用户”提供更加个性化的聊天服务。方汉表示,映客选择使用昆仑天工是因为它在多轮对话和情感对话方面的效果更好

在这个项目中,天工会筛选优质主播的语料,帮助客户训练有代表性的主播角色,再结合主播形象、口头禅等信息加入提示词,让模型进行“角色扮演”。其中的挑战在于语料清洗和小样本学习。产品的最终形态则留待客户自己开发。

那么,天工在其他领域是否也找到了重要客户?方汉表示,天工B端主要专注于人力资源、金融和医药领域等。昆仑万维的关联企业,如海外移动支付项目OPay和科亚医疗,都有植入人工智能的潜力。目前,天工已经与一些人力资源公司达成合作协议,具体细节将在后续公布

他相信相对于其他模型开发商,他在大型模型的训练和微调方面拥有三年的经验,每两周进行一次迭代,使其具有独特性,并且底层更加可控。他的产品能力和长远思维有助于打造可复用的SaaS产品,而不是只做一次性的“施工队”

昆仑万维具有跨国游戏和应用开发商的C端基因,使得他们对C端的发展路径更加熟悉。同时,他们还会通过投资来布局一些C端公司。此外,他们还投资于新材料、芯片等领域

9月20日,昆仑万维官宣投资并控股AI算力芯片企业艾捷科芯,完成AGI与AIGC全产业链布局。艾捷科芯主要从事AI大算力及配套芯片的研发生产,特别聚焦于生成式AI的智能计算。核心团队由芯片研发、集成电路、人工智能、大语言模型等领域的知名专家学者组成。

全球化策略是昆仑万维的醒目标签。公司的海外收入长久以来稳定占比50%以上,最新财报数据显示占比更是高达83%。除了游戏,Opera浏览器是公司全球化的另一个经典案例,它的总部在挪威,但大部分研发在波兰进行。在Opera News等成熟业务基础上,适配AI的全新浏览器Opera One,人工智能服务Aria等创新不断涌现,目前Opera的全球平均月活用户近4亿。

近期,颜水成教授加入昆仑万维,这一消息引起了广泛的关注。作为计算机视觉和机器学习领域的国际顶级专家,他曾表示,昆仑万维的务实态度、长期主义视角以及建立国际化大模型团队的愿景都吸引了他的注意

谁能最早洞察AIGC的未来?独家专访昆仑万维董事长兼CEO方汉丨AI巡礼文娱行业

随着颜教授的加入,昆仑万维公司的"2050全球研究院"开始运作,计划在新加坡、伦敦和硅谷设立研究中心,以吸引更多的海外人才。这将使公司在基础大模型领域投入更多资源,并积极参与开源社区的贡献

这些前瞻性的思考和布局,是否能让昆仑万维比大多数人更早地看到未来呢?

方汉多年来一直对人工智能技术的发展保持关注,最近一年多来,几乎每天都在阅读与人工智能相关的论文。他认为,当前的人工智能趋势是由技术驱动的,甚至可以说是由论文推动的,而不是由产品驱动的,这是因为技术仍在快速变化中

在提及大模型之后,下一个“大事件”是方汉将票投给了多模态,尤其是视频生成。他认为视频生成是“内容工业皇冠上的明珠”。一旦解决了视频生成中的一致性和画风等问题,整个影视行业将会被彻底重塑,甚至有人怀疑未来是否还需要摄像机存在

今天关于《谁能最早洞察AIGC的未来?独家专访昆仑万维董事长兼CEO方汉丨AI巡礼文娱行业》的内容介绍就到此结束,如果有什么疑问或者建议,可以在golang学习网公众号下多多回复交流;文中若有不正之处,也希望回复留言以告知!

版本声明
本文转载于:搜狐 如有侵犯,请联系study_golang@163.com删除
天地大模型融入汉王AI电纸学习本,推动教育数智化迈上新台阶天地大模型融入汉王AI电纸学习本,推动教育数智化迈上新台阶
上一篇
天地大模型融入汉王AI电纸学习本,推动教育数智化迈上新台阶
教育领域迎来变革:人工智能崛起将淘汰传统教师和学习方式
下一篇
教育领域迎来变革:人工智能崛起将淘汰传统教师和学习方式
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    508次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    497次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • 可图AI图片生成:快手可灵AI2.0引领图像创作新时代
    可图AI图片生成
    探索快手旗下可灵AI2.0发布的可图AI2.0图像生成大模型,体验从文本生成图像、图像编辑到风格转绘的全链路创作。了解其技术突破、功能创新及在广告、影视、非遗等领域的应用,领先于Midjourney、DALL-E等竞品。
    32次使用
  • MeowTalk喵说:AI猫咪语言翻译,增进人猫情感交流
    MeowTalk喵说
    MeowTalk喵说是一款由Akvelon公司开发的AI应用,通过分析猫咪的叫声,帮助主人理解猫咪的需求和情感。支持iOS和Android平台,提供个性化翻译、情感互动、趣味对话等功能,增进人猫之间的情感联系。
    30次使用
  • SEO标题Traini:全球首创宠物AI技术,提升宠物健康与行为解读
    Traini
    SEO摘要Traini是一家专注于宠物健康教育的创新科技公司,利用先进的人工智能技术,提供宠物行为解读、个性化训练计划、在线课程、医疗辅助和个性化服务推荐等多功能服务。通过PEBI系统,Traini能够精准识别宠物狗的12种情绪状态,推动宠物与人类的智能互动,提升宠物生活质量。
    28次使用
  • 可图AI 2.0:快手旗下新一代图像生成大模型,专业创作者与普通用户的多模态创作引擎
    可图AI 2.0图片生成
    可图AI 2.0 是快手旗下的新一代图像生成大模型,支持文本生成图像、图像编辑、风格转绘等全链路创作需求。凭借DiT架构和MVL交互体系,提升了复杂语义理解和多模态交互能力,适用于广告、影视、非遗等领域,助力创作者高效创作。
    31次使用
  • 毕业宝AIGC检测:AI生成内容检测工具,助力学术诚信
    毕业宝AIGC检测
    毕业宝AIGC检测是“毕业宝”平台的AI生成内容检测工具,专为学术场景设计,帮助用户初步判断文本的原创性和AI参与度。通过与知网、维普数据库联动,提供全面检测结果,适用于学生、研究者、教育工作者及内容创作者。
    46次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码