文生视频在硅谷AI赛道脱颖而出,探索无限想象空间
在IT行业这个发展更新速度很快的行业,只有不停止的学习,才不会被行业所淘汰。如果你是科技周边学习者,那么本文《文生视频在硅谷AI赛道脱颖而出,探索无限想象空间》就很适合你!本篇内容主要包括##content_title##,希望对大家的知识积累有所帮助,助力实战开发!
在一张图片或者一段视频的页面上输入文字,然后图片或者视频就会按照文字的意思生成一段新的视频。这是美国硅谷近期最热门的AI应用:Pika Labs的玩法。这个应用火爆程度远超想象,据了解,在过去的两个月里,Pika Labs的Discord服务器人数已增长到超过16万,用户数量已经达到50万左右。以至于其中一位创始人郭文景的父亲所在的上市公司信雅达,连续两个交易日涨停,但信雅达和Pika没有任何股权上的关系。
成立仅7个月 投资机构大有来头
公司官网极为简陋,一个应用的入口,以及一篇播客文章介绍自己。
需要被改写的是:Pika官网截图
皮卡实验室成立于今年四月
公司对Pika Labs的愿景,是让每个人都成为自己故事的导演,并激发每个人成为创造者。11月28日,公司推出Pika 1.0,这是一项重大的产品升级,包括一个新的 AI 模型,能够生成和编辑 3D 动画、动漫、卡通和电影等各种风格的视频,以及使其更易于使用的全新网络体验。
同时,博客文章还介绍了公司最新的融资状况。公司目前的融资金额为5500万美元。其中,天使轮投资由 Nat Friedman 和 Daniel Gross 领投,A轮融资由光速创投(Lightspeed Venture Partners)领投。
该公司的投资人都很有来头,其中包括OpenAI创始成员Andrej Karpath、Github前CEO Nat Friedman、问答网站Quora创始人兼首席执行官Adam D'Angelo、Ramp联合创始人Zach等知名人物
创始人履历精彩
公司创始人的履历同样令人瞩目,除了投资人的声名显赫
Pika Labs的创始人兼首席执行官郭文景(Demi Guo)在高中时期加入了奥林匹克数学国家集训队,并在2015年获得国际奥林匹克数学竞赛银牌。郭文景在哈佛大学获得了数学学士学位,同时攻读计算机科学硕士学位,并转至斯坦福攻读博士学位,师从Ron Fedkiw和Chris Manning教授,进行图形学和自然语言处理交叉领域的研究
在接受媒体采访时,郭文景表示,目前公司全职4人,除她以外,CTO Chenlin Meng,在斯坦福获得数学学士学位,随后在斯坦福攻读计算机博士学位,3年时间中发表了30多篇论文,其中,她参与创作的 DDIM 论文是内容生成的重要论文之一。Karli Chen则是郭文景高中同学,高中信息竞赛获得过国家前12、是物理竞赛国际集训队成员,主要做工程方面的工作。 此外,公司还有众多兼职和实习成员,多数为斯坦福本科和博士。
郭文景表示,她在攻读博士期间,即希望用人工智能改变游戏行业,但视频行业比游戏行业更不成熟,有更大的改变空间,所以她最终选择进入视频行业。今年4月,郭文景和Chenlin Meng双双从斯坦福大学退学创业,成立了Pika Labs。
场地拥堵
视频生成类人工智能近期正取代大语言模型,成为硅谷的最热门赛道。除了Pika Labs,还有多家公司成为投资机构关注的焦点。包括Runway、Stability AI等都已经发布了自家的视频生成工具。
2018年成立的Runway,推出了30多种人工智能工具,可满足个人和企业用户的需求。这些工具包括文本到图像、图像到图像、替换背景、绿屏、擦除和替换等,适用于静态图像或视频。RunwayML产品已被应用于好莱坞大片,如《瞬息全宇宙》等获奖影片。Motion Brush是Runway的新产品,最近更新了“运动笔刷功能”,用户只需在静态图片上涂抹,即可轻松制作出流畅逼真的动态视频效果
Runway在今年五月获得了一亿美元的融资,其估值达到了十五亿美元
英国人工智能初创企业 Stability AI 成立于2019年。该公司最著名的产品是文生图应用 Stable Diffusion,最近还推出了他们的首个文生视频模型 Stable Video Diffusion,同样可以根据图片生成视频。然而,公司最近的发展并不顺利。2022年10月,公司宣布获得1.01亿美元的融资,估值达到约10亿美元,成为了AI独角兽。然而,最近,公司的投资者 Coatue 公开质疑了公司的管理团队,并试图出售公司
除了初创企业,该赛道的竞争者还包括科技巨头Meta发布的 Emu Video,以及字节跳动推出的PixelDance等等。
需要重新写的内容是:岳亚楠担任责任编辑
需要重新写作的内容是:校对:王蔚
以上就是《文生视频在硅谷AI赛道脱颖而出,探索无限想象空间》的详细内容,更多关于AI,硅谷,视频的资料请关注golang学习网公众号!

- 上一篇
- 2023爱采购岁末家年华开封站圆满落幕 携手企业共赢AI时代

- 下一篇
- 2023年多动症干预新进展——从人工智能到虚拟现实
-
- 科技周边 · 人工智能 | 9小时前 |
- 即梦ai高清封面导出攻略即梦ai缩略图生成秘籍
- 148浏览 收藏
-
- 科技周边 · 人工智能 | 10小时前 |
- 尊界S800配置曝光:4座三电机对决5座双电机
- 432浏览 收藏
-
- 科技周边 · 人工智能 | 12小时前 |
- RSAC2024速览,20款网络安全新品发布
- 158浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 484次学习
-
- 美图AI抠图
- 美图AI抠图,依托CVPR 2024竞赛亚军技术,提供顶尖的图像处理解决方案。适用于证件照、商品、毛发等多场景,支持批量处理,3秒出图,零PS基础也能轻松操作,满足个人与商业需求。
- 11次使用
-
- PetGPT
- SEO摘要PetGPT 是一款基于 Python 和 PyQt 开发的智能桌面宠物程序,集成了 OpenAI 的 GPT 模型,提供上下文感知对话和主动聊天功能。用户可高度自定义宠物的外观和行为,支持插件热更新和二次开发。适用于需要陪伴和效率辅助的办公族、学生及 AI 技术爱好者。
- 11次使用
-
- 可图AI图片生成
- 探索快手旗下可灵AI2.0发布的可图AI2.0图像生成大模型,体验从文本生成图像、图像编辑到风格转绘的全链路创作。了解其技术突破、功能创新及在广告、影视、非遗等领域的应用,领先于Midjourney、DALL-E等竞品。
- 41次使用
-
- MeowTalk喵说
- MeowTalk喵说是一款由Akvelon公司开发的AI应用,通过分析猫咪的叫声,帮助主人理解猫咪的需求和情感。支持iOS和Android平台,提供个性化翻译、情感互动、趣味对话等功能,增进人猫之间的情感联系。
- 38次使用
-
- Traini
- SEO摘要Traini是一家专注于宠物健康教育的创新科技公司,利用先进的人工智能技术,提供宠物行为解读、个性化训练计划、在线课程、医疗辅助和个性化服务推荐等多功能服务。通过PEBI系统,Traini能够精准识别宠物狗的12种情绪状态,推动宠物与人类的智能互动,提升宠物生活质量。
- 35次使用
-
- GPT-4王者加冕!读图做题性能炸天,凭自己就能考上斯坦福
- 2023-04-25 501浏览
-
- 单块V100训练模型提速72倍!尤洋团队新成果获AAAI 2023杰出论文奖
- 2023-04-24 501浏览
-
- ChatGPT 真的会接管世界吗?
- 2023-04-13 501浏览
-
- VR的终极形态是「假眼」?Neuralink前联合创始人掏出新产品:科学之眼!
- 2023-04-30 501浏览
-
- 实现实时制造可视性优势有哪些?
- 2023-04-15 501浏览