-
- 当前最强国产Sora!清华团队突破16秒长视频,懂多镜头语言,会模拟物理规律
- 你说箱子里要装满钻石,于是箱子被钻石填满,比实拍还要耀眼。这样的技能,哪个剧组不喜欢?这是前段时间Adobe旗下的视频剪辑软件PremierePro所呈现的“魔法”。该软件通过引入Sora、Runway、Pika等AI视频工具,实现在视频中添加物体、消除物体以及生成视频片段等能力,这被视为视频领域的再一次技术革新。从2月份Sora席卷全球到如今Adobe再施魔法,海外热火朝天。相比之下,国内在视频领域,尤其是长视频生成方向还处于「等待」状态。在过去的两个月里,我们已经听到了一些宣称追赶Sora的声音,但是
- 科技周边 · 人工智能 | 1年前 | 产业 Vidu 视频大模型 生数科技 326浏览 收藏
-
- 售价16.58万起,增配不增价,2024款哈弗猛龙硬核来袭
- 2024年4月23日,2024款哈弗猛龙以一档别开生面的“微综艺”直播闪耀出道。新车增配不增价,售价从16.58万元至19.28万元。2024款哈弗猛龙Hi4102Pro和Hi4145Pro标配255/60规格轮胎、19英寸轮毂、不停车电子收费系统ETC等六大高感知配置,增配价值3000元;Hi4145穿越版更是在Hi4145Pro基础上升级后桥差速锁、抬头显示等九大超高感知配置,增配价值20000元。2024款哈弗猛龙以亲民定价实现“科技平权”,成为新能源全场景方盒子SUV购车首选。从即日起至2024年
- 科技周边 · 人工智能 | 1年前 | 产业 248浏览 收藏
-
- GTC大会开完一个月,英伟达的Omniverse Cloud API正在快速落地
- 今年的GTC大会上,英伟达宣布利用生成功能AI等技术构建了业内领先的元宇宙、工业数字孪生、机器人训练软件体系。基于英伟达实时模拟和协作平台Omniverse。随着OmniverseCloudAPI的推出,模拟现实环境的工具已经扩大了覆盖范围,现在已经被很多公司用于创建工业数字孪生应用程序和工作流程。在3月,共有五个新的OmniverseCloud应用程序编程接口被引入,使开发人员能够轻松地将核心Omniverse技术直接集成到数字孪生的现有设计和自动化软件应用程序中,或者用于测试和验证机器人或自动驾驶车辆
- 科技周边 · 人工智能 | 1年前 | 元宇宙 英伟达 产业 自动驾驶技术 327浏览 收藏
-
- 让大模型不再「巨无霸」,这是一份最新的大模型参数高效微调综述
- AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com。近期,大语言模型、文生图模型等大规模AI模型迅猛发展。在这种形势下,如何适应瞬息万变的需求,快速适配大模型至各类下游任务,成为了一个重要的挑战。受限于计算资源,传统的全参数微调方法可能
- 科技周边 · 人工智能 | 1年前 | 理论 参数高效微调 470浏览 收藏
-
- 硬控设计人一分钟,加持大模型的Adobe,PS起来更香了
- 图像编辑这一块,还得看Adobe。刚刚,Adobe正式宣布推出新的图像生成模型FireflyImage3,即日起在FireflyWeb应用程序、AdobePhotoshop和AdobeInDesign中提供测试版,并在「今年晚些时候」全面上市,旨在让创作者能够提高工作效率,生成更高质量、更详细的图像。Adobe表示,FireflyImage3提供了前所未有的逼真质量,具有更好的光照、定位和对细节的关注。FireflyImage3比之前的Firefly模型更能理解长的描述性文本提供(prompt),并且可以
- 科技周边 · 人工智能 | 1年前 | Adobe AI 模型 图像生成模型 461浏览 收藏
-
- 史上最大重建25km²!NeRF-XL:真正有效利用多卡联合训练!
- 原标题:NeRF-XL:ScalingNeRFswithMultipleGPUs论文链接:https://research.nvidia.com/labs/toronto-ai/nerfxl/assets/nerfxl.pdf项目链接:https://research.nvidia.com/labs/toronto-ai/nerfxl/作者单位:NVIDIA加州大学伯克利分校论文思路:本文提出了NeRF-XL,这是一种原理性的方法,用于在多个图形处理器(GPUs)之间分配神经射线场(NeRFs),从而使得
- 科技周边 · 人工智能 | 1年前 | 模型 训练 289浏览 收藏
-
- RAG还是微调?微软出了一份特定领域大模型应用建设流程指南
- 检索增强生成(RAG)和微调(Fine-tuning)是提升大语言模型性能的两种常用方法,那么到底哪种方法更好?在建设特定领域的应用时哪种更高效?微软的这篇论文供你选择时进行参考。在构建大语言模型应用程序时,常常使用两种方法来整合专有和特定领域的数据:检索增强生成和微调。检索增强生成是通过引入外部数据来增强模型的生成能力,而微调则是将额外的知识融入到模型本身中。然而,对于这两种方法的优缺点,我们的了解还不够充分。本文介绍了微软研究者提出的一个新的关注点,即为农业行业创建具有特定背景和自适应响应能力的AI助
- 科技周边 · 人工智能 | 1年前 | 微软 产业 RAG 225浏览 收藏
-
- 史上首次!AI驾驶战机成功与人类飞行员空中「狗斗」
- AI操纵的战斗机又一次进化了!近日,美国DARPA透露称,去年9月一架由F-16改装而成的AI验证机,有史以来首次成功地在视距内与人类飞行员进行空中缠斗(俗称狗斗),让我们看到了人工智能在空战领域的应用前景。这架AI验证机搭载了最新的人工智能系统,能够模拟人类的智能决策,并具备自主飞行和作战能力。通过与飞行员进行模拟空战,验证机显示出了惊人的战斗技巧和反应速度,成功地击败了多名训练有素的飞行员。这次的实验标该验证机代号为X-62AVISTA,是一架F-16D(Block30)双座飞机,人类飞行员同样驾驶一
- 科技周边 · 人工智能 | 1年前 | AI 驾驶 279浏览 收藏
-
- 在12个视频理解任务中,Mamba先打败了Transformer
- 本站发布学术、技术内容的专栏。近年来,本站AIxiv专栏接收报道超过2000篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com。探索视频理解的新境界,Mamba模型引领计算机视觉研究新潮流!传统架构的局限已被打破,状态空间模型Mamba以其在长序列处理上的独特优势,为视频理解领域带来了革命性的变革。来自南京大学、上海人工智能实验
- 科技周边 · 人工智能 | 1年前 | 工程 Mamba 341浏览 收藏
-
- 颜水成挂帅,奠定「通用视觉多模态大模型」终极形态!一统理解/生成/分割/编辑
- 近日,颜水成教授团队联合发布并开源了Vitron通用像素级视觉多模态大语言模型。项目主页&Demo:https://vitron-llm.github.io/论文链接:https://is.gd/aGu0VV开源代码:https://github.com/SkyworkAI/Vitron这是一个重磅的通用视觉多模态大模型,支持从视觉理解到视觉生成、从低层次到高层次的一系列视觉任务,解决了困扰大语言模型产业已久的图像/视频模型割裂问题,提供了一个全面统一静态图像与动态视频内容的理解、生成、分割、编辑
- 科技周边 · 人工智能 | 1年前 | 模型 视觉 501浏览 收藏
-
- CVPR 2024 | 基于MoE的通用图像融合模型,添加2.8%参数完成多项任务
- AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com。论文链接:https://arxiv.org/abs/2403.12494代码链接:https://github.com/YangSun22/TC-MoA论文题目:Task-Custo
- 科技周边 · 人工智能 | 1年前 | 工程 图像融合 468浏览 收藏
-
- 通过学习曲线识别过拟合和欠拟合
- 本文将介绍如何通过学习曲线来有效识别机器学习模型中的过拟合和欠拟合。欠拟合和过拟合1、过拟合如果一个模型对数据进行了过度训练,以至于它从中学习了噪声,那么这个模型就被称为过拟合。过拟合模型非常完美地学习了每一个例子,所以它会错误地分类一个看不见的/新的例子。对于一个过拟合的模型,我们会得到一个完美/接近完美的训练集分数和一个糟糕的验证集/测试分数。略有修改:"过拟合的原因:用一个复杂的模型来解决一个简单的问题,从数据中提取噪声。因为小数据集作为训练集可能无法代表所有数据的正确表示。"2、欠拟合如果一个模型
- 科技周边 · 人工智能 | 1年前 | 人工智能 机器学习 过拟合模型 179浏览 收藏
-
- 揭开大型语言模型(LLM)的力量:初创企业如何通过精简集成彻底改变运营方式
- 大型语言模型(LLM)已成为各种规模企业的游戏规则改变者,但它们对初创企业的影响尤为显著。为了理解其中的原因,让我们来看看初创企业相对于老牌企业有哪些优势,以及为什么AI是它们的重要推动力。首先,与传统企业相比,初创企业有更大的灵活性。它们通常没有过多的层级和繁琐的决策程序,可以更迅速地适应市场变化和顾客需求。这种敏捷性使得初创企业能够更快地推出新产品和服务,并灵活调整战略。其次,初创企业通常更加创初创企业往往面临预算有限、时间紧迫的局面,即便是规模更大的行业参与者也可能争夺的是规模更大的行业参与者可能争
- 科技周边 · 人工智能 | 1年前 | 人工智能 大型语言模型 405浏览 收藏
-
- LinkedIn在利用大型语言模型服务十亿用户中的收获
- 在全球拥有超过10亿用户的LinkedIn,不断挑战当今企业技术的极限。很少有公司能够太像LinkedIn那样运营,或者拥有类似的大量数据资源。这个专注于商业和就业的社交媒体平台将合格的候选人与潜在雇主联系起来,帮助填补职位空缺是其核心业务。同样重要的是确保平台上的帖子反映了雇主和消费者的需求。在LinkedIn的模式下,这些匹配过程一直依赖于技术。到了2023年夏天,当GenAI第一次高涨时,LinkedIn开始考虑是否利用大型语言模型(LLMs)来匹配候选人与雇主,并使信息流更加有用。因此,这家社交媒
- 科技周边 · 人工智能 | 1年前 | 人工智能 LinkedIn GenAI 183浏览 收藏
-
- GPT-4单项仅得7.1分,揭露大模型代码能力三大短板,最新基准测试来了
- 首个AI软件工程师Devin正式亮相,立即引爆了整个技术界。Devin虽然不能够轻松解决编码任务,但可以自主完成软件开发的整个周期——从项目规划到部署。他尽力挖掘,但不限于构建网站、自主寻找并修复BUG、培训和微调AI模型等。这种“强到逆天”的软件开发能力,让一众码农纷纷绝望,直呼:“程序员的末日真来了?”在一众测试成绩中,Devin在SWE-Bench基准测试中的表现尤为引人注目。SWE-Bench是一个评估AI软件工程能力的测试,重点考察大模型解决实际GitHub问题的能力。Devin以独立解决13.
- 科技周边 · 人工智能 | 1年前 | AI 模型 156浏览 收藏
查看更多
课程推荐
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 484次学习
-
- Golang深入理解GPM模型
- Golang深入理解GPM调度器模型及全场景分析,希望您看完这套视频有所收获;包括调度器的由来和分析、GMP模型简介、以及11个场景总结。
- 473次学习
查看更多
AI推荐
-
- 魔匠AI
- SEO摘要魔匠AI专注于高质量AI学术写作,已稳定运行6年。提供无限改稿、选题优化、大纲生成、多语言支持、真实参考文献、数据图表生成、查重降重等全流程服务,确保论文质量与隐私安全。适用于专科、本科、硕士学生及研究者,满足多语言学术需求。
- 10次使用
-
- PPTFake答辩PPT生成器
- PPTFake答辩PPT生成器,专为答辩准备设计,极致高效生成PPT与自述稿。智能解析内容,提供多样模板,数据可视化,贴心配套服务,灵活自主编辑,降低制作门槛,适用于各类答辩场景。
- 26次使用
-
- Lovart
- SEO摘要探索Lovart AI,这款专注于设计领域的AI智能体,通过多模态模型集成和智能任务拆解,实现全链路设计自动化。无论是品牌全案设计、广告与视频制作,还是文创内容创作,Lovart AI都能满足您的需求,提升设计效率,降低成本。
- 25次使用
-
- 美图AI抠图
- 美图AI抠图,依托CVPR 2024竞赛亚军技术,提供顶尖的图像处理解决方案。适用于证件照、商品、毛发等多场景,支持批量处理,3秒出图,零PS基础也能轻松操作,满足个人与商业需求。
- 35次使用
-
- PetGPT
- SEO摘要PetGPT 是一款基于 Python 和 PyQt 开发的智能桌面宠物程序,集成了 OpenAI 的 GPT 模型,提供上下文感知对话和主动聊天功能。用户可高度自定义宠物的外观和行为,支持插件热更新和二次开发。适用于需要陪伴和效率辅助的办公族、学生及 AI 技术爱好者。
- 36次使用