-
- 数字世界:智能体开始玨玩「荒野大镖客 2」
- 通用计算机控制信息革命产生了数字世界,数字世界为大模型的诞生提供了数据,也最容易实现通用人工智能(AGI)。向数字世界AGI迈进,北京智源人工智能研究院、新加坡南洋理工大学、北京大学携手提出通用计算机控制GeneralComputerControl(GCC),即智能体需要像人一样看屏幕,通过键盘、鼠标完成计算机上的所有任务。在过去很长一段时间里,人工智能研究以游戏为场景,而GCC将为通用人工智能研究提供场景,也将进一步促进大模型和AIAgents的落地与产业化。为此,研究团队提出通用计算机控制智能体框架C
- 科技周边 · 人工智能 | 1年前 | 产业 Cradle 227浏览 收藏
-
- UniEdit:浙大&微软联合推出全能视频编辑框架,零训练、涵盖多种编辑场景
- 随着Sora的爆火,人们看到了AI视频生成的巨大潜力,对这一领域的关注度也越来越高。除了视频生成,在现实生活中,如何对视频进行编辑同样是一个重要的问题,且应用场景更为广泛。以往的视频编辑方法往往局限于「外观」层面的编辑,例如对视频进行「风格迁移」或者替换视频中的物体,但关于更改视频中对象的「动作」的尝试还很少。UniEdit视频编辑结果(动作编辑、风格迁移、背景替换、刚性/非刚性物体替换)本文中,来自浙江大学、微软亚洲研究院、和北京大学的研究者提出了一个基于文本描述的视频编辑统一框架UniEdit,不仅涵
- 科技周边 · 人工智能 | 1年前 | 产业 Sora UniEdit 329浏览 收藏
-
- F5推动应用安全新变革在AI时代
- 圣何塞—2024年2月20日—F5(NASDAQ:FFIV)近期在首届应用安全和应用交付大会AppWorld上宣布推出多项新功能,旨在降低保护和支持应用和API的复杂性,而这些呈现爆炸性增长的应用和API正是现代数字体验的核心。随着AI加速应用及其API的飞速增长,F5将API代码测试和遥测分析技术引入F5分布式云服务(F5DistributedCloudServices),打造了业界最全面的AI就绪型API安全解决方案。与此同时,F5宣布将AI智能技术普及至整体解决方案组合,帮助客户防御复杂的AI威胁的
- 科技周边 · 人工智能 | 1年前 | 人工智能 F5 357浏览 收藏
-
- 部署人工智能到云端的十大关键注意事项
- 云计算是一种变革性的转变,使各种规模的企业能够通过互联网访问多样化的按需虚拟IT资源。主要产品包括数据库、基础设施、平台、软件和存储,它们可以无缝扩展以满足操作需求。这种活力通过支持快速供应和敏捷交付模型,将组织从长期的内部开发中解放出来。功能范围从计算能力和数据仓库等基本实用程序到交钥匙人工智能、数据分析和业务流程自动化工具。通过简化对集中了巨大计算能力和尖端功能的资源的访问,云为推动创新、提高效率和颠覆传统行业提供了前所未有的选择。随着各行业高管率先发起数字化转型计划,将业务迁移到云端,通过按需服务将
- 科技周边 · 人工智能 | 1年前 | 人工智能 AI 云计算 400浏览 收藏
-
- Anything in Any Scene:逼真物体插入(助力各类驾驶数据合成)
- 原标题:AnythinginAnyScene:PhotorealisticVideoObjectInsertion论文链接:https://arxiv.org/pdf/2401.17509.pdf代码链接:https://github.com/AnythingInAnyScene/anything_in_anyscene作者单位:小鹏汽车论文思路逼真的(realistic)视频仿真(videosimulation)在从虚拟现实到电影制作等各种应用领域都显示出巨大的潜力。尤其是在现实世界中捕捉视频不切实际或
- 科技周边 · 人工智能 | 1年前 | 模型 视频 248浏览 收藏
-
- 构建下一代决策智能体:超越自回归,生成长序列规划轨迹的扩散模型
- 设想一下,当你站在房间内,准备向门口走去,你是通过自回归的方式逐步规划路径吗?实际上,你的路径是一次性整体生成的。最新研究指出,利用扩散模型的规划模块可以同时生成长序列的轨迹规划,更符合人类的决策方式。此外,扩散模型在策略表征和数据合成方面还能为现有的决策智能算法提供更为优化的方案。来自上海交通大学的团队撰写的综述论文《DiffusionModelsforReinforcementLearning:ASurvey》梳理了扩散模型在强化学习相关领域的应用。综述指出现有强化学习算法面临长序列规划误差累积、策略
- 科技周边 · 人工智能 | 1年前 | 模型 论文 414浏览 收藏
-
- 掌握未来:塑造未来顶尖技术
- 在充满活力的技术创新领域,每一年都会带来一系列进步,重新定义我们的生活、工作以及与周围世界互动的方式。步入2024年,大量突破性技术有望彻底改变我们生活的各个方面,从医疗保健、交通到通信和娱乐。让我们深入研究今年将产生重大影响的顶级技术。人工智能和机器学习人工智能(AI)和机器学习(ML)持续引领技术发展,已经渗透到各行各业。预计到2024年,人工智能将更加融入我们的日常生活,为虚拟助手、个性化建议、自动驾驶汽车和先进医疗诊断等提供支持。随着人工智能算法变得更加复杂和处理复杂任务的能力增强,它们将在各个领
- 科技周边 · 人工智能 | 1年前 | 人工智能 AI 机器学习 174浏览 收藏
-
- 探究Sora背后的技术:最新扩散模型发展方向综述
- 为了使机器具有人类的想象力,深度生成模型取得了重大进展。这些模型能创造逼真的样本,尤其是扩散模型,在多个领域表现出色。扩散模型解决了其他模型的限制,如VAEs的后验分布对齐问题、GANs的不稳定性、EBMs的计算量大和NFs的网络约束问题。因此,扩散模型在计算机视觉、自然语言处理等方面备受关注。扩散模型由两个过程组成:前向过程和反向过程。前向过程把数据转化为简单的先验分布,而反向过程则逆转这一变化,用训练好的神经网络模拟微分方程来生成数据。与其他模型相比,扩散模型提供了更稳定的训练目标和更好的生成效果。不
- 科技周边 · 人工智能 | 1年前 | 产业 扩散模型 126浏览 收藏
-
- 智能驾驶数据曝光:累计行驶近1000万公里,小魔驼完成5000次配送
- 2月24日,毫末智行公布了2024年智能驾驶春节数据报告。自2024年2月10日至2月23日,用户开启毫末辅助驾驶的行驶总里程突破994万公里,同比2023年春节激增283.4%。在末端物流自动配送领域,小魔驼配送订单比2023年春节同比增长9.2%。截止2024年2月,毫末累计智驾里程突破1.3亿公里,小魔驼累计配送订单近30万。自动驾驶伴随春节出行、购物配送等更多场景,让生活更美好。截至目前,毫末的辅助驾驶产品HPilot已成功应用于超过20款车型,为用户提供了涵盖高速公路到城市道路的全方位智能驾驶体
- 科技周边 · 人工智能 | 1年前 | 产业 341浏览 收藏
-
- Transformer的创始人推出新大型模型,支持开放权重和350亿参数
- 今天,由Transformer作者之一AidanGomez参与创立的人工智能初创公司Cohere迎来了自家大模型的发布。Cohere最新发布的模型被命名为「Command-R」,拥有35B参数量,专为处理大规模生产工作负载而设计。这一模型属于「可扩展」类别,具备高效率和高精度的平衡特性,有助于企业用户在超越概念验证的基础上进入生产阶段。Command-R是一种生成模型,专门针对检索增强生成(RAG)以及其他长上下文任务进行优化。通过结合外部API和工具,该模型旨在提高RAG应用程序的性能。它与行业领先的嵌
- 科技周边 · 人工智能 | 1年前 | 数据 训练 399浏览 收藏
-
- 低计算和内存需求的小型 Llama 大模型
- 背景介绍在当前信息量爆炸的时代,语言模型的训练日益变得复杂和困难。为了培训一个高效的语言模型,我们需要大量的计算资源和时间,这对很多人来说是不切实际的。同时,我们也面临着如何在有限的内存和计算资源下运用大型语言模型的挑战,尤其是在边缘设备上。今天要给大家推荐一个GitHub开源项目jzhang38/TinyLlama,该项目在GitHub有超过4.3kStar,用一句话介绍该项目就是:“TheTinyLlamaprojectisanopenendeavortopretraina1.1BLlamamodel
- 科技周边 · 人工智能 | 1年前 | 开源 模型 训练 221浏览 收藏
-
- 未来建筑中的机器人和自动化技术
- 在建筑领域,机器人技术被视为一项重要的创新,因为它能够提高效率和职业安全。然而,由于建筑施工的特殊性,如操作环境的复杂性和标准化程度的不足,自动化在建筑行业中仍然面临着许多挑战。机器人在建筑中的应用需要克服诸多技术和操作上的障碍,包括适应不同环境和任务的能力,以及与人类工作者协同工作的能力。尽管如此,随着技术的不断进步和创新,人们对于机器人在建筑领域的应用前景充满信心。通过解决现有的机器人技术如何彻底改变现场施工任务研究人员在《建筑自动化》上发表的论文细致地探讨了机器人技术在建筑行业的应用。许多研究人员希
- 科技周边 · 人工智能 | 1年前 | 人工智能 自动化 机器人 282浏览 收藏
-
- 首个高级人类任务机器人现身,全方位灵活迅猛,结合大型虚拟训练环境
- 这周,由OpenAI、微软、贝佐斯和英伟达投资的机器人公司FigureAI宣布获得接近7亿美元的融资,计划在未来一年内研发出可独立行走的人形机器人。而特斯拉的擎天柱也屡屡传出好消息。没人怀疑,今年会是人形机器人爆发的一年。一家位于加拿大的机器人公司SanctuaryAI最近发布了一款全新的人形机器人Phoenix。官方号称它能以和人类一样的速率自主完成很多工作。世界上第一台能以人类速度自主完成任务的机器人Pheonix可以轻轻地抓取、移动并优雅地将每个对象放置在它的左右两侧。它能够自主识别物体的颜色,将不
- 科技周边 · 人工智能 | 1年前 | 机器人 数据 207浏览 收藏
-
- 感知、智能及创造力:视觉在物联网中的作用
- 视觉正在迅速成为物联网发展的领先传感应用,这正在深刻地改变我们的世界。想想工厂和制造业。计算机视觉系统可以通过确保质量控制、优化流程、减少浪费和推动持续改进来改变现代工厂。这些系统有助于提高生产效率、成本效益和制造业务的竞争力。在Arm最近的一项物联网调查中,工业受访者表示,他们采用物联网技术的两个主要原因是改善他们对数据的使用,以改变业务决策和改善客户体验。在商业建筑领域,一场类似的革命正在进行。建筑和物联网视觉传感器建筑物管理人员正在利用物联网视觉传感技术对建筑物内部的活动进行监控和分析,以提高空间利
- 科技周边 · 人工智能 | 1年前 | 人工智能 物联网 204浏览 收藏
-
- 未来系统集成的十大发展方向
- 系统集成可以发生在不同的层面和领域,包括软件系统、信息系统、企业系统、物联网系统等。在软件开发领域,系统集成通常涉及将多个独立的应用或模块整合在一起,以实现更为复杂的功能或服务。在企业领域,系统集成可以涉及将多个企业应用、数据库或业务流程整合在一起,以实现更高效的业务流程和数据管理。系统集成优缺点有哪些系统集成具有许多优点和一些缺点,下面是它们的一些主要方面:优点:功能完整性:系统集成可以将不同的系统、软件或硬件组件整合在一起,以实现更为完整的功能和解决方案。提高效率:通过集成不同系统,可以减少数据冗余和
- 科技周边 · 人工智能 | 1年前 | 系统集成 142浏览 收藏
查看更多
课程推荐
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 484次学习
-
- Golang深入理解GPM模型
- Golang深入理解GPM调度器模型及全场景分析,希望您看完这套视频有所收获;包括调度器的由来和分析、GMP模型简介、以及11个场景总结。
- 473次学习
查看更多
AI推荐
-
- 毕业宝AIGC检测
- 毕业宝AIGC检测是“毕业宝”平台的AI生成内容检测工具,专为学术场景设计,帮助用户初步判断文本的原创性和AI参与度。通过与知网、维普数据库联动,提供全面检测结果,适用于学生、研究者、教育工作者及内容创作者。
- 18次使用
-
- AI Make Song
- AI Make Song是一款革命性的AI音乐生成平台,提供文本和歌词转音乐的双模式输入,支持多语言及商业友好版权体系。无论你是音乐爱好者、内容创作者还是广告从业者,都能在这里实现“用文字创造音乐”的梦想。平台已生成超百万首原创音乐,覆盖全球20个国家,用户满意度高达95%。
- 29次使用
-
- SongGenerator
- 探索SongGenerator.io,零门槛、全免费的AI音乐生成器。无需注册,通过简单文本输入即可生成多风格音乐,适用于内容创作者、音乐爱好者和教育工作者。日均生成量超10万次,全球50国家用户信赖。
- 26次使用
-
- BeArt AI换脸
- 探索BeArt AI换脸工具,免费在线使用,无需下载软件,即可对照片、视频和GIF进行高质量换脸。体验快速、流畅、无水印的换脸效果,适用于娱乐创作、影视制作、广告营销等多种场景。
- 28次使用
-
- 协启动
- SEO摘要协启动(XieQiDong Chatbot)是由深圳协启动传媒有限公司运营的AI智能服务平台,提供多模型支持的对话服务、文档处理和图像生成工具,旨在提升用户内容创作与信息处理效率。平台支持订阅制付费,适合个人及企业用户,满足日常聊天、文案生成、学习辅助等需求。
- 30次使用