-
- 复旦等发布AnyGPT:支持多模态输入输出,可处理图像、音乐、文本和语音
- 最近,OpenAI的视频生成模型Sora爆火,生成式AI模型在多模态方面的能力再次引起广泛关注。现实世界本质上是多模态的,生物体通过不同的渠道感知和交换信息,包括视觉、语言、声音和触觉。开发多模态系统的一个有望方向是增强LLM的多模态感知能力,主要涉及多模态编码器与语言模型的集成,从而使其能够跨各种模态处理信息,并利用LLM的文本处理能力来产生连贯的响应。然而,这一策略仅仅适用于文本生成,并不涵盖多模态输出。一些开拓性的研究在语言模型中实现了多模态理解和生成,取得了重大进展,但这些模型仅限于单一的非文本模
- 科技周边 · 人工智能 | 1年前 | 模型 训练 356浏览 收藏
-
- 一句指令就能冲咖啡、倒红酒、锤钉子,清华具身智能CoPa「动」手了
- 近期,具身智能方向取得了诸多进展。从谷歌的RT-H到OpenAI、Figure联合打造的Figure01,机器人的交互性、通用性越来越强。如果未来机器人成为人们日常生活的助手,你期待它们能够完成哪些任务?泡一杯热气腾腾的手冲咖啡,整理桌面,甚至帮你精心安排一场浪漫的约会,这些任务,只需一句指令,清华的具身智能新框架「CoPa」都能完成。CoPa(RoboticManipulationthroughSpatialConstraintsofParts)是清华大学机器人研究团队在高阳教授的领导下提出的最新智能框
- 科技周边 · 人工智能 | 1年前 | 产业 具身智能 机器人技术 CoPa 356浏览 收藏
-
- 基于Transformer的高效单阶段短时RGB-T单目标跟踪方法
- 引言如图1所示,现有的三阶段RGB-T单目标跟踪网络通常采用两个独立的特征提取分支,分别负责提取两个模态的特征。然而,相互独立的特征提取分支会导致两个模态在特征提取阶段存在缺乏有效的信息交互。因此,一旦网络完成离线训练,其只能从每个模态图像中提取固定的特征,无法根据实际的模态状态动态调整,以提取更具针对性的动态特征。这一局限性约束了网络对多样的目标双模态外观,以及模态外观之间动态对应关系的适应能力。如图2所示,这种特征提取方式并不适合RGB-T单目标跟踪的实际应用场景,特别是在复杂环境下,因为被跟踪目标的
- 科技周边 · 人工智能 | 1年前 | 理论 356浏览 收藏
-
- 关于面向机器人操作的世界模型的一点思考
- 近年来,世界模范的火热似乎可以在机器人操作中起到一些至关重要的作用。而对于具身智能来说,现阶段manipulation是最需要突破的点。特别是针对以下longhorizon的任务,如何构建机器人“小脑”,来实现各种复杂的操作要求,是当下最需要解决的问题。是否需要通过拆分skill为原子操作?在使用LM应用在机器人上时,比较常用的做法是将各类API提供在context里面,然后让LLM根据任务prompt自动编写planning代码,可参考文章:这种方法优点是非常直观,可以比较清晰地把握任务的拆解逻辑,比如
- 科技周边 · 人工智能 | 1年前 | 机器人 代码 356浏览 收藏
-
- 成本减少90%以上,「主动学习+实验工作流程」加速催化剂开发
- 编辑|绿罗通过合成气的热催化加氢合成高级醇(HAS)仍然是一项有前途的技术。链增长和CO插入要求需要多组分材料,其复杂的反应动力学和广泛的化学空间不符合催化剂设计规范。在此,来自苏黎世联邦理工学院(ETHZurich)的研究人员提出了一种替代策略,将主动学习整合到实验工作流程中,以FeCoCuZr催化剂系列为例。所提数据辅助框架简化了86个实验中广泛成分和反应条件空间的导航,与传统程序相比,环境足迹和成本减少了90%以上。它确定了具有优化反应条件的Fe65Co19Cu5Zr11催化剂,在稳定运行150小时
- 科技周边 · 人工智能 | 9个月前 | 理论 356浏览 收藏
-
- 芯米半导体“一种掩模板清洗机的夹持机构”专利获授权
- 芯米(厦门)半导体设备有限公司近日获得一项实用新型专利——“一种掩模板清洗机的夹持机构”(授权公告号:CN111880369B,授权公告日:2024年11月5日,申请日:2020年7月31日)。该专利设计了一种创新的掩模板清洗机夹持机构,其核心在于改进的调节机构。该机构包含底板和垫板,通过手轮、齿条、传动齿轮、调速齿轮及螺杆的协同作用,实现移动块的垂直移动。同时,移动块驱动传动块和转块,而转块再通过拉绳带动滑块和中空夹板向内移动,最终实现对夹持板的精确调节。此外,卡杆与手轮侧面的卡槽配合,确保中空夹持板的
- 科技周边 · 人工智能 | 4个月前 | 芯米半导体 356浏览 收藏
-
- 【裁员】长城汽车被曝裁员 涉及上百人
- 1.长城汽车裁员数百人据南方财经快讯,长城汽车前员工爆料,公司通过非协商调岗、降薪等方式恶意裁员,涉及人数上百。爆料人称,她被调整到仓管岗位,工资降至3000元/月,且调岗依据不实。她未按照要求到岗工作,被解除劳动关系,目前正处于劳动仲裁阶段。长城汽车最新产销数据显示,10月总销量下降11.05%,但新能源车销量强劲增长,1-10月累计销量达243,531台。海外市场销售表现亮眼,1-10月累计销售368,662台。2.大运汽车流动资金周转困难,依法重整11月25日,大运汽车发布《关于大运汽车重整的声明》
- 科技周边 · 人工智能 | 4个月前 | 智驾 356浏览 收藏
-
- 子公司获2020万元增资,昀冢科技持股比例降至93.69%
- 昀冢科技2024年10月28日股东大会审议通过了全资子公司池州昀冢增资扩股及关联交易议案,同意引入投资平台A和B,新增投资额不低于1500万元,不超过2500万元。根据资产评估报告,池州昀冢投前估值29.882亿元。经协商,本次增资扩股确定公司价值30亿元,增资价格为1:1。增资完成后,新投资者持股比例不超过7.7%。增资款将用于池州昀冢片式多层陶瓷电容器业务发展。12月5日,昀冢科技发布公告,公司及池州昀冢已与新投资者池州昀腾、池州昀鑫签署投资协议,并收到2020万元增资款。其中,池州昀鑫增资996万元
- 科技周边 · 人工智能 | 4个月前 | 昀冢科技 356浏览 收藏
-
- 华勤技术收购豪成智能科技75% 强化机器人业务领域布局
- 华勤技术近日宣布,其全资子公司已完成对深圳豪成智能科技有限公司(简称“豪成智能科技”)75%股权的收购,豪成智能科技正式成为华勤技术的控股子公司。此举标志着华勤技术在机器人业务领域迈出关键一步,进一步巩固其全球智能产品大平台战略。豪成智能科技成立于2023年4月,是一家集研发、生产、销售于一体的智能产品及服务提供商,专注于家庭清洁和陪护机器人领域。其产品线涵盖扫地机器人、擦窗机器人、割草机器人、泳池清洁机器人、宠物清洁陪护机器人以及康养陪护机器人等,并提供核心部件。公司致力于以高质量的产品和高效的服务,为
- 科技周边 · 人工智能 | 3个月前 | 华勤技术 356浏览 收藏
-
- 小米汽车上周销量0.67万 创历史新高 欠车已超12.6万
- 2024年第52周(12月23日至12月29日),小米汽车单周销量达0.67万辆,创下历史新高!这一数据来自理想汽车官方发布的信息。目前,小米汽车在造车新势力中暂居第七位,领先品牌包括理想、小鹏、零跑、极氪、问界和深蓝。具体销量数据如下:值得关注的是,据第三方数据显示,小米汽车12月交付量突破2万辆,但新增订单却超过3万辆,这意味着“北京欠车王”的欠车数量再次增加。汽车博主统计显示,截至12月29日,小米汽车累计欠车量已达12.62万辆,而其过去8个月的总交付量约为13万辆。预计2024年全年交付量可能达
- 科技周边 · 人工智能 | 3个月前 | 356浏览 收藏
-
- 中国车企占据以色列近五分之一市场 奇瑞长城销量暴涨
- 中国汽车出口强势崛起,以色列市场成新增长点!2023年,中国超越德国和日本,成为全球最大的汽车出口国。而以色列市场,正成为中国汽车品牌拓展海外业务的重要阵地。最新数据显示,2024年,中国汽车品牌在以色列市场占据近五分之一的份额。2024年以色列汽车市场销量前十名如下:丰田(3.4万辆,12.7%)、现代(2.78万辆,10.3%)、起亚(2.55万辆,9.5%)、斯柯达(1.9万辆,7.1%)、比亚迪(1.67万辆,6.2%)、马自达(1.37万辆,5.1%)、奇瑞(1.29万辆,4.8%)、三菱(
- 科技周边 · 人工智能 | 3个月前 | 356浏览 收藏
-
- 中兴众投荣获金投奖2024年度中国成长型VC投资机构TOP30
- 喜讯!中兴众投荣获2024年度中国成长型VC投资机构TOP30!近日,中国风险投资研究院公布了2024中国风险投资行业年度榜单,中兴众投凭借其卓越的投资业绩,荣登“2024年度中国成长型VC投资机构TOP30”榜单。这项评选旨在表彰对风险投资行业发展做出突出贡献的机构和个人,其客观、量化的评选标准得到了业界广泛认可。作为国内领先的风险投资行业服务平台,中国风险投资研究院已连续20年举办该评选活动,其结果被视为行业发展的风向标。中兴众投作为中兴通讯的全资子公司,依托中兴通讯在信息通信技术(ICT
- 科技周边 · 人工智能 | 3个月前 | 中兴通讯 中兴众投 356浏览 收藏
-
- 辰显光电筹集到数亿元A轮融资,推动Micro-LED加速前行
- 据成都高新企业服务消息,近日,成都辰显光电有限公司(以下简称“辰显光电”)宣布完成数亿元A轮融资,由策源资本领投,川发展弘芯基金、成都高投电子集团、四川振兴产业协同基金等机构跟投。据介绍,辰显光电于2020年8月在成都高新区成立。作为中国大陆第一家专业从事Micro-LED自主研发、规模生产和市场销售的高科技企业,辰显光电早在2021年就率先建成中国大陆首条从LTPS驱动背板、巨量转移、修复到模组全覆盖的Micro-LED中试产线;2023年9月,辰显光电成功发布全球首款102英寸P0.5TFT基Micr
- 科技周边 · 人工智能 | 3个月前 | 辰显光电 356浏览 收藏
-
- 【科技成果推介】精密几何检测系统
- 项目概述上海第二工业大学研发的精密几何检测系统,是一款面向机械工程、动力及电气工程领域的先进计量仪器。该系统已成功应用于国家重大科技项目及军工领域,拥有显著的市场前景和产业化潜力。技术细节核心技术:基于超高精度直线导轨的在线精密检测与调节技术。应用案例:已在国家重大科技04专项及军委装备发展部航天AATR专项中得到验证,并被国内航空航天、机床等行业245家企业应用350套,2018-2020年累计新增产值2.88亿元。技术分类先进制造与自动化市场分析技术成熟度:已达到商品化水平。目标市
- 科技周边 · 人工智能 | 3个月前 | 芯力量 科技成果转化 356浏览 收藏
-
- 小米SU7新增锁单节奏脱离淡季节点 交付回归常态峰值
- 小米SU7上市近一年,交付周期仍长达33周,产能瓶颈凸显其市场热度。近日消息显示,小米汽车上周新增订单再次突破1.1万辆,交付量回升至峰值水平,显示其销售势头不受淡季影响。据悉,小米SU7一月份交付量再次突破2万辆,已连续四个月保持月交付量超2万辆的佳绩。即使整体车市低迷,小米汽车凭借稳定的交付表现,在新能源汽车市场竞争中稳扎稳打。预计二月份交付量仍将超过2万辆,并有望持续保持这一增长态势。小米汽车2025年销量目标为30万辆。即将在六七月份上市的小米YU7轿跑SUV,备受期待,有望进一步提升销量
- 科技周边 · 人工智能 | 2个月前 | 356浏览 收藏
查看更多
课程推荐
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 484次学习
-
- Golang深入理解GPM模型
- Golang深入理解GPM调度器模型及全场景分析,希望您看完这套视频有所收获;包括调度器的由来和分析、GMP模型简介、以及11个场景总结。
- 473次学习
查看更多
AI推荐
-
- 毕业宝AIGC检测
- 毕业宝AIGC检测是“毕业宝”平台的AI生成内容检测工具,专为学术场景设计,帮助用户初步判断文本的原创性和AI参与度。通过与知网、维普数据库联动,提供全面检测结果,适用于学生、研究者、教育工作者及内容创作者。
- 23次使用
-
- AI Make Song
- AI Make Song是一款革命性的AI音乐生成平台,提供文本和歌词转音乐的双模式输入,支持多语言及商业友好版权体系。无论你是音乐爱好者、内容创作者还是广告从业者,都能在这里实现“用文字创造音乐”的梦想。平台已生成超百万首原创音乐,覆盖全球20个国家,用户满意度高达95%。
- 33次使用
-
- SongGenerator
- 探索SongGenerator.io,零门槛、全免费的AI音乐生成器。无需注册,通过简单文本输入即可生成多风格音乐,适用于内容创作者、音乐爱好者和教育工作者。日均生成量超10万次,全球50国家用户信赖。
- 30次使用
-
- BeArt AI换脸
- 探索BeArt AI换脸工具,免费在线使用,无需下载软件,即可对照片、视频和GIF进行高质量换脸。体验快速、流畅、无水印的换脸效果,适用于娱乐创作、影视制作、广告营销等多种场景。
- 33次使用
-
- 协启动
- SEO摘要协启动(XieQiDong Chatbot)是由深圳协启动传媒有限公司运营的AI智能服务平台,提供多模型支持的对话服务、文档处理和图像生成工具,旨在提升用户内容创作与信息处理效率。平台支持订阅制付费,适合个人及企业用户,满足日常聊天、文案生成、学习辅助等需求。
- 36次使用