• Google重新激活视觉语言模型进行空间推理
    Google重新激活视觉语言模型进行空间推理
    尽管视觉语言模型(VLM)在许多任务上取得了显著进展,包括图像描述、视觉问答、具身规划和动作识别等,但在空间推理方面仍然存在挑战。许多模型在理解目标在三维空间中的位置或空间关系方面仍有困难。这表明在进一步发展视觉语言模型的过程中,需要着重解决空间推理的问题,以提高模型在处理复杂视觉任务时的准确性和效率。研究者经常通过人类的身体体验和进化发展来探讨这个问题。人类拥有固有的空间推理技能,可以轻松确定空间关系,比如目标相对位置、估算距离和大小,而无需进行复杂的思维过程或心理计算。这种对直接空间推理任务的熟练,与
    科技周边 · 人工智能   |  1年前  |   模型 视觉 208浏览 收藏
  • 从AI绘图模型训练到推理:简单通过一个网页实现
    从AI绘图模型训练到推理:简单通过一个网页实现
    不会写代码,也能训练AI绘画模型了!只要借助这个框架,从训练到推理都能一站式搞定,还能一次管理多个模型。阿里巴巴团队推出并开源了这款万能图片生成工作台SCEPTERStudio。有了它,不用代码,直接在Web界面当中就能完成模型的训练与微调,并管理相关数据。团队还推出了内置三种模型的DEMO,可以在线体验SCEPTER的推理功能。那么SCEPTER具体都能干啥,下面就来一睹为快!一站式管理绘图模型使用SCEPTER,编写程序变得不再必要。只需在Web页面中选择模型并调整参数,就能完成训练和微调。具体来看,
    科技周边 · 人工智能   |  1年前  |   开源 图片 205浏览 收藏
  • 普林斯顿DeepMind利用数学验证:LLM不是随机生成的!「规模与能力正相关」得到理论支持
    普林斯顿DeepMind利用数学验证:LLM不是随机生成的!「规模与能力正相关」得到理论支持
    今天故事的主角是两位科学家,SanjeevArora和AnirudhGoyal。Arora来自普林斯顿大学,而Goyal则来自谷歌DeepMind。他们凑到一起,只想探究一个问题。那就是,LLM,究竟是只会叽叽喳喳学舌的随机鹦鹉,还是真学会了什么,摇身一变成为了具有涌现能力的智能体?AI先驱Hinton和吴恩达曾经也聊过这个问题,但彼时并没有得出什么明确的结论。Hinton指出,若无法就此问题达成共识,AI可能带来的潜在危害也难以达成共识。Arora和Goyal认为,LLM不仅仅是模仿机械地重复学习。他们
    科技周边 · 人工智能   |  1年前  |   模型 数据 160浏览 收藏
  • 构建企业级人工智能平台:利用RAG和CRAG实现商业人工智能的掌握
    构建企业级人工智能平台:利用RAG和CRAG实现商业人工智能的掌握
    浏览我们的指南,掌握如何让您的企业充分利用人工智能技术。了解RAG和CRAG集成、矢量嵌入、LLM和提示工程等内容,这对那些希望负责任地应用人工智能的企业来说非常有益。为企业打造AI-Ready平台企业在引入生成式人工智能时,会遇到许多需要战略管理的业务风险。这些风险通常是相互关联的,范围从导致合规问题的潜在偏见到缺乏领域知识。主要问题包括声誉损害、遵守法律和监管标准(尤其是与客户互动有关)、知识产权侵权、道德问题和隐私问题(尤其是在处理个人或可识别数据时)。为了应对这些挑战,提议采用检索增强生成(RAG
    科技周边 · 人工智能   |  1年前  |   人工智能 444浏览 收藏
  • 是机器人物联网在制造业中的未来吗?
    是机器人物联网在制造业中的未来吗?
    机器人物联网是一项新兴发展,有望将工业机器人和物联网传感器这两项有价值的技术融合在一起。机器人物联网会成为制造业的主流吗?什么是机器人物联网?机器人物联网(IoRT)是一种将机器人连接到互联网的网络形式。这些机器人利用物联网传感器来采集数据,并对周围环境进行解读。它们通常会与人工智能和云计算等多种技术相结合,以加快数据处理速度并优化资源利用。IoRT的发展使得机器人能够更智能地感知和响应环境变化,为各种行业带来了更高效的解决方案。通过与物联网技术的整合,IoRT不仅能够实现自主运行和自学习,还能够实现更高
    科技周边 · 人工智能   |  1年前  |   机器人 物联网 151浏览 收藏
  • AI预测等离子体撕裂现象,可控核聚变迈向新突破 - Nature报道
    AI预测等离子体撕裂现象,可控核聚变迈向新突破 - Nature报道
    可控核聚变,又有新突破了!长期以来,核聚变一直受着一个「幽灵」的困扰——等离子体不稳定性问题。最近,普林斯顿团队利用人工智能成功预测了核聚变等离子体的不稳定状态,提前了300毫秒。这种技术可以帮助调整磁场约束,有效遏制等离子体的逃逸。因此,科学家现在能够有效地避免可控核聚变的中断,从而实现所需的高功率聚变反应,这为实现更高能量输出提供了更有希望的前景。这项重大突破,成果已经登上Nature。论文地址:https://www.nature.com/articles/s41586-024-07024-9可控核
    科技周边 · 人工智能   |  1年前  |   AI 核聚变 130浏览 收藏
  • 利用广义Onsager原理构建AI平台实现自定义热力学
    利用广义Onsager原理构建AI平台实现自定义热力学
    编辑|绿萝基于先前积累的数据和已知物理原理的自动化科学发现,是人工智能最令人兴奋的应用之一,这种自动化的假设创建和验证可以帮助科学家研究复杂的现象,而传统的物理直觉可能会失败。近日,来自新加坡国立大学、新加坡科技研究局(A*STAR)、南洋理工大学和中国科学院的研究团队,开发了一个基于广义Onsager原理的人工智能平台:S-OnsagerNet,可以直接从对任意随机耗散系统的微观轨迹的观察中学习其宏观动力学描述。该方法同时构建了简化的热力学坐标,并解释这些坐标上的动力学。研究人员通过理论研究和实验验证长
    科技周边 · 人工智能   |  1年前  |   产业 413浏览 收藏
  • 传统卷积技术再进化:YOLOv9成为目标检测新标杆
    传统卷积技术再进化:YOLOv9成为目标检测新标杆
    在目标检测领域,YOLOv9在实现过程中不断进步,通过采用新架构和方法,有效提高了传统卷积的参数利用率,这使得其性能远超前代产品。继2023年1月YOLOv8正式发布一年多以后,YOLOv9终于来了!自2015年JosephRedmon和AliFarhadi等人提出了第一代YOLO模型以来,目标检测领域的研究者们对其进行了多次更新和迭代。YOLO是一种基于图像全局信息的预测系统,其模型性能不断得到增强。通过不断改进算法和技术,研究人员取得了显著的成果,使得YOLO在目标检测任务中表现出越来越强大的能力。这
    科技周边 · 人工智能   |  1年前  |   目标检测 产业 YOLOv9 294浏览 收藏
  • ControlNet创始人发布AI绘画新功能,实现图像分层,收获660颗星!
    ControlNet创始人发布AI绘画新功能,实现图像分层,收获660颗星!
    “绝不是简单的抠图。”ControlNet作者最新推出的一项研究受到了一波高度关注——给一句prompt,用StableDiffusion可以直接生成单个或多个透明图层(PNG)!例如来一句:头发凌乱的女性,在卧室里。Womanwithmessyhair,inthebedroom.可以看到,AI不仅生成了符合prompt的完整图像,就连背景和人物也能分开。而且把人物PNG图像放大细看,发丝那叫一个根根分明。再看一个例子:燃烧的柴火,在一张桌子上,在乡下。Burningfirewood,onatable,i
    科技周边 · 人工智能   |  1年前  |   模型 训练 457浏览 收藏
  • Think2Drive:首个用于自动驾驶的基于模型的RL方法(上海交大)
    Think2Drive:首个用于自动驾驶的基于模型的RL方法(上海交大)
    在CARLAv2中以专家级的熟练程度运行。题目:Think2Drive:EfficientReinforcementLearningbyThinkinginLatentWorldModelforQuasi-RealisticAutonomousDriving(inCARLA-v2)作者单位:上海交通大学现实世界中的自动驾驶(AD),尤其是城市驾驶,涉及许多cornercase。最近发布的AD仿真器CARLAv2在驾驶场景中增加了39个常见事件,并提供了比CARLAv1更接近真实的测试平台。这给社区带来了新
    科技周边 · 人工智能   |  1年前  |   自动驾驶 模型 163浏览 收藏
  • MIT博士获得第三届AAAI/ACM SIGAI博士论文奖,其260多页论文探索模型泛化
    MIT博士获得第三届AAAI/ACM SIGAI博士论文奖,其260多页论文探索模型泛化
    AAAI2024奖项陆续公布,继杰出论文奖后,今天博士论文奖也公布了。这几天,第38届国际AI顶会AAAI2024在加拿大温哥华会议中心举行。本届AAAI会议共有10504篇投稿,录取2527篇,录取率为24.1%。AAAI官方已经公布杰出论文奖(OutstandingPaperAward),其中有三篇论文获奖,其中包括西安电子科技大学团队的《ReliableConflictiveMulti-viewLearning》。值得一提的是,这次获奖的论文中也有华人学者的身影。AAAI2024宣布了第三届、202
    科技周边 · 人工智能   |  1年前  |   产业 西安电子科技大学 274浏览 收藏
  • AI主导的生产式自动化测试
    AI主导的生产式自动化测试
    译者|陈峻审校|重楼将传统大型主机应用的代码和数据迁移到现代化技术架构上,被认为是企业数字化发展的关键步骤。在追求效率和可扩展性的过程中,这种转变通常涉及从传统大型主机环境迁移到更灵活的云计算或内部部署方案中。这样的转型有助于企业实现更高的灵活性和创新能力,同时降低成本和提高安全性。这种迁移还可以为企业带来更好的资源利用率和更快的市场响应能力。企业需要谨慎计划和执行这一转变,确保数据迁移和应用重构过程顺利进行,以确保业务连续性和数据安全。通过将传统大型主机应用迁移到现代化技术架构上,企业可以更好地适应快速
    科技周边 · 人工智能   |  1年前  |   生成式AI 主机自动化 256浏览 收藏
  • 微软推出PyRIT工具,旨在识别生成式AI系统中的潜在风险
    微软推出PyRIT工具,旨在识别生成式AI系统中的潜在风险
    据外媒报道,微软最近推出了一个名为PyRIT的开放访问自动化框架,旨在帮助识别生成式人工智能系统中潜在的风险因素。RamShankarSivaKumar,微软人工智能红色团队负责人,指出红色团队的工具旨在让全球组织能够充分利用最新的人工智能进步,推动负责任的创新。据该公司称,PyRIT可用于评估大型语言模型(LLM)在不同损害类别下的鲁棒性,例如虚构、滥用和违禁内容。此外,该工具还可用于检测恶意软件生成的安全威胁、越狱行为,以及涉及身份盗窃等隐私风险。PyRIT包含五个接口:目标、数据集、评分引擎、支持多
    科技周边 · 人工智能   |  1年前  |   微软 人工智能 281浏览 收藏
  • 未来发展趋势和新兴技术:深度学习
    未来发展趋势和新兴技术:深度学习
    深度学习是人工智能的一个重要组成部分,不断推动着技术的发展,改变着机器对数据的处理方式。本文将介绍未来几年可能改变人工智能格局的最新趋势和新兴技术。模型规模指数增长以GPT-3等模型为例,大型神经网络模型的发展趋势表明对更强大、更复杂人工智能的需求。模型规模的增加使得处理复杂任务成为可能,但也引发了计算资源和能源消耗方面的挑战。迁移学习和预训练模型利用迁移学习可以更高效地训练模型,加速深度学习在各领域的应用,如医疗保健和自然语言处理。这种方法利用预训练模型的数据,为模型提供更丰富的信息,提升了模型的性能和
    科技周边 · 人工智能   |  1年前  |   人工智能 AI 深度学习 340浏览 收藏
  • GPT-4可能采用的推断解码技术是什种?对其历史、现状和应用进行综述
    GPT-4可能采用的推断解码技术是什种?对其历史、现状和应用进行综述
    众所周知,大型语言模型(LLM)的推理通常需要使用自回归采样,这个推理过程相当缓慢。为了解决这个问题,推测解码(SpeculativeDecoding)已经成为LLM推理的一种新型采样方法。这种方法在每个采样步骤中,会先预测几个可能的token,然后并行地验证是否准确。与自回归解码不同,推测解码能够单步解码多个token,从而加速推理。尽管推测解码在许多方面都表现出巨大潜力,但也带来了一些需要深入研究的关键问题。首先,我们需要思考如何选择或设计适当的近似模型,以在推测的准确性和生成的效率之间取得平衡。其次
    科技周边 · 人工智能   |  1年前  |   模型 训练 134浏览 收藏
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    508次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    497次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
  • Golang深入理解GPM模型
    Golang深入理解GPM模型
    Golang深入理解GPM调度器模型及全场景分析,希望您看完这套视频有所收获;包括调度器的由来和分析、GMP模型简介、以及11个场景总结。
    473次学习
查看更多
AI推荐
  • AI Make Song:零门槛AI音乐创作平台,助你轻松制作个性化音乐
    AI Make Song
    AI Make Song是一款革命性的AI音乐生成平台,提供文本和歌词转音乐的双模式输入,支持多语言及商业友好版权体系。无论你是音乐爱好者、内容创作者还是广告从业者,都能在这里实现“用文字创造音乐”的梦想。平台已生成超百万首原创音乐,覆盖全球20个国家,用户满意度高达95%。
    26次使用
  • SongGenerator.io:零门槛AI音乐生成器,快速创作高质量音乐
    SongGenerator
    探索SongGenerator.io,零门槛、全免费的AI音乐生成器。无需注册,通过简单文本输入即可生成多风格音乐,适用于内容创作者、音乐爱好者和教育工作者。日均生成量超10万次,全球50国家用户信赖。
    21次使用
  •  BeArt AI换脸:免费在线工具,轻松实现照片、视频、GIF换脸
    BeArt AI换脸
    探索BeArt AI换脸工具,免费在线使用,无需下载软件,即可对照片、视频和GIF进行高质量换脸。体验快速、流畅、无水印的换脸效果,适用于娱乐创作、影视制作、广告营销等多种场景。
    23次使用
  • SEO标题协启动:AI驱动的智能对话与内容生成平台 - 提升创作效率
    协启动
    SEO摘要协启动(XieQiDong Chatbot)是由深圳协启动传媒有限公司运营的AI智能服务平台,提供多模型支持的对话服务、文档处理和图像生成工具,旨在提升用户内容创作与信息处理效率。平台支持订阅制付费,适合个人及企业用户,满足日常聊天、文案生成、学习辅助等需求。
    23次使用
  • Brev AI:零注册门槛的全功能免费AI音乐创作平台
    Brev AI
    探索Brev AI,一个无需注册即可免费使用的AI音乐创作平台,提供多功能工具如音乐生成、去人声、歌词创作等,适用于内容创作、商业配乐和个人创作,满足您的音乐需求。
    25次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码