-
- 二次元专用超分AI模型APISR:在线可用,入选CVPR
- 动漫作品如《龙珠》、《神奇宝贝》、《新世纪福音战士》等上个世纪开播的动漫是许多人童年回忆的一部分,它们曾给我们带来了充满了热血、友情与梦想的视觉之旅。某些时候,我们会突然有重温这些童年回忆的冲动,但我们却可能会遗憾地发现这些童年回忆的辨识率非常低,根本无法在宽屏电视上创建出良好的视觉体验,以至于阻碍我们与在高清分辨率数字世界中成长的孩子分享这些童年回忆。对于这种的恶性竞争(以及潜在的市场),一种做法是由动画公司制作重制版。这项任务的人力和资金成本都不低,但可能比忽视此问题和失去市场份额更加值得。多模态人工
- 科技周边 · 人工智能 | 1年前 | 工程 APISR 133浏览 收藏
-
- IT团队必须应对的商业智能六个挑战
- 商业智能(BI)使企业能够从大量数据中获得见解。但这样做需要克服一系列战略和战术挑战。目前,各种类型的组织都被来自各种来源的数据淹没,试图理解所有这些数据不堪重负。因此,强大的商业智能(BI)策略可以帮助组织流程,并确保业务用户能够够访问和操作的业务见解。通过BI策略,可以将各种数据源整合在一起,为用户提供准确、有用的信息。BI策略的好处是多方面的。首先,它可以帮助组织更好地理解其业务数据,并提供深入的洞察力。其次,BI策略还可以帮助组织管理和分析大量数据,从总部位于西雅图的Launch咨询集团良好行业数
- 科技周边 · 人工智能 | 1年前 | 智能 报告 商业 150浏览 收藏
-
- 建筑业的供应链管理:终极指南
- 什么是建筑业的供应链管理?首先,什么是供应链管理?供应链管理(SCM)是对整个流程中的材料、信息和财务的监督,从供应商到制造商、批发商、零售商,最终到消费者。供应链中的主要流程包括产品流、信息流和资金流。SCM包括协调和整合企业内部和企业之间的这些流程。它是建筑价值链中最复杂的领域之一。人工智能、数据分析和机器学习等创新的推动下,供应链管理行业目前处于高增长阶段。据预计,到2023年,其全球市场价值为2300万美元,预计从2024年到2030年将增长11.2%。建筑行业中,供应链管理(SCM)在改善利益相
- 科技周边 · 人工智能 | 1年前 | 人工智能 供应链 智能建筑 169浏览 收藏
-
- 液体都“智能”可编程了?哈佛新型超材料登Nature,粘度、透明度、弹性可变
- 液体都有“智能”、可编程了?最近,一种被称为“智能"液体的多功能可编程的新型超材料——Metafluid,登上了Nature。它由哈佛大学SEAS的研究团队研发,据说可自由调节弹性、光学特性、粘度。甚至能够在牛顿流体和非牛顿流体之间转换。这些buff属性是研究人员表现出的,该流体在编程液压机器人、智能减震器、光学设备中都有巨大的应用潜力。可编程的“智能液体”为什么说可用于编程液压机器人等技术?奥秘就在这张图中:来看研究人员的展示。研究人员设计了一个抓取器,用空气和水作对照,通过抓取玻璃瓶、鹌鹑蛋、蓝莓,来
- 科技周边 · 人工智能 | 1年前 | 编程 智能 395浏览 收藏
-
- 自然语言处理(NLP)的工作原理
- 本文早在揭开语言模型的神秘面纱,阐明其处理原始文本数据的基本概念和机制。它涵盖了几种类型的语言模型和大型语言模型,重点关注基于神经网络的模型。语言模型定义语言模型专注于生成类似人类类的文本的能力。通用语言模型本质上是单词序列的统计模型或概率分布,用于解释单词在每个序列中出现的可能性。这有助于根据句子中的前一个单词预测下一个单词或单词。简化的概率语言模型可用于机器翻译、自动纠错、语音识别和自动完成等各种应用,为用户填写以下单词或建议可能的单词序列。该类型模型已经发展成为更先进的模型,包括变换器模型,通过考虑
- 科技周边 · 人工智能 | 1年前 | 人工智能 语言模型 NLP 345浏览 收藏
-
- 新测试基准发布,最强开源Llama 3尴尬了
- 如果试题太简单,学霸和学渣都能考90分,拉不开差距……随着Claude3、Llama3甚至之后GPT-5等更强模型发布,业界急需一款更难、更有区分度的基准测试。大模型竞技场背后组织LMSYS推出下一代基准测试Arena-Hard,引起广泛关注。Llama3的两个指令微调版本实力到底如何,也有了最新参考。与之前大家分数都相近的MTBench相比,Arena-Hard区分度从22.6%提升到87.4%,孰强孰弱一目了然。Arena-Hard利用竞技场实时人类数据构建,与人类偏好一致率也高达89.1%。除了上面
- 科技周边 · 人工智能 | 1年前 | GPT-5 大模型 Llama 3 200浏览 收藏
-
- 元象首个MoE大模型开源:4.2B激活参数,效果堪比13B模型
- 元象发布XVERSE-MoE-A4.2B大模型,采用业界最前沿的混合专家模型架构(MixtureofExperts),激活参数4.2B,效果即可媲美13B模型。该模型全开源,无条件免费商用,让海量中小企业、研究者和开发者可在元象高性能“全家桶”中按需选用,推动低成本部署。GPT3、Llama与XVERSE等主流大模型发展遵循规模理论(ScalingLaw),在模型训练和推理的过程中,单次前向、反向计算时,所有参数都被激活,这被称为稠密激活(denselyactivated)。当模型
- 科技周边 · 人工智能 | 1年前 | 产业 129浏览 收藏
-
- OccFusion:一种简单有效的Occ多传感器融合框架(性能SOTA)
- 对3D场景的全面理解在自动驾驶中至关重要,最近的3D语义占用预测模型已经成功地解决了描述具有不同形状和类别的真实世界物体的挑战。然而,现有的3D占用预测方法在很大程度上依赖于全景相机图像,这使得它们容易受到照明和天气条件变化的影响。通过集成激光雷达和环视雷达等附加传感器的功能,本文的框架提高了占用预测的准确性和稳健性,从而在nuScenes基准上获得了顶级性能。此外,在nuScene数据集上进行的广泛实验,包括具有挑战性的夜间和雨天场景,证实了我们的传感器融合策略在各种感知范围内的卓越性能。论文链接:ht
- 科技周边 · 人工智能 | 1年前 | 框架 传感器 3D 358浏览 收藏
-
- DualBEV:大幅超越BEVFormer、BEVDet4D,开卷!
- 这篇论文探讨了在自动驾驶中,从不同视角(如透视图和鸟瞰图)准确检测物体的问题,特别是如何有效地从透视图(PV)到鸟瞰图(BEV)空间转换特征,这一转换是通过视觉转换(VT)模块实施的。现有的方法大致分为两种策略:2D到3D和3D到2D转换。2D到3D的方法通过预测深度概率来提升密集的2D特征,但深度预测的固有不确定性,尤其是在远处区域,可能会引入不准确性。而3D到2D的方法通常使用3D查询来采样2D特征,并通过Transformer学习3D和2D特征之间对应关系的注意力权重,这增加了计算和部署的复杂性。论
- 科技周边 · 人工智能 | 1年前 | 模型 技术 147浏览 收藏
-
- 基于Transformer的高效单阶段短时RGB-T单目标跟踪方法
- 引言如图1所示,现有的三阶段RGB-T单目标跟踪网络通常采用两个独立的特征提取分支,分别负责提取两个模态的特征。然而,相互独立的特征提取分支会导致两个模态在特征提取阶段存在缺乏有效的信息交互。因此,一旦网络完成离线训练,其只能从每个模态图像中提取固定的特征,无法根据实际的模态状态动态调整,以提取更具针对性的动态特征。这一局限性约束了网络对多样的目标双模态外观,以及模态外观之间动态对应关系的适应能力。如图2所示,这种特征提取方式并不适合RGB-T单目标跟踪的实际应用场景,特别是在复杂环境下,因为被跟踪目标的
- 科技周边 · 人工智能 | 1年前 | 理论 356浏览 收藏
-
- 到2030年可以依靠人工智能运行的主要行业
- 人工智能(AI)在各个领域持续快速发展,其在各个领域的应用日益明显。预计到2030年,人工智能领域将彻底改变众多行业,改变企业运营方式,提高效率、生产力和创新。本文将探讨一些准备在未来十年利用人工智能力量的顶级行业。医疗保健:到2030年,医疗保健行业将从人工智能驱动的技术中受益匪浅。人工智能驱动的诊断工具可以分析医学图像,例如X射线和MRI扫描,其准确性和速度比人类放射科医生更高,从而可以更早地检测到疾病并改善患者的治疗结果。此外,人工智能算法可以帮助医疗保健提供者根据患者的基因图谱和病史制定个性化的治
- 科技周边 · 人工智能 | 1年前 | 人工智能 医疗保健 金融 415浏览 收藏
-
- 物联网传感器和人工智能如何彻底改变智能建筑
- 在过去几年中,特别是在COVID-19大流行之后,随着对设施管理人员的期望发生变化以及可持续需求的扩大,建筑管理面临着不断增加和演变。从办公室到更加混合和灵活的工作环境的转变改变了商业建筑的使用方式,需要实时了解建筑使用情况、居住趋势等。不断变化的建筑管理格局表明,迅捷适应新的灵活环境,同时提高整体生产力和性能的解决方案。智能建筑评估自己的设施和改进机会,智能建筑成为一种日益增长的趋势,它不仅有可能简化运营,还可以降低成本并提高所有人的可见性。利用物联网(IoT)、人工智能(AI)、自动化等技术,智能建筑
- 科技周边 · 人工智能 | 1年前 | 人工智能 物联网 316浏览 收藏
-
- 开箱黑盒LLM!谷歌大一统框架Patchscopes实战教程来了
- 虽然大型语言模型(LLM)在各种常见的自然语言处理任务中展现出了优异的性能,但随之而来的幻觉也揭示了模型在真实性和透明度上仍然存在问题。尽管LLM在某些任务上准确无误地完成了指定的任务,但其输出结果并非总是可靠的。它可能会生成看似合理但事实上是错误或误导性的文本。这些错误可能是因为模型在训练过程中没有接触到足够多的可在模型生成错误回复内容时,可以尝试“深入理解其背后机制”,解决模型的幻觉问题。深度神经网络的复杂性和模型的增长,使得通过探索机器学习(ML)模型对所学内容的hiddenrepresentati
- 科技周边 · 人工智能 | 1年前 | AI 数据 431浏览 收藏
-
- Open-Sora全面开源升级:支持16s视频生成和720p分辨率
- Open-Sora在开源社区悄悄更新了,现在支持长达16秒的视频生成,分辨率最高可达720p,并且可以处理任何宽高比的文本到图像、文本到视频、图像到视频、视频到视频和无限长视频的生成需求。我们来尝试尝试效果。生成个横屏圣诞雪景,发b站再生成个竖屏,发抖音还能生成16秒的长视频,这下人人都能过把编剧瘾了怎么玩?指路GitHub:https://github.com/hpcaitech/Open-Sora更酷的是,Open-Sora依旧全部开源,包含最新的模型架构、最新的模型权重、多时间/分辨率/长宽比/帧率
- 科技周边 · 人工智能 | 1年前 | 模型 数据 191浏览 收藏
-
- Transformer本可以深谋远虑,但就是不做
- 语言模型是否会规划未来token?这篇论文给你答案。「别让YannLeCun看见了。」YannLeCun表示太迟了,他已经看到了。今天要介绍的这篇「LeCun非要看」的论文探讨的问题是:Transformer是深谋远虑的语言模型吗?当它在某个位置执行推理时,它会预先考虑后面的位置吗?这项研究得出的结论是:Transformer有能力这样做,但在实践中不会这样做。我们都知道,人类会思考而后言。十年的语言学研究表明:人类在使用语言时,内心会预测即将出现的语言输入、词或句子。不同于人类,现在的语言模型在「说话」
- 科技周边 · 人工智能 | 1年前 | 理论 447浏览 收藏
查看更多
课程推荐
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 484次学习
-
- Golang深入理解GPM模型
- Golang深入理解GPM调度器模型及全场景分析,希望您看完这套视频有所收获;包括调度器的由来和分析、GMP模型简介、以及11个场景总结。
- 473次学习
查看更多
AI推荐
-
- PPTFake答辩PPT生成器
- PPTFake答辩PPT生成器,专为答辩准备设计,极致高效生成PPT与自述稿。智能解析内容,提供多样模板,数据可视化,贴心配套服务,灵活自主编辑,降低制作门槛,适用于各类答辩场景。
- 21次使用
-
- Lovart
- SEO摘要探索Lovart AI,这款专注于设计领域的AI智能体,通过多模态模型集成和智能任务拆解,实现全链路设计自动化。无论是品牌全案设计、广告与视频制作,还是文创内容创作,Lovart AI都能满足您的需求,提升设计效率,降低成本。
- 20次使用
-
- 美图AI抠图
- 美图AI抠图,依托CVPR 2024竞赛亚军技术,提供顶尖的图像处理解决方案。适用于证件照、商品、毛发等多场景,支持批量处理,3秒出图,零PS基础也能轻松操作,满足个人与商业需求。
- 33次使用
-
- PetGPT
- SEO摘要PetGPT 是一款基于 Python 和 PyQt 开发的智能桌面宠物程序,集成了 OpenAI 的 GPT 模型,提供上下文感知对话和主动聊天功能。用户可高度自定义宠物的外观和行为,支持插件热更新和二次开发。适用于需要陪伴和效率辅助的办公族、学生及 AI 技术爱好者。
- 34次使用
-
- 可图AI图片生成
- 探索快手旗下可灵AI2.0发布的可图AI2.0图像生成大模型,体验从文本生成图像、图像编辑到风格转绘的全链路创作。了解其技术突破、功能创新及在广告、影视、非遗等领域的应用,领先于Midjourney、DALL-E等竞品。
- 56次使用