当前位置:首页 > 文章列表 > 科技周边 > 人工智能 > ICML 2024 | 信号表征指数级强、内存节省超35%,量子隐式表征网络来了

ICML 2024 | 信号表征指数级强、内存节省超35%,量子隐式表征网络来了

来源:机器之心 2024-06-26 16:42:26 0浏览 收藏

IT行业相对于一般传统行业,发展更新速度更快,一旦停止了学习,很快就会被行业所淘汰。所以我们需要踏踏实实的不断学习,精进自己的技术,尤其是初学者。今天golang学习网给大家整理了《ICML 2024 | 信号表征指数级强、内存节省超35%,量子隐式表征网络来了》,聊聊,我们一起来看看吧!

ICML 2024 | 信号表征指数级强、内存节省超35%,量子隐式表征网络来了
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com

本文作者是天津大学智能与计算学部张鹏教授及其硕士生赵佳铭,博士生乔文博、高珲。该项研究工作受到国家自然科学基金委、天津大学 - 中科闻歌联合实验室资助。

ICML 2024 | 信号表征指数级强、内存节省超35%,量子隐式表征网络来了

  • 论文标题:Quantum Implicit Neural Representations
  • 论文作者:Jiaming Zhao, Wenbo Qiao, Peng Zhang*, Hui Gao
  • 论文链接:https://arxiv.org/abs/2406.03873

引言

天津大学量子智能与语言理解团队创新性地将量子计算引入隐式神经表征领域,提出了量子隐式表征网络(Quantum Implicit Representation Network, QIREN)。与经典神经网络方法相比,该方法在理论上具有指数级强的信号表征能力。实验结果也证实了 QIREN 的确表现出超越信号表示任务上 SOTA 模型的优异性能,在参数量更少的情况下,拟合误差最多减少 35%。图 1 中展示了本文的核心思想和主要结论。相关论文已经被机器学习领域最权威的会议之一 ICML 2024 接收。ICML 2024 | 信号表征指数级强、内存节省超35%,量子隐式表征网络来了
                                图 1. 经典傅立叶神经网络与量子傅立叶神经网络。

近年来,隐式神经表征作为一种新兴的信号表征方式引起了广泛关注。与传统的离散网格表示(例如用像素网格表示的图像)相比,隐式神经表征具有许多独特的优势。首先,它具备"无限分辨率"的能力,可以在任意空间分辨率下进行采样。其次,隐式神经表征具有出色的存储空间节省,为数据存储提供了便利。正因为这些独特的优势,隐式神经表征迅速成为表示图像、物体和3D场景等信号的主流范式。大多数关于隐式神经表征的早期研究都建立在基于ReLU的多层感知器(MLP)之上。然而,基于ReLU的MLP难以精确建模信号的高频部分,如图2所示。最近的研究已经开始探索使用傅立叶神经网络(FNN)来克服这一限制。然而,面对现实应用中越来越复杂的拟合任务,经典傅立叶神经网络也需要越来越多的训练参数,这增加了对计算资源的需求。本文提出的量子隐式神经表征利用了量子优势从而能够减少参数和计算消耗,这种解决方案能够给隐式神经表征甚至机器学习领域带来新的启发。

ICML 2024 | 信号表征指数级强、内存节省超35%,量子隐式表征网络来了

                              图 2. 真实图像的不同频率分量(顶部)和基于 ReLU 的 MLP 拟合的图像的不同频率分量(底部)

模型

ICML 2024 | 信号表征指数级强、内存节省超35%,量子隐式表征网络来了

                               图 3. 模型架构

模型整体架构

QIREN 的总体架构如图 3 所示,由 N 个混合层和末端的线性层组成。该模型以坐标作为输入并输出信号值。数据最初进入混合层,从 Linear 层和 BatchNorm 层开始,得到:

ICML 2024 | 信号表征指数级强、内存节省超35%,量子隐式表征网络来了

然后被输入到数据重新上传量子电路 QC 中。在图 2 (b) 和 (c) 中,我们给出了参数层和编码层量子电路的具体实现。参数层由 K 个堆叠块组成。每个块包含应用于每个量子位的旋转门,以及以循环方式连接的 CNOT 门。编码层在每个量子位上应用门。最后,我们测量了量子态相对于可观测量的期望值。量子电路的输出由下式给出:

ICML 2024 | 信号表征指数级强、内存节省超35%,量子隐式表征网络来了

其中 O 表示任意可观测量。第 n 个混合层的输出将被用作第(n+1)层的输入。最后,我们添加一个线性层以接收并输出。我们使用均方误差(MSE)作为损失函数来训练模型:

ICML 2024 | 信号表征指数级强、内存节省超35%,量子隐式表征网络来了

模型理论分析

在一些先前的研究中,数据重上传量子线路的数学性质已经被揭示,本质上数据重上传量子线路是以傅立叶级数的形式拟合目标函数。但之前的工作只探索了多层单量子比特线路或单层多量子比特线路,并且没有与经典方法进行比较,没有找到数据重上传量子线路的优势。我们将研究扩展到多层多量子比特线路。此外,我们证明了在隐式神经表征领域,以数据重上传量子线路为核心组件的混合量子神经网络 QIREN 相比经典方法有着指数级优势。我们分析了 QIREN 中的量子层和经典层的作用并将其归纳为以下三点:

1. 在最佳条件下,数据重上传量子电路表示傅立叶级数的能力随着电路的大小呈指数增长。

具体推导见论文 4.2 和 4.3 节。

2. 线性层的作用是进一步扩展频谱和调整频率,从而提高拟合性能。

在将数据上传到量子电路之前应用线性层相当于调整编码层哈密顿量的本征值,最终影响频谱。这种方法有两个优点。首先,它可以使频谱更大。仅用门编码时频谱中会产生一些冗余项。这种冗余可以通过使用线性层来减少。其次,它使频谱的覆盖范围可以调整,旨在覆盖更重要的系数更大的频率。因此,加入线性层可以进一步提高 QIREN 的拟合性能。

3. Batchnorm 层的作用是加速量子模型的收敛。

在前馈神经网络中,数据通常在激活函数之前通过 BatchNorm 层,这有效地防止了消失梯度问题。类似地,在 QIREN 中,量子电路取代了激活函数,并在提供非线性方面发挥作用(量子电路本身是线性的,但将经典数据上传到量子电路的过程是非线性的)。因此,我们在这里添加了 BatchNorm 层,目的是稳定和加速模型的收敛。

实验结果

我们通过图像表示和声音表示任务验证了 QIREN 在表示信号,特别是高频信号方面的优越性能。实验结果如表 1 所示。QIREN 和 SIREN 在声音表示任务上表现出相似的表现。尽管这两个模型的性能似乎是可比较的,但值得强调的是,我们的模型以最少的参数实现了 35.1% 的内存节省,并且 SIREN 的收敛需要设置合适的超参数,而我们的模型没有这种限制。然后,我们从频率的角度分析了模型的输出。我们在图 4 中可视化了模型输出的频谱。很明显,模型输出的低频分布都接近真实情况。然而,当涉及到高频分布时,QIREN 和 SIREN 都拟合得很好,其次是具有随即傅立叶特征(RFF)的基于 ReLU 的 MLP。基于 ReLU 和基于 Tanh 的 MLP 甚至缺乏信号的高频部分。

ICML 2024 | 信号表征指数级强、内存节省超35%,量子隐式表征网络来了

表 1. 模型在信号表示和图像超分辨率任务上的 MSE()。被认为是 SOTA 的模型标有 *。params 表示模型参数量,mem 表示与离散网格表示相比,模型节省的内存。

ICML 2024 | 信号表征指数级强、内存节省超35%,量子隐式表征网络来了

                              图 4. 声音表示任务中模型输出的频谱

QIREN 在图像表示任务中用最少的参数实现了最佳性能,与 SOTA 模型相比,误差最大减少了 34.8%。为了进一步探索模型的信号表示能力,我们使用滤波器来分离其输出的高频和低频分量,并分别比较这两个分量的拟合误差,结果如图 5 所示。QIREN 在拟合高频和低频分量时始终实现了最低的误差。

ICML 2024 | 信号表征指数级强、内存节省超35%,量子隐式表征网络来了

                                图 5. 与基于 Tanh 的 MLP 相比,每个模型的相对误差。阴影区域表示低频误差,而非阴影区域表示高频误差。

最新的研究引入了一个突破性的框架将隐式神经表征扩展到图像生成。更具体地说,该框架利用以随机分布为输入的超网络来生成隐式表征网络的参数。随后,这些生成的参数被分配给隐式表征网络。最后,隐式表征网络以坐标为输入生成图像。采用对抗性方法来确保生成的图像与我们期望的结果一致。在这项任务中,我们采用了这样一个框架,并建立在 StyleGAN2 的基础上。

实验结果如表 2 所示。我们还进一步探索了 QIREN 生成器的一些令人兴奋的特性,如图 6 和 7 所示。

ICML 2024 | 信号表征指数级强、内存节省超35%,量子隐式表征网络来了

                               表 2. 模型在 FFHQ 和 CelebA-HQ 数据集上的 FID 得分。

ICML 2024 | 信号表征指数级强、内存节省超35%,量子隐式表征网络来了

                                 图 6. 开箱即用的超分辨率

ICML 2024 | 信号表征指数级强、内存节省超35%,量子隐式表征网络来了

                             图 7. 有意义的图像空间插值
总结

这项工作不仅将量子优势融入到隐式神经表示中,而且为量子神经网络开辟了一个有前景的应用方向 —— 隐式神经表征。值得强调的是,隐式神经表征还有许多其他潜在的应用,如表示场景或 3D 对象、时间序列预测和求解微分方程。对于一大类对连续信号建模的任务,我们都可以考虑引入隐式表征网络作为基本组件。基于本文的理论和实验基础,我们可以在未来的工作中将 QIREN 扩展到这些应用中,并且 QIREN 有望在这些领域中以更少的参数产生更好的结果。同时,我们为量子机器学习找到了一个合适的应用场景。从而促进量子机器学习社区内进一步的实践和创新研究。

今天关于《ICML 2024 | 信号表征指数级强、内存节省超35%,量子隐式表征网络来了》的内容介绍就到此结束,如果有什么疑问或者建议,可以在golang学习网公众号下多多回复交流;文中若有不正之处,也希望回复留言以告知!

版本声明
本文转载于:机器之心 如有侵犯,请联系study_golang@163.com删除
java框架在金融科技领域的应用java框架在金融科技领域的应用
上一篇
java框架在金融科技领域的应用
美图影像研究院(MT Lab)斩获3项国际人工智能顶会大奖
下一篇
美图影像研究院(MT Lab)斩获3项国际人工智能顶会大奖
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    508次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    497次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • AI Make Song:零门槛AI音乐创作平台,助你轻松制作个性化音乐
    AI Make Song
    AI Make Song是一款革命性的AI音乐生成平台,提供文本和歌词转音乐的双模式输入,支持多语言及商业友好版权体系。无论你是音乐爱好者、内容创作者还是广告从业者,都能在这里实现“用文字创造音乐”的梦想。平台已生成超百万首原创音乐,覆盖全球20个国家,用户满意度高达95%。
    24次使用
  • SongGenerator.io:零门槛AI音乐生成器,快速创作高质量音乐
    SongGenerator
    探索SongGenerator.io,零门槛、全免费的AI音乐生成器。无需注册,通过简单文本输入即可生成多风格音乐,适用于内容创作者、音乐爱好者和教育工作者。日均生成量超10万次,全球50国家用户信赖。
    19次使用
  •  BeArt AI换脸:免费在线工具,轻松实现照片、视频、GIF换脸
    BeArt AI换脸
    探索BeArt AI换脸工具,免费在线使用,无需下载软件,即可对照片、视频和GIF进行高质量换脸。体验快速、流畅、无水印的换脸效果,适用于娱乐创作、影视制作、广告营销等多种场景。
    20次使用
  • SEO标题协启动:AI驱动的智能对话与内容生成平台 - 提升创作效率
    协启动
    SEO摘要协启动(XieQiDong Chatbot)是由深圳协启动传媒有限公司运营的AI智能服务平台,提供多模型支持的对话服务、文档处理和图像生成工具,旨在提升用户内容创作与信息处理效率。平台支持订阅制付费,适合个人及企业用户,满足日常聊天、文案生成、学习辅助等需求。
    21次使用
  • Brev AI:零注册门槛的全功能免费AI音乐创作平台
    Brev AI
    探索Brev AI,一个无需注册即可免费使用的AI音乐创作平台,提供多功能工具如音乐生成、去人声、歌词创作等,适用于内容创作、商业配乐和个人创作,满足您的音乐需求。
    23次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码