当前位置:首页 > 文章列表 > 科技周边 > 人工智能 > 保真度高达~98%,广工大「AI+光学」研究登Nature子刊,深度学习赋能非正交光复用

保真度高达~98%,广工大「AI+光学」研究登Nature子刊,深度学习赋能非正交光复用

来源:机器之心 2024-03-31 21:09:33 0浏览 收藏

一分耕耘,一分收获!既然打开了这篇文章《保真度高达~98%,广工大「AI+光学」研究登Nature子刊,深度学习赋能非正交光复用》,就坚持看下去吧!文中内容包含等等知识点...希望你能在阅读本文后,能真真实实学到知识或者帮你解决心中的疑惑,也欢迎大佬或者新人朋友们多留言评论,多给建议!谢谢!

保真度高达~98%,广工大「AI+光学」研究登Nature子刊,深度学习赋能非正交光复用
编辑 | X

在光复用中,通道之间的正交性扮演着至关重要的角色。这种正交性确保了不同通道之间的信号不会相互干扰,从而实现了高效的数据传输。光复用系统能够同时传输多个通道的数据,有效提高了光纤的利用率。然而,这种系统也不可避免地会施加复用容量的上限。

在此,广东工业大学通感融合光子技术教育部重点实验室开发一种基于深度神经网络的多模光纤(MMF)上的非正交光复用,称为散斑光场检索网络(Speckle light field retrieval network,SLRnet),它可以学习包含信息编码的多个非正交输入光场与其对应的单强度输出之间的复杂映射关系。

通过原理验证实验,SLRnet成功解决了MMF上非正交光复用的不适定问题。它能够利用单发散斑输出明确地检索由相同偏振、波长和空间位置介导的多个非正交输入信号,保真度高达98%。这项研究为实现高容量光复用利用非正交通道铺平了道路,是迈向这一目标的重要一步。

这项研究将推动光学和光子学领域的潜在应用,并为信息科学与技术等更广泛学科的探索提供新的启示。

相关研究以《Non-orthogonal optical multiplexing empowered by deep learning》为题,于 2024 年 2 月 21 日发表在《Nature Communications》上。

保真度高达~98%,广工大「AI+光学」研究登Nature子刊,深度学习赋能非正交光复用

论文链接:https://www.nature.com/articles/s41467-024-45845-4

光复用问题

复用(Multiplexing)是光通信的基石,其中复用通道之间的物理正交性是大规模编码信息传输的先决条件。

考虑到多个正交信号的解复用(Demultiplexing),传输矩阵方法(例如 MMF)甚至可以在强散射介质上解决这个问题。

最近,深度学习已广泛应用于光学和光子学领域,用于光学器件和计算光学的逆向设计。具体来说,深度神经网络已被用来提高多重散射介质上正交复用的性能。

然而,迄今为止,所有报道的复用场景都严格依赖于多路复用通道之间的物理正交性。目前还没有尝试利用深度学习的非线性建模能力来实现 MMF 上的非正交光复用。

不幸的是,即使在单模光纤中由相同偏振或波长介导的非正交信道的复用仍然非常具有挑战性,这是由于缺乏有效的解复用方法或数字信号处理负担过重。因此,开发一种新的方法来解码非正交输入通道中编码的信息对于最终的光复用至关重要。

基于深度神经网络的 MMF 上的非正交光复用

在此,研究人员证明了在 SLRnet 的支持下可以通过 MMF 实现初步的非正交光复用。

作为概念验证演示,可以利用非正交输入通道实现通过 MMF 的信息复用传输,包括一般自然场景图像、不相关的随机二进制数据和不属于同一类型训练数据集的图像,有利于实现光信息的非正交复用传输。

通过数据驱动技术在非正交输入通道和输出之间建立复杂的关系,训练有素的深度神经网络只需使用单次输出强度即可检索非正交通道的编码信息。即使是共享相同偏振、波长和输入空间区域的非正交复用通道也可以被有效地解码。

保真度高达~98%,广工大「AI+光学」研究登Nature子刊,深度学习赋能非正交光复用

图 1:MMF 上的非正交光复用示意图。(来源:论文)

神经网络架构

深度神经网络能够从 MMF 的单个散斑输出中检索非正交光复用信号。由任意偏振组合介导的多个幅度和相位编码信息在 MMF 中传播后可以被 SLRnet 有效地检索。

如图 2a 所示,即使是具有相同偏振、波长和输入空间区域的非正交输入通道的典型场景也可以被显式解码。这是通过深度神经网络实现的,其架构如图 2b 所示,它是根据 MMF 独特的多重散射过程的 Unet 的变体。它由全连接(FC)层和 ResUnet 组成。

保真度高达~98%,广工大「AI+光学」研究登Nature子刊,深度学习赋能非正交光复用

图 2:通过深度学习实现 MMF 上的非正交光复用。(来源:论文)

实验结果

首先考虑 MMF 长度为 1m 的情况。图 3a 展示了 SLRnet 训练过程中具有任意偏振态组合的两个复用光场通道的检索保真度的演变。总的来说,在幅度和相位维度上将有四个编码通道,根据偏振状态,它们可以是非正交的。检索到的保真度是通过皮尔逊相关系数(PCC)来衡量的。

保真度高达~98%,广工大「AI+光学」研究登Nature子刊,深度学习赋能非正交光复用

图 3:使用 SLRnet 的非正交复用性能。(来源:论文)

从图中可以看出,使用相同的 SLRnet 训练配置检索到的 PCC 在 100 个 epoch 后的演化大于 0.97。同时,十二个复用场景的检索保真度的演变基本相同,这展示了非正交复用对于任意偏振组合的出色稳健性。

此外,图 3b 提供了分别使用不同的偏振组合在每个幅度和相位复用通道中检索到的保真度。幅度和相位维度上的平均检索保真度几乎相同( ~ 0.98),这凸显了 SLRnet 对多个非正交输入通道中编码的信息进行解复用的能力。

为了对波前编码的检索信息进行 sensory 评估,四种偏振组合(0° 和 0°、0° 和 10°、0° 和 90° 以及 0° 和椭圆)的典型解复用结果如图 4 所示。

保真度高达~98%,广工大「AI+光学」研究登Nature子刊,深度学习赋能非正交光复用

图 4:1 m MMF 上的非正交复用结果。(来源:论文)

可以看出,使用相同偏振在输入波前的幅度和相位上复用的四个灰度图像可以利用单次散斑输出有效地解复用。在不同偏振组合下检索到的其他结果的保真度相似,这表明即使编码波前被 MMF 扰乱,SLRnet 也能够实现前所未有的非正交输入通道复用。

保真度高达~98%,广工大「AI+光学」研究登Nature子刊,深度学习赋能非正交光复用

图 5:50 m MMF 上的非正交复用结果。(来源:论文)

为了进一步巩固 SLRnet 在更现实的场景中的优越性,提出了在 50 m MMF 上使用相同偏振态的非正交光复用结果,如图 5 所示。从图 4 和图 5 可以看出,1 m MMF 的解复用结果比 50 m 情况要好,这是因为较长的 MMF 的散射特性更容易受到环境的影响。通过优化网络结构可以进一步提高解复用性能。研究表明,SLRnet 是 MMF 中复用非正交信道的有效手段。

保真度高达~98%,广工大「AI+光学」研究登Nature子刊,深度学习赋能非正交光复用

图 6:一般自然场景图像和不属于 ImageNet 数据库的图像在 1 m MMF 上非正交复用的结果。(来源:论文)

最后,展示 SLRnet 对于不同图像集的通用性,研究表明 SLRnet 具有良好的泛化性。

尽管现阶段所提出的基于 MMF 的非正交光复用概念不能直接用于通常需要统一保真度的医疗诊断,但高精度的非相关二进制数字信息的非正交复用表明,通过 MMF 实现光信息的非正交复用传输向前迈进了一步。

该研究不仅可以为利用高吞吐量 MMF 进行通信和信息处理铺平道路,而且还可能为光学及其他领域的光复用提供范式转变,这可以大大提高光学系统的自由度和容量。

今天关于《保真度高达~98%,广工大「AI+光学」研究登Nature子刊,深度学习赋能非正交光复用》的内容就介绍到这里了,是不是学起来一目了然!想要了解更多关于深度学习,理论,AI+光学的内容请关注golang学习网公众号!

版本声明
本文转载于:机器之心 如有侵犯,请联系study_golang@163.com删除
WIN10隐藏搜索框的操作流程WIN10隐藏搜索框的操作流程
上一篇
WIN10隐藏搜索框的操作流程
win11双击文件夹转圈圈卡死怎么办?
下一篇
win11双击文件夹转圈圈卡死怎么办?
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    508次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    497次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • SEO标题魔匠AI:高质量学术写作平台,毕业论文生成与优化专家
    魔匠AI
    SEO摘要魔匠AI专注于高质量AI学术写作,已稳定运行6年。提供无限改稿、选题优化、大纲生成、多语言支持、真实参考文献、数据图表生成、查重降重等全流程服务,确保论文质量与隐私安全。适用于专科、本科、硕士学生及研究者,满足多语言学术需求。
    11次使用
  • PPTFake答辩PPT生成器:一键生成高效专业的答辩PPT
    PPTFake答辩PPT生成器
    PPTFake答辩PPT生成器,专为答辩准备设计,极致高效生成PPT与自述稿。智能解析内容,提供多样模板,数据可视化,贴心配套服务,灵活自主编辑,降低制作门槛,适用于各类答辩场景。
    26次使用
  • SEO标题Lovart AI:全球首个设计领域AI智能体,实现全链路设计自动化
    Lovart
    SEO摘要探索Lovart AI,这款专注于设计领域的AI智能体,通过多模态模型集成和智能任务拆解,实现全链路设计自动化。无论是品牌全案设计、广告与视频制作,还是文创内容创作,Lovart AI都能满足您的需求,提升设计效率,降低成本。
    25次使用
  • 美图AI抠图:行业领先的智能图像处理技术,3秒出图,精准无误
    美图AI抠图
    美图AI抠图,依托CVPR 2024竞赛亚军技术,提供顶尖的图像处理解决方案。适用于证件照、商品、毛发等多场景,支持批量处理,3秒出图,零PS基础也能轻松操作,满足个人与商业需求。
    35次使用
  • SEO标题PetGPT:智能桌面宠物程序,结合AI对话的个性化陪伴工具
    PetGPT
    SEO摘要PetGPT 是一款基于 Python 和 PyQt 开发的智能桌面宠物程序,集成了 OpenAI 的 GPT 模型,提供上下文感知对话和主动聊天功能。用户可高度自定义宠物的外观和行为,支持插件热更新和二次开发。适用于需要陪伴和效率辅助的办公族、学生及 AI 技术爱好者。
    36次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码