用于对象分类任务的轨道角动量编码衍射网络

2023-11-28 09:43:19深情的哈密瓜

深度学习彻底改变了我们感知和利用数据的方式。然而,随着数据集的增长和计算需求的增加,我们需要更有效的方法来处理、存储和处理数据。在这方面,光计算被视为计算技术的下一个前沿。光学计算不使用电子信号,而是依赖光波的特性(例如波长和偏振)来存储和处理数据。

用于对象分类任务的轨道角动量编码衍射网络

衍射深度神经网络(D2NN)利用光波的各种特性来执行图像和物体识别等任务。这种网络由作为衍射层的二维像素阵列组成。每个像素都是一个可调节的参数,影响穿过它的光波的属性。这种独特的设计使网络能够通过操纵光波中的信息来执行计算任务。到目前为止,D2神经网络已经利用了光波的特性,例如强度、相位、偏振和波长。

现在,在AdvancedPhotonicsNexus上发表的一项研究中,来自中国中央民族大学、北京大学和山西大学的研究人员开发了三个带有衍射层的D2神经网络,可以使用轨道角动量(OAM)中保存的信息来识别物体。光。其中包括用于单任务和多任务分类的单检​​测器OAM编码的D2NN,以及用于可重复多任务分类的多检测器OAM编码的D2NN。

但什么是OAM?它是光波与其旋转或扭曲运动相关的特性。它可以呈现无限数量的独立值,每个值对应于不同的光模式。由于其可能的状态或模式范围广泛,OAM可以携带空间信息,例如对象的位置、排列或结构。在提出的D2NN框架中,包含照亮手写数字的信息的OAM光束被组合成单个涡旋光束。该光束包含多个OAM模式,每个模式都与光波的特定扭曲或旋转相关,穿过五个衍射层,这些衍射层经过训练,可以从OAM模式中识别手写数字的特征。

OAM编码的D2NN的一个显着特征是它能够识别重复数字的序列。为了实现这一目标,研究人员采用多个探测器同时处理多个图像的OAM信息。

在手写数字识别常用数据集MNIST数据集上进行测试时,D2NN在大约85.49%的时间内正确预测了图像中的单个数字,其准确度与利用波长和偏振特性的D2NN模型相当光。

利用OAM模式对信息进行编码是提高并行处理能力的重要一步,并将有利于需要实时处理的应用程序,例如图像识别或数据密集型任务。

实际上,这项工作利用OAM自由度实现了并行分类的突破,超越了其他现有的D2NN设计。值得注意的是,OAM编码的D2神经网络提供了一个强大的框架,可以进一步提高全光并行分类和基于OAM的机器视觉任务的能力,并有望为D2神经网络开辟有前景的研究方向。

推荐阅读

阅读排行