論文の概要: Pyramid diffractive optical networks for unidirectional magnification
and demagnification
- arxiv url: http://arxiv.org/abs/2308.15019v1
- Date: Tue, 29 Aug 2023 04:46:52 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-30 15:48:39.299011
- Title: Pyramid diffractive optical networks for unidirectional magnification
and demagnification
- Title(参考訳): 一方向倍率・デマグニフィケーションのためのピラミッド回折光ネットワーク
- Authors: Bijie Bai, Xilin Yang, Tianyi Gan, Jingxi Li, Deniz Mengu, Mona
Jarrahi, Aydogan Ozcan
- Abstract要約: P-D2NN(P-D2NN)とよばれるピラミッド構造型回折光ネットワークの設計について述べる。
解析の結果,このP-D2NN設計が一方向画像拡大およびデマジニフィケーションタスクに有効であることが判明した。
逆方向の像形成を抑えつつ、1方向のみに高忠実度またはデマグニュレーション画像を生成する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diffractive deep neural networks (D2NNs) are composed of successive
transmissive layers optimized using supervised deep learning to all-optically
implement various computational tasks between an input and output field-of-view
(FOV). Here, we present a pyramid-structured diffractive optical network design
(which we term P-D2NN), optimized specifically for unidirectional image
magnification and demagnification. In this P-D2NN design, the diffractive
layers are pyramidally scaled in alignment with the direction of the image
magnification or demagnification. Our analyses revealed the efficacy of this
P-D2NN design in unidirectional image magnification and demagnification tasks,
producing high-fidelity magnified or demagnified images in only one direction,
while inhibiting the image formation in the opposite direction - confirming the
desired unidirectional imaging operation. Compared to the conventional D2NN
designs with uniform-sized successive diffractive layers, P-D2NN design
achieves similar performance in unidirectional magnification tasks using only
half of the diffractive degrees of freedom within the optical processor volume.
Furthermore, it maintains its unidirectional image
magnification/demagnification functionality across a large band of illumination
wavelengths despite being trained with a single illumination wavelength. With
this pyramidal architecture, we also designed a wavelength-multiplexed
diffractive network, where a unidirectional magnifier and a unidirectional
demagnifier operate simultaneously in opposite directions, at two distinct
illumination wavelengths. The efficacy of the P-D2NN architecture was also
validated experimentally using monochromatic terahertz illumination,
successfully matching our numerical simulations. P-D2NN offers a
physics-inspired strategy for designing task-specific visual processors.
- Abstract(参考訳): 拡散型深層ニューラルネットワーク(D2NN)は、教師付き深層学習を用いて最適化され、入力フィールドと出力フィールド・オブ・ビュー(FOV)の間の様々な計算タスクを全光学的に実装する。
本稿では,一方向像拡大とデマグニゼーションに最適化されたピラミッド構造回折光ネットワーク設計(p-d2nn)を提案する。
このP-D2NN設計では、差動層は画像の倍率やデマグニフィケーションの方向に合わせてピラミッド状に拡大される。
本研究は,このp-d2nn設計が,一方向画像の倍率化と縮約作業に有効であることを明らかにし,一方向画像形成を阻害しながら,一方向画像の高忠実度拡大あるいは縮尺画像を生成する。
一様サイズの連続回折層を持つ従来のd2nn設計と比較して、p-d2nn設計は光プロセッサボリューム内の回折自由度の半分しか使わず、一方向拡大タスクで同様の性能を達成する。
さらに、単一の照明波長で訓練されたにもかかわらず、広い波長の照明波長にわたって一方向の像拡大/縮退機能を維持できる。
このピラミッド構造を用いて、波長多重拡散ネットワークを設計し、一方向拡大器と一方向デマジネータを2つの異なる照明波長で同時に動作させた。
また, 単色テラヘルツ照明を用いてP-D2NNアーキテクチャの有効性を実験的に検証し, 数値シミュレーションと一致させた。
P-D2NNは、タスク固有のビジュアルプロセッサを設計するための物理に着想を得た戦略を提供する。
関連論文リスト
- Complex-valued universal linear transformations and image encryption
using spatially incoherent diffractive networks [0.0]
光学プロセッサとして、D2NN(Diffractive Deep Neural Network)は、機械学習によって設計された回折曲面を用いて、全光学情報処理を行う。
空間的に非コヒーレントな微分視覚プロセッサは、複雑な値の線形変換を近似し、非コヒーレント照明を用いた全光画像暗号化に使用できることを示す。
論文 参考訳(メタデータ) (2023-10-05T08:43:59Z) - 2-D SSM: A General Spatial Layer for Visual Transformers [79.4957965474334]
コンピュータビジョンの中心的な目的は、適切な2次元帰納バイアスを持つモデルを設計することである。
多次元状態空間モデルの表現的変動を利用する。
本稿では,効率的なパラメータ化,高速化計算,適切な正規化方式を提案する。
論文 参考訳(メタデータ) (2023-06-11T09:41:37Z) - Unidirectional Imaging using Deep Learning-Designed Materials [13.048762595058058]
一方向撮像器は、入力フィールドオブビュー(FOV)Aから出力FOVB、及び逆経路における画像形成のみを許容する。
本稿では、線形で等方的な連続的な拡散層に基づく偏光非感性・ブロードバンド一方向イメージングによる一方向イメージの最初の実演を報告する。
これらの拡散層は深層学習を用いて最適化され、数十万の回折位相特徴で構成され、入力の強度画像を出力FOVに投影し、画像形成をブロックする。
論文 参考訳(メタデータ) (2022-12-05T04:43:03Z) - Massively Parallel Universal Linear Transformations using a
Wavelength-Multiplexed Diffractive Optical Network [8.992945252617707]
大規模並列ブロードバンド回折ニューラルネットワークのディープラーニングに基づく設計で、大規模な変換を全光学的に実行する。
非常に並列で波長多重の回折ネットワークは、高スループットのインテリジェントマシンビジョンシステムの設計に有用である。
論文 参考訳(メタデータ) (2022-08-13T07:59:39Z) - All-optical graph representation learning using integrated diffractive
photonic computing units [51.15389025760809]
フォトニックニューラルネットワークは、電子の代わりに光子を用いて脳にインスパイアされた計算を行う。
我々は、DGNN(diffractive graph neural network)と呼ばれる全光グラフ表現学習アーキテクチャを提案する。
ベンチマークデータベースを用いたノードおよびグラフレベルの分類タスクにおけるDGNN抽出機能の利用を実演し、優れた性能を実現する。
論文 参考訳(メタデータ) (2022-04-23T02:29:48Z) - Disentangling Light Fields for Super-Resolution and Disparity Estimation [67.50796924758221]
光フィールド(LF)カメラは光線の強度と方向の両方を記録し、3Dシーンを4DLF画像にエンコードする。
空間的・角的な情報は様々な相違で高度に絡み合っているため、畳み込みニューラルネットワーク(CNN)がLF画像を処理することは困難である。
本稿では,この結合した情報をLF画像処理のために切り離すための汎用メカニズムを提案する。
論文 参考訳(メタデータ) (2022-02-22T01:04:41Z) - High-Resolution Optical Flow from 1D Attention and Correlation [89.61824964952949]
計算量を大幅に削減した高分解能光フロー推定法を提案する。
まず、対象画像の垂直方向の1Dアテンション操作を行い、その後、参加者画像の水平方向の単純な1D相関を行う。
Sintel,KITTIおよび実世界の4K解像度画像を用いた実験により,提案手法の有効性と優位性を示した。
論文 参考訳(メタデータ) (2021-04-28T17:56:34Z) - Leveraging Spatial and Photometric Context for Calibrated Non-Lambertian
Photometric Stereo [61.6260594326246]
空間と測光の両方を同時に活用できる効率的な完全畳み込みアーキテクチャを提案する。
分離可能な4D畳み込みと2D熱マップを使うことで、サイズが小さくなり、効率が向上する。
論文 参考訳(メタデータ) (2021-03-22T18:06:58Z) - Learning Inter- and Intra-frame Representations for Non-Lambertian
Photometric Stereo [14.5172791293107]
2段階の畳み込みニューラルネットワーク(CNN)アーキテクチャを構築し、フレーム間およびフレーム内表現を構築します。
フレーム間およびフレーム間特徴抽出モジュールを配置する最適スキームを特定するために,ネットワーク設計の代替案を多数検討した。
論文 参考訳(メタデータ) (2020-12-26T11:22:56Z) - Deep learning-based virtual refocusing of images using an engineered
point-spread function [1.2977570993112095]
カスケードニューラルネットワークとDH-PSF(Double-helix point-spread function)によって実現された拡張深度フィールド(DOF)上の仮想画像再焦点法を提案する。
蛍光顕微鏡のDOFを20倍に拡張します。
論文 参考訳(メタデータ) (2020-12-22T09:15:26Z) - Higher-dimensional Hong-Ou-Mandel effect and state redistribution with
linear-optical multiports [68.8204255655161]
2光子を持つHong-Ou-Mandel(HOM)効果を高次元空間モードに拡張する。
線形光学式4ポートを用いて、これらのモードに対して制御可能な量子状態の再分配を可能にする効果を導入する。
論文 参考訳(メタデータ) (2020-12-16T04:50:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。