論文の概要: Pyramid diffractive optical networks for unidirectional image magnification and demagnification
- arxiv url: http://arxiv.org/abs/2308.15019v2
- Date: Wed, 31 Jul 2024 18:57:49 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-02 14:55:39.177575
- Title: Pyramid diffractive optical networks for unidirectional image magnification and demagnification
- Title(参考訳): 一方向画像倍率・デマグニフィケーションのためのピラミッド回折光ネットワーク
- Authors: Bijie Bai, Xilin Yang, Tianyi Gan, Jingxi Li, Deniz Mengu, Mona Jarrahi, Aydogan Ozcan,
- Abstract要約: ピラミッド構造を有する回折光ネットワークの設計法(P-D2NN)を提案する。
P-D2NNの設計は、一方の方向だけに高忠実度またはデマジネーションされた画像を生成し、他方の方向における画像形成を阻害する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diffractive deep neural networks (D2NNs) are composed of successive transmissive layers optimized using supervised deep learning to all-optically implement various computational tasks between an input and output field-of-view (FOV). Here, we present a pyramid-structured diffractive optical network design (which we term P-D2NN), optimized specifically for unidirectional image magnification and demagnification. In this design, the diffractive layers are pyramidally scaled in alignment with the direction of the image magnification or demagnification. This P-D2NN design creates high-fidelity magnified or demagnified images in only one direction, while inhibiting the image formation in the opposite direction - achieving the desired unidirectional imaging operation using a much smaller number of diffractive degrees of freedom within the optical processor volume. Furthermore, P-D2NN design maintains its unidirectional image magnification/demagnification functionality across a large band of illumination wavelengths despite being trained with a single wavelength. We also designed a wavelength-multiplexed P-D2NN, where a unidirectional magnifier and a unidirectional demagnifier operate simultaneously in opposite directions, at two distinct illumination wavelengths. Furthermore, we demonstrate that by cascading multiple unidirectional P-D2NN modules, we can achieve higher magnification factors. The efficacy of the P-D2NN architecture was also validated experimentally using terahertz illumination, successfully matching our numerical simulations. P-D2NN offers a physics-inspired strategy for designing task-specific visual processors.
- Abstract(参考訳): D2NN(Diffractive Deep Neural Network)は、教師付きディープラーニングを用いて最適化された連続的な透過層で構成され、入力フィールドと出力フィールド・オブ・ビュー(FOV)の間の様々な計算タスクを全光学的に実装する。
本稿では、一方向画像の倍率化とデマジニフィケーションに特化して最適化されたピラミッド構造型回折光ネットワーク設計(P-D2NN)を提案する。
この設計では、回折層は、画像倍率またはデマグニフィケーションの方向に沿ってピラミッド的にスケールする。
本発明のP-D2NN設計は、光学プロセッサボリューム内の回折自由度をはるかに少なくして、所望の一方向撮像動作を達成し、一方の方向のみに高忠実で拡大またはデマジネーションされた画像を生成する。
さらに、P-D2NNの設計では、単一波長でトレーニングされているにもかかわらず、大きな波長帯にわたる一方向画像倍率/デマグニフィケーション機能を維持している。
また、波長多重化P-D2NNを設計し、一方向の拡大器と一方向のデマジネータを2つの異なる照明波長で同時に動作させた。
さらに,複数の一方向P-D2NNモジュールをカスケードすることで,高い倍率係数が得られることを示す。
テラヘルツ照明を用いてP-D2NNアーキテクチャの有効性を実験的に検証し,数値シミュレーションの整合性を確認した。
P-D2NNは、タスク固有のビジュアルプロセッサを設計するための物理に着想を得た戦略を提供する。
関連論文リスト
- Complex-valued universal linear transformations and image encryption
using spatially incoherent diffractive networks [0.0]
光学プロセッサとして、D2NN(Diffractive Deep Neural Network)は、機械学習によって設計された回折曲面を用いて、全光学情報処理を行う。
空間的に非コヒーレントな微分視覚プロセッサは、複雑な値の線形変換を近似し、非コヒーレント照明を用いた全光画像暗号化に使用できることを示す。
論文 参考訳(メタデータ) (2023-10-05T08:43:59Z) - 2-D SSM: A General Spatial Layer for Visual Transformers [79.4957965474334]
コンピュータビジョンの中心的な目的は、適切な2次元帰納バイアスを持つモデルを設計することである。
多次元状態空間モデルの表現的変動を利用する。
本稿では,効率的なパラメータ化,高速化計算,適切な正規化方式を提案する。
論文 参考訳(メタデータ) (2023-06-11T09:41:37Z) - Unidirectional Imaging using Deep Learning-Designed Materials [13.048762595058058]
一方向撮像器は、入力フィールドオブビュー(FOV)Aから出力FOVB、及び逆経路における画像形成のみを許容する。
本稿では、線形で等方的な連続的な拡散層に基づく偏光非感性・ブロードバンド一方向イメージングによる一方向イメージの最初の実演を報告する。
これらの拡散層は深層学習を用いて最適化され、数十万の回折位相特徴で構成され、入力の強度画像を出力FOVに投影し、画像形成をブロックする。
論文 参考訳(メタデータ) (2022-12-05T04:43:03Z) - Massively Parallel Universal Linear Transformations using a
Wavelength-Multiplexed Diffractive Optical Network [8.992945252617707]
大規模並列ブロードバンド回折ニューラルネットワークのディープラーニングに基づく設計で、大規模な変換を全光学的に実行する。
非常に並列で波長多重の回折ネットワークは、高スループットのインテリジェントマシンビジョンシステムの設計に有用である。
論文 参考訳(メタデータ) (2022-08-13T07:59:39Z) - All-optical graph representation learning using integrated diffractive
photonic computing units [51.15389025760809]
フォトニックニューラルネットワークは、電子の代わりに光子を用いて脳にインスパイアされた計算を行う。
我々は、DGNN(diffractive graph neural network)と呼ばれる全光グラフ表現学習アーキテクチャを提案する。
ベンチマークデータベースを用いたノードおよびグラフレベルの分類タスクにおけるDGNN抽出機能の利用を実演し、優れた性能を実現する。
論文 参考訳(メタデータ) (2022-04-23T02:29:48Z) - Disentangling Light Fields for Super-Resolution and Disparity Estimation [67.50796924758221]
光フィールド(LF)カメラは光線の強度と方向の両方を記録し、3Dシーンを4DLF画像にエンコードする。
空間的・角的な情報は様々な相違で高度に絡み合っているため、畳み込みニューラルネットワーク(CNN)がLF画像を処理することは困難である。
本稿では,この結合した情報をLF画像処理のために切り離すための汎用メカニズムを提案する。
論文 参考訳(メタデータ) (2022-02-22T01:04:41Z) - High-Resolution Optical Flow from 1D Attention and Correlation [89.61824964952949]
計算量を大幅に削減した高分解能光フロー推定法を提案する。
まず、対象画像の垂直方向の1Dアテンション操作を行い、その後、参加者画像の水平方向の単純な1D相関を行う。
Sintel,KITTIおよび実世界の4K解像度画像を用いた実験により,提案手法の有効性と優位性を示した。
論文 参考訳(メタデータ) (2021-04-28T17:56:34Z) - Leveraging Spatial and Photometric Context for Calibrated Non-Lambertian
Photometric Stereo [61.6260594326246]
空間と測光の両方を同時に活用できる効率的な完全畳み込みアーキテクチャを提案する。
分離可能な4D畳み込みと2D熱マップを使うことで、サイズが小さくなり、効率が向上する。
論文 参考訳(メタデータ) (2021-03-22T18:06:58Z) - Learning Inter- and Intra-frame Representations for Non-Lambertian
Photometric Stereo [14.5172791293107]
2段階の畳み込みニューラルネットワーク(CNN)アーキテクチャを構築し、フレーム間およびフレーム内表現を構築します。
フレーム間およびフレーム間特徴抽出モジュールを配置する最適スキームを特定するために,ネットワーク設計の代替案を多数検討した。
論文 参考訳(メタデータ) (2020-12-26T11:22:56Z) - Deep learning-based virtual refocusing of images using an engineered
point-spread function [1.2977570993112095]
カスケードニューラルネットワークとDH-PSF(Double-helix point-spread function)によって実現された拡張深度フィールド(DOF)上の仮想画像再焦点法を提案する。
蛍光顕微鏡のDOFを20倍に拡張します。
論文 参考訳(メタデータ) (2020-12-22T09:15:26Z) - Higher-dimensional Hong-Ou-Mandel effect and state redistribution with
linear-optical multiports [68.8204255655161]
2光子を持つHong-Ou-Mandel(HOM)効果を高次元空間モードに拡張する。
線形光学式4ポートを用いて、これらのモードに対して制御可能な量子状態の再分配を可能にする効果を導入する。
論文 参考訳(メタデータ) (2020-12-16T04:50:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。