論文の概要: Snapshot 3D image projection using a diffractive decoder
- arxiv url: http://arxiv.org/abs/2512.20464v1
- Date: Tue, 23 Dec 2025 15:57:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-24 19:17:49.929732
- Title: Snapshot 3D image projection using a diffractive decoder
- Title(参考訳): 差動デコーダを用いたスナップショット3次元画像投影
- Authors: Cagatay Isil, Alexander Chen, Yuhang Li, F. Onuralp Ardic, Shiqi Chen, Che-Yung Shen, Aydogan Ozcan,
- Abstract要約: 本稿では,デジタルエンコーダと光デコーダを組み合わせた3次元表示システムを提案する。
高忠実度深度分解された3次元画像投影をスナップショットで達成する。
これらの結果は、深度分解されたスナップショット3D画像投影のためのコンパクトでスケーラブルなフレームワークとして、拡散型3D表示システムを確立する。
- 参考スコア(独自算出の注目度): 48.1381547559672
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: 3D image display is essential for next-generation volumetric imaging; however, dense depth multiplexing for 3D image projection remains challenging because diffraction-induced cross-talk rapidly increases as the axial image planes get closer. Here, we introduce a 3D display system comprising a digital encoder and a diffractive optical decoder, which simultaneously projects different images onto multiple target axial planes with high axial resolution. By leveraging multi-layer diffractive wavefront decoding and deep learning-based end-to-end optimization, the system achieves high-fidelity depth-resolved 3D image projection in a snapshot, enabling axial plane separations on the order of a wavelength. The digital encoder leverages a Fourier encoder network to capture multi-scale spatial and frequency-domain features from input images, integrates axial position encoding, and generates a unified phase representation that simultaneously encodes all images to be axially projected in a single snapshot through a jointly-optimized diffractive decoder. We characterized the impact of diffractive decoder depth, output diffraction efficiency, spatial light modulator resolution, and axial encoding density, revealing trade-offs that govern axial separation and 3D image projection quality. We further demonstrated the capability to display volumetric images containing 28 axial slices, as well as the ability to dynamically reconfigure the axial locations of the image planes, performed on demand. Finally, we experimentally validated the presented approach, demonstrating close agreement between the measured results and the target images. These results establish the diffractive 3D display system as a compact and scalable framework for depth-resolved snapshot 3D image projection, with potential applications in holographic displays, AR/VR interfaces, and volumetric optical computing.
- Abstract(参考訳): 次世代のボリューム画像には3次元画像表示が不可欠であるが, 回折によるクロストークが急速に増加し, 軸方向の画像面が近づきつつあるため, 3次元画像投影の深度多重化は依然として困難である。
本稿では,デジタルエンコーダと回折光デコーダを組み合わせた3次元表示システムを提案する。
多層回折波面デコーディングと深層学習に基づくエンドツーエンドの最適化を利用して、高忠実度深度分解された3次元画像投影をスナップショットで達成し、波長の順に軸方向の平面分離を可能にする。
デジタルエンコーダは、フーリエエンコーダネットワークを利用して、入力画像から複数スケールの空間及び周波数領域の特徴をキャプチャし、軸位置符号化を統合し、共同最適化された微分復号器を介して、単一のスナップショットで軸方向に投影されるすべての画像を同時に符号化する統一位相表現を生成する。
本研究では, 回折デコーダ深さ, 出力回折効率, 空間光変調器分解能, 軸符号化密度の影響を特徴とし, 軸分離と3次元画像投影品質のトレードオフを明らかにした。
さらに,28個の軸スライスを含む容積画像を表示できること,および要求に応じて画像平面の軸位置を動的に再構成できることを実証した。
最後に,提案手法を実験的に検証し,測定結果と対象画像との密接な一致を実証した。
これらの結果は、ホログラフィックディスプレイ、AR/VRインターフェース、および体積光学コンピューティングに応用可能な、深度分解されたスナップショット3D画像投影のためのコンパクトでスケーラブルなフレームワークとして、微分3Dディスプレイシステムを確立している。
関連論文リスト
- FreqPDE: Rethinking Positional Depth Embedding for Multi-View 3D Object Detection Transformers [91.59069344768858]
周波数対応位置深度埋め込み (FreqPDE) を導入し, 空間情報と2次元画像特徴を付加して3次元検出変換器デコーダを提案する。
FreqPDEは2D画像特徴と3D位置埋め込みを組み合わせることで、クエリデコーディングのための3D深度認識機能を生成する。
論文 参考訳(メタデータ) (2025-10-17T07:36:54Z) - Super-resolution image projection over an extended depth of field using a diffractive decoder [0.0]
ハイブリット・イメージ・プロジェクション・システムは、解像度を改善した拡張フィールド・オブ・フィールドを実現する。
システムは畳み込みニューラルネットワーク(CNN)ベースのデジタルエンコーダと全光回折デコーダを組み合わせる。
画素超解像(PSR)画像投影システムは,267xWの拡張DOF上での高忠実度画像合成を実証する。
論文 参考訳(メタデータ) (2025-10-04T20:42:57Z) - PointVDP: Learning View-Dependent Projection by Fireworks Rays for 3D Point Cloud Segmentation [66.00721801098574]
本稿では,ポイントクラウドのセグメンテーションを容易にするために,ビュー依存プロジェクション(VDP)を提案する。
VDPは3Dポイント分布からデータ駆動プロジェクションを生成する。
フレームワークを最適化するために色規則化を構築します。
論文 参考訳(メタデータ) (2025-07-09T07:44:00Z) - Stereo Image Coding for Machines with Joint Visual Feature Compression [69.28382442498408]
本稿では,機械用ステレオ画像符号化(SICM)について述べる。
SICMには,機械ビジョン指向ステレオ特徴圧縮ネットワーク (MVSFC-Net) が提案されている。
提案したMVSFC-Netは,3次元視覚タスクの性能だけでなく,圧縮効率も優れている。
論文 参考訳(メタデータ) (2025-02-20T01:46:17Z) - Direct and Explicit 3D Generation from a Single Image [25.207277983430608]
マルチビュー2次元深度画像とRGB画像を用いて表面形状とテクスチャを直接生成する新しいフレームワークを提案する。
画素レベルの多視点整合性を実現するために,エピポーラの注意を潜時から画素間デコーダに組み込む。
生成した深度画素を3次元空間にバックプロジェクションすることにより、構造化された3次元表現を生成する。
論文 参考訳(メタデータ) (2024-11-17T03:14:50Z) - GEOcc: Geometrically Enhanced 3D Occupancy Network with Implicit-Explicit Depth Fusion and Contextual Self-Supervision [49.839374549646884]
本稿では,視覚のみのサラウンドビュー知覚に適したジオメトリ強化OccupancyネットワークであるGEOccについて述べる。
提案手法は,Occ3D-nuScenesデータセット上で,画像解像度が最小で,画像バックボーンが最大である状態-Of-The-Art性能を実現する。
論文 参考訳(メタデータ) (2024-05-17T07:31:20Z) - Super-resolution image display using diffractive decoders [21.24387597787123]
大きな視野(FOV)上の画像の高分解能合成・投影は、波面変調器の制限された空間帯域積(SBP)によって妨げられる。
本稿では,電子エンコーダと光デコーダを併用した深層学習型回折ディスプレイの設計について報告する。
以上の結果から,この回折画像表示はSBPの16倍の増加を示す4の超解像係数を達成できることが示唆された。
論文 参考訳(メタデータ) (2022-06-15T03:42:36Z) - A New Comprehensive Framework for Multi-Exposure Stereo Coding Utilizing Low Rank Tucker-ALS and 3D-HEVC Techniques [5.6721325104114655]
テンソル低ランク近似に基づくマルチ露光ステレオ画像の効率的な符号化法を提案する。
マルチ露光融合によりデコーダのHDRステレオ出力が生成され、リアリズムと両眼3D深度が向上する。
3D-HEVCを用いた符号化により、フレーム内、ビュー間、および低ランク近似表現におけるコンポーネント間冗長性を活用することにより、提案したスキーム効率が向上する。
論文 参考訳(メタデータ) (2021-04-10T10:10:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。