論文の概要: CodedStereo: Learned Phase Masks for Large Depth-of-field Stereo
- arxiv url: http://arxiv.org/abs/2104.04641v1
- Date: Fri, 9 Apr 2021 23:44:52 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-13 13:47:09.641283
- Title: CodedStereo: Learned Phase Masks for Large Depth-of-field Stereo
- Title(参考訳): codedstereo: 大きなフィールドステレオのための学習位相マスク
- Authors: Shiyu Tan, Yicheng Wu, Shoou-I Yu, Ashok Veeraraghavan
- Abstract要約: 従来のステレオは、画像量と信号対雑音比の基本的なトレードオフに悩まされている。
本稿では,この制限を克服する新たなエンドツーエンド学習手法を提案する。
シミュレーションで画像化できる体積の6倍の増加を示します。
- 参考スコア(独自算出の注目度): 24.193656749401075
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Conventional stereo suffers from a fundamental trade-off between imaging
volume and signal-to-noise ratio (SNR) -- due to the conflicting impact of
aperture size on both these variables. Inspired by the extended depth of field
cameras, we propose a novel end-to-end learning-based technique to overcome
this limitation, by introducing a phase mask at the aperture plane of the
cameras in a stereo imaging system. The phase mask creates a depth-dependent
point spread function, allowing us to recover sharp image texture and stereo
correspondence over a significantly extended depth of field (EDOF) than
conventional stereo. The phase mask pattern, the EDOF image reconstruction, and
the stereo disparity estimation are all trained together using an end-to-end
learned deep neural network. We perform theoretical analysis and
characterization of the proposed approach and show a 6x increase in volume that
can be imaged in simulation. We also build an experimental prototype and
validate the approach using real-world results acquired using this prototype
system.
- Abstract(参考訳): 従来のステレオは、画像ボリュームとsnr(signal-to-noise ratio)との根本的なトレードオフに苦しんでいる。
フィールドカメラの奥行きに着想を得て,ステレオイメージングシステムにおいて,カメラの開口面に位相マスクを導入することにより,この制限を克服する新たなエンドツーエンド学習手法を提案する。
位相マスクは深度依存のポイントスプレッド関数を生成し、従来のステレオよりもシャープな画像テクスチャとステレオ対応をかなり拡張した視野深度(edof)で復元できる。
位相マスクパターン、edof画像再構成、ステレオ不一致推定は全て、エンドツーエンドの学習深層ニューラルネットワークを用いて訓練される。
提案手法の理論的解析と特性評価を行い,シミュレーションで画像化できる体積の6倍の増大を示す。
また,このプロトタイプシステムを用いて得られた実世界結果を用いて,実験的なプロトタイプを構築し,そのアプローチを検証する。
関連論文リスト
- Adaptive Stereo Depth Estimation with Multi-Spectral Images Across All Lighting Conditions [58.88917836512819]
本稿では,立体深度推定を取り入れた新しいフレームワークを提案し,正確な幾何学的制約を強制する。
照明の劣化がステレオマッチングに与える影響を軽減するために,劣化マスキングを導入する。
提案手法は,Multi-Spectral Stereo(MS2)データセット上でのSOTA(State-of-the-art)性能を実現する。
論文 参考訳(メタデータ) (2024-11-06T03:30:46Z) - Pixel-Aligned Multi-View Generation with Depth Guided Decoder [86.1813201212539]
画素レベルの画像・マルチビュー生成のための新しい手法を提案する。
従来の作業とは異なり、潜伏映像拡散モデルのVAEデコーダにマルチビュー画像にアテンション層を組み込む。
本モデルにより,マルチビュー画像間の画素アライメントが向上する。
論文 参考訳(メタデータ) (2024-08-26T04:56:41Z) - Stereo-Depth Fusion through Virtual Pattern Projection [37.519762078762575]
本稿では,新しい汎用ステレオ・ディープデータ融合パラダイムを提案する。
これは、信頼できない物理パターンプロジェクターを奥行きセンサーに置き換えることで、アクティブなステレオ原理を模倣する。
従来のステレオカメラで取得した左右の画像に、シーン形状と整合した仮想パターンを投影する。
論文 参考訳(メタデータ) (2024-06-06T17:59:58Z) - Aperture Diffraction for Compact Snapshot Spectral Imaging [27.321750056840706]
我々は、Aperture Diffraction Imaging Spectrometer (ADIS) という、コンパクトで費用効率の良いスナップショット分光画像システムを紹介した。
モザイクフィルタセンサ上の離散符号化位置にオブジェクト空間の各点を多重化する新しい光学設計を導入する。
回折変性を強く知覚するカスケードシフトシャッフルスペクトル変換器(CSST)は、空間制約の逆問題を解決するために設計されている。
論文 参考訳(メタデータ) (2023-09-27T16:48:46Z) - S^2-Transformer for Mask-Aware Hyperspectral Image Reconstruction [48.83280067393851]
代表的ハイパースペクトル画像取得手順は、符号化開口分光画像センサ(CASSI)による3D-to-2D符号化を行う
i) 2次元計測を得るために、CASSIは分散器タイトリングにより複数のチャネルを分散させ、それらを同じ空間領域に絞り込み、絡み合ったデータ損失をもたらす。
本稿では,これらの課題に対処するためのマスク対応学習戦略を備えた空間スペクトル(S2-)トランスフォーマーアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-09-24T19:26:46Z) - End-to-end Learning for Joint Depth and Image Reconstruction from
Diffracted Rotation [10.896567381206715]
回折回転から深度を学習する新しいエンド・ツー・エンド学習手法を提案する。
提案手法は, 単分子深度推定のタスクにおいて既存の手法よりもはるかに少ない複雑なモデルと少ないトレーニングデータを必要とする。
論文 参考訳(メタデータ) (2022-04-14T16:14:37Z) - Neural Radiance Fields Approach to Deep Multi-View Photometric Stereo [103.08512487830669]
多視点測光ステレオ問題(MVPS)に対する現代的な解法を提案する。
我々は、光度ステレオ(PS)画像形成モデルを用いて表面配向を取得し、それを多視点のニューラルラディアンス場表現とブレンドして物体の表面形状を復元する。
本手法は,多視点画像のニューラルレンダリングを行い,深部光度ステレオネットワークによって推定される表面の正規性を活用している。
論文 参考訳(メタデータ) (2021-10-11T20:20:03Z) - Polka Lines: Learning Structured Illumination and Reconstruction for
Active Stereo [52.68109922159688]
本稿では,波動光学と幾何光学の両方に依存した,アクティブステレオのための新しい微分可能な画像形成モデルと,新しい三眼再構成ネットワークを提案する。
Polka Lines" を再現ネットワークと組み合わせた共同最適化パターンは, 撮像条件全体にわたって, 最先端のアクティブステレオ深度推定を達成している。
論文 参考訳(メタデータ) (2020-11-26T04:02:43Z) - Du$^2$Net: Learning Depth Estimation from Dual-Cameras and Dual-Pixels [16.797169907541164]
本稿では,デュアルカメラのステレオとデュアルピクセルセンサのステレオを組み合わせた深度推定のためのニューラルネットワークに基づく新しいアプローチを提案する。
我々のネットワークは、2つの情報ソースを融合するために新しいアーキテクチャを使用し、純粋な双眼鏡ステレオマッチングの限界を克服することができる。
論文 参考訳(メタデータ) (2020-03-31T15:39:43Z) - Deep 3D Capture: Geometry and Reflectance from Sparse Multi-View Images [59.906948203578544]
本稿では,任意の物体の高品質な形状と複雑な空間変化を持つBRDFを再構成する学習に基づく新しい手法を提案する。
まず、深層多視点ステレオネットワークを用いて、ビューごとの深度マップを推定する。
これらの深度マップは、異なるビューを粗く整列するために使用される。
本稿では,新しい多視点反射率推定ネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-03-27T21:28:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。