論文の概要: Practical Stereo Matching via Cascaded Recurrent Network with Adaptive
Correlation
- arxiv url: http://arxiv.org/abs/2203.11483v1
- Date: Tue, 22 Mar 2022 06:20:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-23 13:55:21.840391
- Title: Practical Stereo Matching via Cascaded Recurrent Network with Adaptive
Correlation
- Title(参考訳): 適応相関を考慮したカスケードリカレントネットワークによる実用的なステレオマッチング
- Authors: Jiankun Li, Peisen Wang, Pengfei Xiong, Tao Cai, Ziwei Yan, Lei Yang,
Jiangyu Liu, Haoqiang Fan, Shuaicheng Liu
- Abstract要約: 本稿では,実用的なステレオマッチングの問題に対処する革新的な設計法を提案する。
この結果は、MiddleburyベンチマークとETH3Dベンチマークの両方で1位にランクされている。
- 参考スコア(独自算出の注目度): 27.58146853633412
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the advent of convolutional neural networks, stereo matching algorithms
have recently gained tremendous progress. However, it remains a great challenge
to accurately extract disparities from real-world image pairs taken by
consumer-level devices like smartphones, due to practical complicating factors
such as thin structures, non-ideal rectification, camera module inconsistencies
and various hard-case scenes. In this paper, we propose a set of innovative
designs to tackle the problem of practical stereo matching: 1) to better
recover fine depth details, we design a hierarchical network with recurrent
refinement to update disparities in a coarse-to-fine manner, as well as a
stacked cascaded architecture for inference; 2) we propose an adaptive group
correlation layer to mitigate the impact of erroneous rectification; 3) we
introduce a new synthetic dataset with special attention to difficult cases for
better generalizing to real-world scenes. Our results not only rank 1st on both
Middlebury and ETH3D benchmarks, outperforming existing state-of-the-art
methods by a notable margin, but also exhibit high-quality details for
real-life photos, which clearly demonstrates the efficacy of our contributions.
- Abstract(参考訳): 畳み込みニューラルネットワークの出現により、ステレオマッチングアルゴリズムは近年、大きな進歩を遂げている。
しかし、細い構造、非理想的整合性、カメラモジュールの不整合、さまざまなハードケースシーンなど、現実的な複雑な要素のために、スマートフォンのようなコンシューマレベルのデバイスから、現実のイメージペアを正確に抽出することは依然として大きな課題である。
本稿では,実用的なステレオマッチングの問題に対処する革新的な設計法を提案する。
1) より詳細な詳細を回復するために, 粗大な方法で不一致を更新する再帰的な改良を施した階層型ネットワークを設計し, 推論のためのカスケードアーキテクチャを積み重ねた。
2) 誤算の影響を軽減するために, 適応群相関層を提案する。
3) 現実のシーンをより一般化するために, 難解ケースに特に注目する新しい合成データセットを導入する。
私たちの結果は、MiddleburyベンチマークとETH3Dベンチマークの両方で第1位にランクされ、既存の最先端の手法よりも顕著なマージンで優れています。
関連論文リスト
- Hybrid-Supervised Dual-Search: Leveraging Automatic Learning for
Loss-free Multi-Exposure Image Fusion [60.221404321514086]
マルチ露光画像融合(MEF)は、様々な露光レベルを表すデジタルイメージングの限界に対処するための重要な解決策である。
本稿では、ネットワーク構造と損失関数の両方を自動設計するための二段階最適化探索方式であるHSDS-MEFと呼ばれるMEFのためのハイブリッドスーパービジョンデュアルサーチ手法を提案する。
論文 参考訳(メタデータ) (2023-09-03T08:07:26Z) - Mutual Information-driven Triple Interaction Network for Efficient Image
Dehazing [54.168567276280505]
画像デハージングのための相互情報駆動型トリプルインタラクションネットワーク(MITNet)を提案する。
振幅誘導ヘイズ除去と呼ばれる第1段階は、ヘイズ除去のためのヘイズ画像の振幅スペクトルを復元することを目的としている。
第2段階は位相誘導構造が洗練され、位相スペクトルの変換と微細化を学ぶことに尽力した。
論文 参考訳(メタデータ) (2023-08-14T08:23:58Z) - Multi-scale Alternated Attention Transformer for Generalized Stereo
Matching [7.493797166406228]
両視野および単一視野におけるエピポーラ線の影響のバランスをとるために,Alternated Attention U-shaped Transformer (AAUformer) と呼ばれる簡易かつ高効率なネットワークを提案する。
他のモデルと比較して、我々のモデルはいくつかの主要な設計を持っている。
我々はいくつかの主流ステレオマッチングデータセットについて比較研究とアブレーション研究を行った。
論文 参考訳(メタデータ) (2023-08-06T08:22:39Z) - CroCo v2: Improved Cross-view Completion Pre-training for Stereo
Matching and Optical Flow [22.161967080759993]
自己教師付き事前学習法は、ステレオマッチングや光学フローのような密集した幾何学的視覚タスクでは、まだ提供されていない。
我々は、同じシーンから2番目のビューを利用するマスク付き画像モデリングのバリエーションである、最近のクロスビュー補完フレームワークの上に構築する。
本稿では,ステレオマッチングと光学的流れに関する最先端の成果を,従来のタスク固有の手法を使わずに到達できることを初めて示す。
論文 参考訳(メタデータ) (2022-11-18T18:18:53Z) - Unifying Flow, Stereo and Depth Estimation [121.54066319299261]
本稿では3つの動作と3次元知覚タスクのための統一的な定式化とモデルを提案する。
これら3つのタスクを、統一された高密度対応マッチング問題として定式化する。
我々のモデルは、モデルアーキテクチャとパラメータがタスク間で共有されているため、自然にクロスタスク転送を可能にします。
論文 参考訳(メタデータ) (2022-11-10T18:59:54Z) - Robust Single Image Dehazing Based on Consistent and Contrast-Assisted
Reconstruction [95.5735805072852]
画像復調モデルのロバスト性を改善するための新しい密度変分学習フレームワークを提案する。
具体的には、デハジングネットワークは、一貫性の規則化されたフレームワークの下で最適化されている。
我々の手法は最先端のアプローチを大きく上回っている。
論文 参考訳(メタデータ) (2022-03-29T08:11:04Z) - SMD-Nets: Stereo Mixture Density Networks [68.56947049719936]
SMD-Nets(Stereo Mixture Density Networks)は、幅広い2Dおよび3Dアーキテクチャに対応したシンプルで効果的な学習フレームワークです。
具体的には,バイモーダル混合密度を出力表現として活用し,不連続近傍の鋭く正確な不一致推定を可能にすることを示す。
我々は8Mpx解像度のステレオペアと現実世界のステレオデータセットからなる、新しい高解像度でリアルな合成ステレオデータセットに関する包括的な実験を行う。
論文 参考訳(メタデータ) (2021-04-08T16:15:46Z) - Identity Enhanced Residual Image Denoising [61.75610647978973]
我々は、アイデンティティマッピングモジュールのチェーンと、画像の復号化のための残像アーキテクチャの残像からなる、完全な畳み込みネットワークモデルを学ぶ。
提案するネットワークは,従来の最先端・CNNアルゴリズムよりも極めて高い数値精度と画像品質を実現している。
論文 参考訳(メタデータ) (2020-04-26T04:52:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。