論文の概要: Context-Enhanced Stereo Transformer
- arxiv url: http://arxiv.org/abs/2210.11719v1
- Date: Fri, 21 Oct 2022 04:10:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-24 13:41:45.747801
- Title: Context-Enhanced Stereo Transformer
- Title(参考訳): コンテキスト強化ステレオトランス
- Authors: Weiyu Guo, Zhaoshuo Li, Yongkui Yang, Zheng Wang, Russell H. Taylor,
Mathias Unberath, Alan Yuille, and Yingwei Li
- Abstract要約: ステレオ深度推定モデル Context Enhanced Stereo Transformer (CSTR) を構築した。
CSTRは、Scene Flow、Middlebury-2014、KITTI-2015、MPI-Sintelなどの異なる公開データセットで調査されている。
例えば、ゼロショット合成-現実設定では、CSTRはMiddlebury-2014データセット上で最も競合するアプローチを11%上回っている。
- 参考スコア(独自算出の注目度): 20.11280444217963
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Stereo depth estimation is of great interest for computer vision research.
However, existing methods struggles to generalize and predict reliably in
hazardous regions, such as large uniform regions. To overcome these
limitations, we propose Context Enhanced Path (CEP). CEP improves the
generalization and robustness against common failure cases in existing
solutions by capturing the long-range global information. We construct our
stereo depth estimation model, Context Enhanced Stereo Transformer (CSTR), by
plugging CEP into the state-of-the-art stereo depth estimation method Stereo
Transformer. CSTR is examined on distinct public datasets, such as Scene Flow,
Middlebury-2014, KITTI-2015, and MPI-Sintel. We find CSTR outperforms prior
approaches by a large margin. For example, in the zero-shot synthetic-to-real
setting, CSTR outperforms the best competing approaches on Middlebury-2014
dataset by 11%. Our extensive experiments demonstrate that the long-range
information is critical for stereo matching task and CEP successfully captures
such information.
- Abstract(参考訳): ステレオ深度推定はコンピュータビジョン研究において非常に興味深い。
しかし、既存の手法は、大きな一様領域のような危険地域において確実に一般化し予測することに苦慮している。
これらの制限を克服するために、Context Enhanced Path (CEP)を提案する。
CEPは、長距離グローバル情報をキャプチャすることで、既存のソリューションにおける一般的な障害ケースに対する一般化と堅牢性を改善する。
ステレオ深度推定モデルであるContext Enhanced Stereo Transformer (CSTR) を構築し,CEPを最先端のステレオ深度推定手法であるStereo Transformerに接続する。
CSTRは、Scene Flow、Middlebury-2014、KITTI-2015、MPI-Sintelなどの異なる公開データセットで調査されている。
CSTRは従来のアプローチよりも大きなマージンで優れています。
例えば、ゼロショット合成-現実設定では、CSTRはMiddlebury-2014データセット上で最も競合するアプローチを11%上回っている。
広範囲にわたる実験により, ステレオマッチング作業において, 長距離情報は重要であり, CEPはそのような情報を取り込むことに成功した。
関連論文リスト
- UniTT-Stereo: Unified Training of Transformer for Enhanced Stereo Matching [18.02254687807291]
UniTT-StereoはTransformerベースのステレオアーキテクチャの可能性を最大化する手法である。
UniTT-Stereoの最先端性能は、ETH3D、KITTI 2012、KITTI 2015データセットなどの様々なベンチマークで検証されている。
論文 参考訳(メタデータ) (2024-09-04T09:02:01Z) - Stereo Risk: A Continuous Modeling Approach to Stereo Matching [110.22344879336043]
我々はコンピュータビジョンにおける古典的ステレオマッチング問題を解決するための新しいディープラーニングアプローチであるStereo Riskを紹介する。
ステレオリスクはディープネットワーク,特にマルチモーダル確率分布の相違に対して,ステレオマッチング性能を向上させることを実証する。
総合的な分析により,提案手法の理論的健全性と,各種ベンチマークデータセットにおける最先端手法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2024-07-03T14:30:47Z) - Digging into contrastive learning for robust depth estimation with diffusion models [55.62276027922499]
そこで我々はD4RDと呼ばれる新しい頑健な深度推定法を提案する。
複雑な環境での性能劣化を軽減するために、拡散モデルに適した独自のコントラスト学習モードを備えている。
実験では、D4RDは合成汚職データセットや現実世界の気象条件に関する最先端のソリューションを超越している。
論文 参考訳(メタデータ) (2024-04-15T14:29:47Z) - Depth-aware Volume Attention for Texture-less Stereo Matching [67.46404479356896]
実用的な屋外シナリオにおけるテクスチャ劣化に対処する軽量なボリューム改善手法を提案する。
画像テクスチャの相対的階層を抽出し,地中深度マップによって教師される深度体積を導入する。
局所的な微細構造と文脈は、体積凝集時のあいまいさと冗長性を緩和するために強調される。
論文 参考訳(メタデータ) (2024-02-14T04:07:44Z) - AdaStereo: An Efficient Domain-Adaptive Stereo Matching Approach [50.855679274530615]
本稿では,AdaStereoというドメイン適応型アプローチを提案する。
我々のモデルは、KITTI、Middlebury、ETH3D、DrivingStereoなど、複数のベンチマークで最先端のクロスドメイン性能を実現している。
提案手法は,様々なドメイン適応設定に対して堅牢であり,迅速な適応アプリケーションシナリオや実環境展開に容易に組み込むことができる。
論文 参考訳(メタデータ) (2021-12-09T15:10:47Z) - Generalized Real-World Super-Resolution through Adversarial Robustness [107.02188934602802]
本稿では,実世界のSRに取り組むために,敵攻撃の一般化能力を活用したロバスト超解法を提案する。
我々の新しいフレームワークは、現実世界のSR手法の開発においてパラダイムシフトをもたらす。
単一のロバストモデルを使用することで、実世界のベンチマークで最先端の特殊な手法より優れています。
論文 参考訳(メタデータ) (2021-08-25T22:43:20Z) - H-Net: Unsupervised Attention-based Stereo Depth Estimation Leveraging
Epipolar Geometry [4.968452390132676]
本稿では,教師なしステレオ深度推定のためのディープラーニングフレームワークであるH-Netを紹介する。
初めて、Siameseオートエンコーダアーキテクチャが深さ推定に使用されます。
本手法は,最先端の非監視ステレオ深度推定法を上回っている。
論文 参考訳(メタデータ) (2021-04-22T19:16:35Z) - SMD-Nets: Stereo Mixture Density Networks [68.56947049719936]
SMD-Nets(Stereo Mixture Density Networks)は、幅広い2Dおよび3Dアーキテクチャに対応したシンプルで効果的な学習フレームワークです。
具体的には,バイモーダル混合密度を出力表現として活用し,不連続近傍の鋭く正確な不一致推定を可能にすることを示す。
我々は8Mpx解像度のステレオペアと現実世界のステレオデータセットからなる、新しい高解像度でリアルな合成ステレオデータセットに関する包括的な実験を行う。
論文 参考訳(メタデータ) (2021-04-08T16:15:46Z) - PVStereo: Pyramid Voting Module for End-to-End Self-Supervised Stereo
Matching [14.603116313499648]
本稿では,ピラミッド投票モジュール(PVM)と,OptStereoと呼ばれる新しいDCNNアーキテクチャからなる,堅牢で効果的な自己監督型ステレオマッチング手法を提案する。
具体的には、OptStereoは最初にマルチスケールのコストボリュームを構築し、その後、繰り返し単位を採用し、高分解能で不一致推定を反復的に更新します。
hkust-driveデータセット(大規模な合成ステレオデータセット)を、異なる照明条件と気象条件下で研究目的で収集した。
論文 参考訳(メタデータ) (2021-03-12T05:27:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。