論文の概要: Context-Enhanced Stereo Transformer
- arxiv url: http://arxiv.org/abs/2210.11719v1
- Date: Fri, 21 Oct 2022 04:10:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-24 13:41:45.747801
- Title: Context-Enhanced Stereo Transformer
- Title(参考訳): コンテキスト強化ステレオトランス
- Authors: Weiyu Guo, Zhaoshuo Li, Yongkui Yang, Zheng Wang, Russell H. Taylor,
Mathias Unberath, Alan Yuille, and Yingwei Li
- Abstract要約: ステレオ深度推定モデル Context Enhanced Stereo Transformer (CSTR) を構築した。
CSTRは、Scene Flow、Middlebury-2014、KITTI-2015、MPI-Sintelなどの異なる公開データセットで調査されている。
例えば、ゼロショット合成-現実設定では、CSTRはMiddlebury-2014データセット上で最も競合するアプローチを11%上回っている。
- 参考スコア(独自算出の注目度): 20.11280444217963
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Stereo depth estimation is of great interest for computer vision research.
However, existing methods struggles to generalize and predict reliably in
hazardous regions, such as large uniform regions. To overcome these
limitations, we propose Context Enhanced Path (CEP). CEP improves the
generalization and robustness against common failure cases in existing
solutions by capturing the long-range global information. We construct our
stereo depth estimation model, Context Enhanced Stereo Transformer (CSTR), by
plugging CEP into the state-of-the-art stereo depth estimation method Stereo
Transformer. CSTR is examined on distinct public datasets, such as Scene Flow,
Middlebury-2014, KITTI-2015, and MPI-Sintel. We find CSTR outperforms prior
approaches by a large margin. For example, in the zero-shot synthetic-to-real
setting, CSTR outperforms the best competing approaches on Middlebury-2014
dataset by 11%. Our extensive experiments demonstrate that the long-range
information is critical for stereo matching task and CEP successfully captures
such information.
- Abstract(参考訳): ステレオ深度推定はコンピュータビジョン研究において非常に興味深い。
しかし、既存の手法は、大きな一様領域のような危険地域において確実に一般化し予測することに苦慮している。
これらの制限を克服するために、Context Enhanced Path (CEP)を提案する。
CEPは、長距離グローバル情報をキャプチャすることで、既存のソリューションにおける一般的な障害ケースに対する一般化と堅牢性を改善する。
ステレオ深度推定モデルであるContext Enhanced Stereo Transformer (CSTR) を構築し,CEPを最先端のステレオ深度推定手法であるStereo Transformerに接続する。
CSTRは、Scene Flow、Middlebury-2014、KITTI-2015、MPI-Sintelなどの異なる公開データセットで調査されている。
CSTRは従来のアプローチよりも大きなマージンで優れています。
例えば、ゼロショット合成-現実設定では、CSTRはMiddlebury-2014データセット上で最も競合するアプローチを11%上回っている。
広範囲にわたる実験により, ステレオマッチング作業において, 長距離情報は重要であり, CEPはそのような情報を取り込むことに成功した。
関連論文リスト
- Depth-aware Volume Attention for Texture-less Stereo Matching [67.46404479356896]
実用的な屋外シナリオにおけるテクスチャ劣化に対処する軽量なボリューム改善手法を提案する。
画像テクスチャの相対的階層を抽出し,地中深度マップによって教師される深度体積を導入する。
局所的な微細構造と文脈は、体積凝集時のあいまいさと冗長性を緩和するために強調される。
論文 参考訳(メタデータ) (2024-02-14T04:07:44Z) - Deep Reinforcement Learning Based Joint Downlink Beamforming and RIS
Configuration in RIS-aided MU-MISO Systems Under Hardware Impairments and
Imperfect CSI [0.0]
我々は,光ビームフォーミングと再構成可能なインテリジェントサーフェス(RIS)位相シフトを協調的に最適化する,新しい深部強化学習(DRL)手法を提案する。
提案手法は,現実的なRIS振幅モデルを考慮した不完全チャネル状態情報(CSI)とハードウェア障害の課題に対処する。
論文 参考訳(メタデータ) (2022-10-10T09:37:53Z) - DepthFormer: Exploiting Long-Range Correlation and Local Information for
Accurate Monocular Depth Estimation [50.08080424613603]
高精度な単分子深度推定には長距離相関が不可欠である。
我々は,このグローバルコンテキストを効果的な注意機構でモデル化するためにTransformerを活用することを提案する。
提案したモデルであるDepthFormerは、最先端のモノクル深度推定手法をはるかに超えている。
論文 参考訳(メタデータ) (2022-03-27T05:03:56Z) - AdaStereo: An Efficient Domain-Adaptive Stereo Matching Approach [50.855679274530615]
本稿では,AdaStereoというドメイン適応型アプローチを提案する。
我々のモデルは、KITTI、Middlebury、ETH3D、DrivingStereoなど、複数のベンチマークで最先端のクロスドメイン性能を実現している。
提案手法は,様々なドメイン適応設定に対して堅牢であり,迅速な適応アプリケーションシナリオや実環境展開に容易に組み込むことができる。
論文 参考訳(メタデータ) (2021-12-09T15:10:47Z) - Generalized Real-World Super-Resolution through Adversarial Robustness [107.02188934602802]
本稿では,実世界のSRに取り組むために,敵攻撃の一般化能力を活用したロバスト超解法を提案する。
我々の新しいフレームワークは、現実世界のSR手法の開発においてパラダイムシフトをもたらす。
単一のロバストモデルを使用することで、実世界のベンチマークで最先端の特殊な手法より優れています。
論文 参考訳(メタデータ) (2021-08-25T22:43:20Z) - H-Net: Unsupervised Attention-based Stereo Depth Estimation Leveraging
Epipolar Geometry [4.968452390132676]
本稿では,教師なしステレオ深度推定のためのディープラーニングフレームワークであるH-Netを紹介する。
初めて、Siameseオートエンコーダアーキテクチャが深さ推定に使用されます。
本手法は,最先端の非監視ステレオ深度推定法を上回っている。
論文 参考訳(メタデータ) (2021-04-22T19:16:35Z) - SMD-Nets: Stereo Mixture Density Networks [68.56947049719936]
SMD-Nets(Stereo Mixture Density Networks)は、幅広い2Dおよび3Dアーキテクチャに対応したシンプルで効果的な学習フレームワークです。
具体的には,バイモーダル混合密度を出力表現として活用し,不連続近傍の鋭く正確な不一致推定を可能にすることを示す。
我々は8Mpx解像度のステレオペアと現実世界のステレオデータセットからなる、新しい高解像度でリアルな合成ステレオデータセットに関する包括的な実験を行う。
論文 参考訳(メタデータ) (2021-04-08T16:15:46Z) - PVStereo: Pyramid Voting Module for End-to-End Self-Supervised Stereo
Matching [14.603116313499648]
本稿では,ピラミッド投票モジュール(PVM)と,OptStereoと呼ばれる新しいDCNNアーキテクチャからなる,堅牢で効果的な自己監督型ステレオマッチング手法を提案する。
具体的には、OptStereoは最初にマルチスケールのコストボリュームを構築し、その後、繰り返し単位を採用し、高分解能で不一致推定を反復的に更新します。
hkust-driveデータセット(大規模な合成ステレオデータセット)を、異なる照明条件と気象条件下で研究目的で収集した。
論文 参考訳(メタデータ) (2021-03-12T05:27:14Z) - Reversing the cycle: self-supervised deep stereo through enhanced
monocular distillation [51.714092199995044]
多くの分野において、自己教師付き学習ソリューションは急速に進化し、教師付きアプローチでギャップを埋めている。
本稿では,両者の相互関係を逆転する自己教師型パラダイムを提案する。
深層ステレオネットワークを訓練するために,単分子完備ネットワークを通じて知識を抽出する。
論文 参考訳(メタデータ) (2020-08-17T07:40:22Z) - Expanding Sparse Guidance for Stereo Matching [24.74333370941674]
局所特徴強調のためのRGB画像に関するスパースキューを拡大する新しい空間拡張手法を提案する。
提案手法は,最先端のステレオアルゴリズムを極めてスパースな手法で大幅に向上させる。
論文 参考訳(メタデータ) (2020-04-24T06:41:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。