Fugu-MT 論文翻訳(概要): Context-Enhanced Stereo Transformer

論文の概要: Context-Enhanced Stereo Transformer

arxiv url: http://arxiv.org/abs/2210.11719v1
Date: Fri, 21 Oct 2022 04:10:47 GMT
ステータス: 翻訳完了
システム内更新日: 2022-10-24 13:41:45.747801
Title: Context-Enhanced Stereo Transformer
Title（参考訳）: コンテキスト強化ステレオトランス
Authors: Weiyu Guo, Zhaoshuo Li, Yongkui Yang, Zheng Wang, Russell H. Taylor, Mathias Unberath, Alan Yuille, and Yingwei Li
Abstract要約: ステレオ深度推定モデル Context Enhanced Stereo Transformer (CSTR) を構築した。 CSTRは、Scene Flow、Middlebury-2014、KITTI-2015、MPI-Sintelなどの異なる公開データセットで調査されている。例えば、ゼロショット合成-現実設定では、CSTRはMiddlebury-2014データセット上で最も競合するアプローチを11%上回っている。
参考スコア（独自算出の注目度）: 20.11280444217963
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Stereo depth estimation is of great interest for computer vision research. However, existing methods struggles to generalize and predict reliably in hazardous regions, such as large uniform regions. To overcome these limitations, we propose Context Enhanced Path (CEP). CEP improves the generalization and robustness against common failure cases in existing solutions by capturing the long-range global information. We construct our stereo depth estimation model, Context Enhanced Stereo Transformer (CSTR), by plugging CEP into the state-of-the-art stereo depth estimation method Stereo Transformer. CSTR is examined on distinct public datasets, such as Scene Flow, Middlebury-2014, KITTI-2015, and MPI-Sintel. We find CSTR outperforms prior approaches by a large margin. For example, in the zero-shot synthetic-to-real setting, CSTR outperforms the best competing approaches on Middlebury-2014 dataset by 11%. Our extensive experiments demonstrate that the long-range information is critical for stereo matching task and CEP successfully captures such information.
Abstract（参考訳）: ステレオ深度推定はコンピュータビジョン研究において非常に興味深い。しかし、既存の手法は、大きな一様領域のような危険地域において確実に一般化し予測することに苦慮している。これらの制限を克服するために、Context Enhanced Path (CEP)を提案する。 CEPは、長距離グローバル情報をキャプチャすることで、既存のソリューションにおける一般的な障害ケースに対する一般化と堅牢性を改善する。ステレオ深度推定モデルであるContext Enhanced Stereo Transformer (CSTR) を構築し,CEPを最先端のステレオ深度推定手法であるStereo Transformerに接続する。 CSTRは、Scene Flow、Middlebury-2014、KITTI-2015、MPI-Sintelなどの異なる公開データセットで調査されている。 CSTRは従来のアプローチよりも大きなマージンで優れています。例えば、ゼロショット合成-現実設定では、CSTRはMiddlebury-2014データセット上で最も競合するアプローチを11%上回っている。広範囲にわたる実験により, ステレオマッチング作業において, 長距離情報は重要であり, CEPはそのような情報を取り込むことに成功した。

関連論文リスト

DepthVanish: Optimizing Adversarial Interval Structures for Stereo-Depth-Invisible Patches [52.324773418994575]
ステレオ深度推定に対する敵攻撃は、デプロイ前に脆弱性を明らかにするのに役立つ。我々は, ストライプ構造とテクスチャ要素の両面を協調的に最適化する新しい立体深度攻撃を開発した。われわれのパッチは、商用RGB-Dカメラ(Intel RealSense)を現実世界の環境で攻撃することもできる。
論文参考訳（メタデータ） (2025-06-20T02:22:21Z)
Boosting Omnidirectional Stereo Matching with a Pre-trained Depth Foundation Model [62.37493746544967]
カメラベースの設定は、立体深度推定を用いて高解像度の高解像度深度マップを生成することで、コスト効率のよい選択肢を提供する。既存の全方位ステレオマッチング手法は、様々な環境において限られた深度精度しか達成できない。 DFI-OmniStereoは, 大規模事前学習基礎モデルを用いて, 相対的な単眼深度推定を行う新しい全方位ステレオマッチング法である。
論文参考訳（メタデータ） (2025-03-30T16:24:22Z)
Mono2Stereo: A Benchmark and Empirical Study for Stereo Conversion [88.67015254278859]
ステレオ変換の詳細な探索を支援するため,高品質なトレーニングデータとベンチマークを提供するMono2Stereoデータセットを紹介した。 1) 左右のビューの違いは微妙であるが、既存のメトリクスでは全体のピクセルを考慮し、ステレオ効果に批判的な領域に集中できない。本稿では, ステレオ効果に関する人間の判断と高い相関性が得られる新しい評価指標, Stereo Intersection-over-Union を提案する。
論文参考訳（メタデータ） (2025-03-28T09:25:58Z)
UniTT-Stereo: Unified Training of Transformer for Enhanced Stereo Matching [18.02254687807291]
UniTT-StereoはTransformerベースのステレオアーキテクチャの可能性を最大化する手法である。 UniTT-Stereoの最先端性能は、ETH3D、KITTI 2012、KITTI 2015データセットなどの様々なベンチマークで検証されている。
論文参考訳（メタデータ） (2024-09-04T09:02:01Z)
Stereo Risk: A Continuous Modeling Approach to Stereo Matching [110.22344879336043]
我々はコンピュータビジョンにおける古典的ステレオマッチング問題を解決するための新しいディープラーニングアプローチであるStereo Riskを紹介する。ステレオリスクはディープネットワーク,特にマルチモーダル確率分布の相違に対して,ステレオマッチング性能を向上させることを実証する。総合的な分析により,提案手法の理論的健全性と,各種ベンチマークデータセットにおける最先端手法よりも優れた性能を示す。
論文参考訳（メタデータ） (2024-07-03T14:30:47Z)
Digging into contrastive learning for robust depth estimation with diffusion models [55.62276027922499]
そこで我々はD4RDと呼ばれる新しい頑健な深度推定法を提案する。複雑な環境での性能劣化を軽減するために、拡散モデルに適した独自のコントラスト学習モードを備えている。実験では、D4RDは合成汚職データセットや現実世界の気象条件に関する最先端のソリューションを超越している。
論文参考訳（メタデータ） (2024-04-15T14:29:47Z)
Depth-aware Volume Attention for Texture-less Stereo Matching [67.46404479356896]
実用的な屋外シナリオにおけるテクスチャ劣化に対処する軽量なボリューム改善手法を提案する。画像テクスチャの相対的階層を抽出し,地中深度マップによって教師される深度体積を導入する。局所的な微細構造と文脈は、体積凝集時のあいまいさと冗長性を緩和するために強調される。
論文参考訳（メタデータ） (2024-02-14T04:07:44Z)
AdaStereo: An Efficient Domain-Adaptive Stereo Matching Approach [50.855679274530615]
本稿では,AdaStereoというドメイン適応型アプローチを提案する。我々のモデルは、KITTI、Middlebury、ETH3D、DrivingStereoなど、複数のベンチマークで最先端のクロスドメイン性能を実現している。提案手法は,様々なドメイン適応設定に対して堅牢であり,迅速な適応アプリケーションシナリオや実環境展開に容易に組み込むことができる。
論文参考訳（メタデータ） (2021-12-09T15:10:47Z)
Generalized Real-World Super-Resolution through Adversarial Robustness [107.02188934602802]
本稿では,実世界のSRに取り組むために,敵攻撃の一般化能力を活用したロバスト超解法を提案する。我々の新しいフレームワークは、現実世界のSR手法の開発においてパラダイムシフトをもたらす。単一のロバストモデルを使用することで、実世界のベンチマークで最先端の特殊な手法より優れています。
論文参考訳（メタデータ） (2021-08-25T22:43:20Z)
H-Net: Unsupervised Attention-based Stereo Depth Estimation Leveraging Epipolar Geometry [4.968452390132676]
本稿では,教師なしステレオ深度推定のためのディープラーニングフレームワークであるH-Netを紹介する。初めて、Siameseオートエンコーダアーキテクチャが深さ推定に使用されます。本手法は,最先端の非監視ステレオ深度推定法を上回っている。
論文参考訳（メタデータ） (2021-04-22T19:16:35Z)
SMD-Nets: Stereo Mixture Density Networks [68.56947049719936]
SMD-Nets(Stereo Mixture Density Networks)は、幅広い2Dおよび3Dアーキテクチャに対応したシンプルで効果的な学習フレームワークです。具体的には,バイモーダル混合密度を出力表現として活用し,不連続近傍の鋭く正確な不一致推定を可能にすることを示す。我々は8Mpx解像度のステレオペアと現実世界のステレオデータセットからなる、新しい高解像度でリアルな合成ステレオデータセットに関する包括的な実験を行う。
論文参考訳（メタデータ） (2021-04-08T16:15:46Z)
PVStereo: Pyramid Voting Module for End-to-End Self-Supervised Stereo Matching [14.603116313499648]
本稿では,ピラミッド投票モジュール(PVM)と,OptStereoと呼ばれる新しいDCNNアーキテクチャからなる,堅牢で効果的な自己監督型ステレオマッチング手法を提案する。具体的には、OptStereoは最初にマルチスケールのコストボリュームを構築し、その後、繰り返し単位を採用し、高分解能で不一致推定を反復的に更新します。 hkust-driveデータセット(大規模な合成ステレオデータセット)を、異なる照明条件と気象条件下で研究目的で収集した。
論文参考訳（メタデータ） (2021-03-12T05:27:14Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。