論文の概要: Active-Passive SimStereo -- Benchmarking the Cross-Generalization
Capabilities of Deep Learning-based Stereo Methods
- arxiv url: http://arxiv.org/abs/2209.08305v1
- Date: Sat, 17 Sep 2022 10:30:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-20 18:01:50.029402
- Title: Active-Passive SimStereo -- Benchmarking the Cross-Generalization
Capabilities of Deep Learning-based Stereo Methods
- Title(参考訳): Active-Passive SimStereo --Deep Learning-based Stereo Methodのクロスジェネリゼーション能力のベンチマーク
- Authors: Laurent Jospin and Allen Antony and Lian Xu and Hamid Laga and Farid
Boussaid and Mohammed Bennamoun
- Abstract要約: 自己相似領域やbland領域は、2つの画像間のパッチの一致を難しくする。
アクティブステレオベースの手法は、シーンに擬似ランダムパターンを投影することでこの問題を軽減する。
このパターンが対向雑音の一形態として振る舞うと、深層学習法の性能に悪影響を及ぼす可能性がある。
- 参考スコア(独自算出の注目度): 26.662129158141763
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In stereo vision, self-similar or bland regions can make it difficult to
match patches between two images. Active stereo-based methods mitigate this
problem by projecting a pseudo-random pattern on the scene so that each patch
of an image pair can be identified without ambiguity. However, the projected
pattern significantly alters the appearance of the image. If this pattern acts
as a form of adversarial noise, it could negatively impact the performance of
deep learning-based methods, which are now the de-facto standard for dense
stereo vision. In this paper, we propose the Active-Passive SimStereo dataset
and a corresponding benchmark to evaluate the performance gap between passive
and active stereo images for stereo matching algorithms. Using the proposed
benchmark and an additional ablation study, we show that the feature extraction
and matching modules of a selection of twenty selected deep learning-based
stereo matching methods generalize to active stereo without a problem. However,
the disparity refinement modules of three of the twenty architectures (ACVNet,
CascadeStereo, and StereoNet) are negatively affected by the active stereo
patterns due to their reliance on the appearance of the input images.
- Abstract(参考訳): ステレオビジョンでは、自己相似領域またはbland領域は、2つの画像間のパッチのマッチングが困難になる。
アクティブステレオベースの手法では、シーンに擬似ランダムパターンを投影することにより、画像ペアの各パッチを曖昧さなく識別できる。
しかし、投影されたパターンは画像の外観を著しく変化させる。
もしこのパターンが敵対的なノイズの一形態として振る舞うなら、深層学習に基づく手法の性能に悪影響を及ぼす可能性がある。
本稿では,ステレオマッチングアルゴリズムにおける受動ステレオ画像とアクティブステレオ画像のパフォーマンスギャップを評価するために,Active-Passive SimStereoデータセットとそれに対応するベンチマークを提案する。
提案するベンチマークと追加のアブレーション研究を用いて,選択した20種類のディープラーニングに基づくステレオマッチング手法の特徴抽出とマッチングモジュールを問題なくアクティブステレオに一般化することを示した。
しかし,3つのアーキテクチャ(acvnet,cascadestereo,ステレオネット)の異なる細分化モジュールは,入力画像の出現に依存するため,アクティブステレオパターンに負の影響を受けている。
関連論文リスト
- MaDis-Stereo: Enhanced Stereo Matching via Distilled Masked Image Modeling [18.02254687807291]
近年、トランスフォーマーベースのステレオモデルが研究されており、ステレオマッチングタスクに固有のデータ不足が原因で、CNNベースのステレオモデルよりも性能が遅れている。
本研究では,Masked Image Modeling Distilled Stereo matching model(MaDis-Stereo)を提案する。
論文 参考訳(メタデータ) (2024-09-04T16:17:45Z) - UniTT-Stereo: Unified Training of Transformer for Enhanced Stereo Matching [18.02254687807291]
UniTT-StereoはTransformerベースのステレオアーキテクチャの可能性を最大化する手法である。
UniTT-Stereoの最先端性能は、ETH3D、KITTI 2012、KITTI 2015データセットなどの様々なベンチマークで検証されている。
論文 参考訳(メタデータ) (2024-09-04T09:02:01Z) - Modeling Stereo-Confidence Out of the End-to-End Stereo-Matching Network
via Disparity Plane Sweep [31.261772846687297]
提案手法は, 立体像対の任意のシフトを, 差分マップの対応する量シフトで更新する,という考え方に基づいて構築された。
所望の相違プロファイルと予測された相違プロファイルを比較することで、左右の像のあいまいさのレベルを定量化し、信頼度を測定することができる。
論文 参考訳(メタデータ) (2024-01-22T14:52:08Z) - Single-View View Synthesis with Self-Rectified Pseudo-Stereo [49.946151180828465]
疑似ステレオ視点を生成する前に、信頼性と明示的なステレオを利用する。
本稿では,自己修正ステレオ合成法を提案する。
本手法は,最先端の単一ビュービュー合成法およびステレオ合成法より優れる。
論文 参考訳(メタデータ) (2023-04-19T09:36:13Z) - Anomalous Sound Detection using Audio Representation with Machine ID
based Contrastive Learning Pretraining [52.191658157204856]
コントラスト学習を用いて、各音声サンプルではなく、各機械IDの音声表現を洗練する。
提案手法では、コントラスト学習を用いて音声表現モデルを事前学習する。
実験の結果,本手法はコントラスト学習や自己教師型分類を用いて最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2023-04-07T11:08:31Z) - Bayesian Learning for Disparity Map Refinement for Semi-Dense Active
Stereo Vision [30.330599857204344]
本稿では,ニューラルネットワークを学習し,半高精細能動ステレオビジョンのための高品質なサブピクセル不均質マップを推定する新たな学習手法を提案する。
提案手法は,現在最先端のアクティブステレオモデルよりも優れていることを示す。
論文 参考訳(メタデータ) (2022-09-12T08:33:40Z) - Revisiting Domain Generalized Stereo Matching Networks from a Feature
Consistency Perspective [65.37571681370096]
両視点にまたがる単純な画素単位のコントラスト学習を提案する。
ドメイン間の立体的特徴一貫性をよりよく維持するために、立体選択的白化損失を導入する。
提案手法は,複数の最先端ネットワークよりも優れた性能を実現する。
論文 参考訳(メタデータ) (2022-03-21T11:21:41Z) - Polka Lines: Learning Structured Illumination and Reconstruction for
Active Stereo [52.68109922159688]
本稿では,波動光学と幾何光学の両方に依存した,アクティブステレオのための新しい微分可能な画像形成モデルと,新しい三眼再構成ネットワークを提案する。
Polka Lines" を再現ネットワークと組み合わせた共同最適化パターンは, 撮像条件全体にわたって, 最先端のアクティブステレオ深度推定を達成している。
論文 参考訳(メタデータ) (2020-11-26T04:02:43Z) - Parallax Attention for Unsupervised Stereo Correspondence Learning [46.035892564279564]
ステレオ画像対は、3Dシーンキューを左画像と右画像のステレオ対応に符号化する。
近年のCNNベースの手法では,大域にわたるステレオ対応を捉えるために,コストボリューム技術が一般的である。
本稿では, 相違によらずステレオ対応を捉えるために, 汎用パララックスアテンション機構(PAM)を提案する。
論文 参考訳(メタデータ) (2020-09-16T01:30:13Z) - AdaStereo: A Simple and Efficient Approach for Adaptive Stereo Matching [50.06646151004375]
AdaStereoと呼ばれる新しいドメイン適応パイプラインは、ディープステレオマッチングネットワークにマルチレベル表現をアライメントすることを目的としている。
我々のAdaStereoモデルは、KITTI、Middlebury、ETH3D、DrivingStereoなど、複数のステレオベンチマークで最先端のクロスドメインパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2020-04-09T16:15:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。