論文の概要: Pseudo-Stereo Inputs: A Solution to the Occlusion Challenge in Self-Supervised Stereo Matching
- arxiv url: http://arxiv.org/abs/2410.02534v2
- Date: Thu, 06 Nov 2025 08:42:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-07 20:17:53.064196
- Title: Pseudo-Stereo Inputs: A Solution to the Occlusion Challenge in Self-Supervised Stereo Matching
- Title(参考訳): Pseudo-Stereo Inputs: 自己監督ステレオマッチングにおけるOcclusion Challengeの解法
- Authors: Ruizhi Yang, Xingqiang Li, Jiajun Bai, Jinsong Du,
- Abstract要約: この研究は、一方の有効信号と一方の誤信号の固定状態から、一方の悪信号の双方からの有効なフィードバックの確率的取得に変換することを目的としている。
その結果, 対象物体の両側面において, 完全対称および同一性能により, 問題が解決されることが示唆された。
- 参考スコア(独自算出の注目度): 0.6299766708197883
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Self-supervised stereo matching holds great promise by eliminating the reliance on expensive ground-truth data. Its dominant paradigm, based on photometric consistency, is however fundamentally hindered by the occlusion challenge -- an issue that persists regardless of network architecture. The essential insight is that for any occluders, valid feedback signals can only be derived from the unoccluded areas on one side of the occluder. Existing methods attempt to address this by focusing on the erroneous feedback from the other side, either by identifying and removing it, or by introducing additional regularities for correction on that basis. Nevertheless, these approaches have failed to provide a complete solution. This work proposes a more fundamental solution. The core idea is to transform the fixed state of one-sided valid and one-sided erroneous signals into a probabilistic acquisition of valid feedback from both sides of an occluder. This is achieved through a complete framework, centered on a pseudo-stereo inputs strategy that decouples the input and feedback, without introducing any additional constraints. Qualitative results visually demonstrate that the occlusion problem is resolved, manifested by fully symmetrical and identical performance on both flanks of occluding objects. Quantitative experiments thoroughly validate the significant performance improvements resulting from solving the occlusion challenge.
- Abstract(参考訳): 自己教師型ステレオマッチングは、高価な地上データへの依存をなくすことで、大きな約束を果たす。
しかし、光度一貫性に基づくその支配的なパラダイムは、ネットワークアーキテクチャに関係なく持続するオクルージョンの問題によって、基本的に妨げられている。
必須の洞察は、任意のオクルーダーに対して、有効なフィードバック信号は、オクルーダーの一方の非閉塞領域からのみ引き出すことができるということである。
既存の方法は、反対側からの誤ったフィードバックに注目したり、それを識別したり削除したり、あるいはそれに基づいて修正のための追加の規則を導入することによって、この問題に対処しようとする。
しかし、これらのアプローチは完全な解決策を提供しられなかった。
この研究はより基本的な解決策を提案する。
中心となる考え方は、一方の有効信号と一方の誤信号の固定状態が、オクルーダーの両側から有効なフィードバックを確率的に取得することである。
これは、追加の制約を導入することなく、入力とフィードバックを分離する擬似ステレオ入力戦略を中心とした、完全なフレームワークを通じて達成される。
定性的な結果から, 物体の両側面に完全に対称的, 同一性を示すことによって, 閉塞問題が解決されることが示唆された。
咬合障害の解決による顕著なパフォーマンス改善を定量的に検証する。
関連論文リスト
- Integrating Disparity Confidence Estimation into Relative Depth Prior-Guided Unsupervised Stereo Matching [55.784713740698365]
教師なしのステレオマッチングは、コストのかかる不均一なアノテーションから独立して、大きな注目を集めている。
実現可能な解決策は、相対深度マップからステレオマッチングネットワークへの3次元幾何学的知識の転送にある。
本研究は,これらの課題に対処する新しい教師なし学習フレームワークを提案する。
論文 参考訳(メタデータ) (2025-08-02T09:11:05Z) - Mono2Stereo: A Benchmark and Empirical Study for Stereo Conversion [88.67015254278859]
ステレオ変換の詳細な探索を支援するため,高品質なトレーニングデータとベンチマークを提供するMono2Stereoデータセットを紹介した。
1) 左右のビューの違いは微妙であるが、既存のメトリクスでは全体のピクセルを考慮し、ステレオ効果に批判的な領域に集中できない。
本稿では, ステレオ効果に関する人間の判断と高い相関性が得られる新しい評価指標, Stereo Intersection-over-Union を提案する。
論文 参考訳(メタデータ) (2025-03-28T09:25:58Z) - ZeroStereo: Zero-shot Stereo Matching from Single Images [17.560148513475387]
ゼロショットステレオマッチングのための新しいステレオ画像生成パイプラインであるZeroStereoを提案する。
提案手法は, 単眼深度推定モデルにより生成された擬似格差を利用して, 高品質な右画像の合成を行う。
我々のパイプラインは、Scene Flowに匹敵するデータセットボリュームで複数のデータセットにまたがる最先端のゼロショット一般化を実現する。
論文 参考訳(メタデータ) (2025-01-15T08:43:48Z) - Learning Feature Recovery Transformer for Occluded Person
Re-identification [71.18476220969647]
本稿では,FRT(Feature Recovery Transformer)と呼ばれる2つの課題を同時に解決する手法を提案する。
特徴マッチング時のノイズの干渉を低減するため,両画像に現れる可視領域に着目し,類似性を計算するための可視グラフを開発した。
2つ目の課題は、グラフの類似性に基づいて、各クエリ画像に対して、ギャラリー内の$k$-nearestの隣人の特徴セットを利用して、完全な特徴を復元するリカバリトランスフォーマを提案することである。
論文 参考訳(メタデータ) (2023-01-05T02:36:16Z) - Dynamic Feature Pruning and Consolidation for Occluded Person
Re-Identification [21.006680330530852]
本研究では, 明示的な人間の構造解析を回避するために, 機能解析・統合(FPC)フレームワークを提案する。
フレームワークは主にスパースエンコーダ、マルチビュー機能mathcingモジュール、フィーチャーコンソリデーションデコーダで構成されている。
提案手法は,Occluded-Dukeデータセットにおいて,少なくとも8.6% mAPと6.0% Rank-1の精度で最新結果より優れる。
論文 参考訳(メタデータ) (2022-11-27T06:18:40Z) - Degradation-agnostic Correspondence from Resolution-asymmetric Stereo [96.03964515969652]
テレワイドカメラシステムで取得した解像度の異なる2枚の画像からステレオマッチングの問題を考察する。
特徴量整合性という画像空間の代わりに特徴空間に2つのビュー間の整合性を課すことを提案する。
測光損失をトレーニングしたステレオマッチングネットワークは最適ではないが, 特徴抽出器は劣化に依存しない, マッチング特有の特徴を生成できる。
論文 参考訳(メタデータ) (2022-04-04T12:24:34Z) - Revisiting Domain Generalized Stereo Matching Networks from a Feature
Consistency Perspective [65.37571681370096]
両視点にまたがる単純な画素単位のコントラスト学習を提案する。
ドメイン間の立体的特徴一貫性をよりよく維持するために、立体選択的白化損失を導入する。
提案手法は,複数の最先端ネットワークよりも優れた性能を実現する。
論文 参考訳(メタデータ) (2022-03-21T11:21:41Z) - AdaStereo: An Efficient Domain-Adaptive Stereo Matching Approach [50.855679274530615]
本稿では,AdaStereoというドメイン適応型アプローチを提案する。
我々のモデルは、KITTI、Middlebury、ETH3D、DrivingStereoなど、複数のベンチマークで最先端のクロスドメイン性能を実現している。
提案手法は,様々なドメイン適応設定に対して堅牢であり,迅速な適応アプリケーションシナリオや実環境展開に容易に組み込むことができる。
論文 参考訳(メタデータ) (2021-12-09T15:10:47Z) - Towards Adversarially Robust and Domain Generalizable Stereo Matching by
Rethinking DNN Feature Backbones [14.569829985753346]
本稿では,弱いホワイトボックス攻撃が最先端の手法を失敗させる可能性があることを示す。
提案手法はSceneFlowデータセットとKITTI2015ベンチマークで検証される。
これは、最先端の手法に匹敵する精度を維持しながら、敵の堅牢性を大幅に改善する。
論文 参考訳(メタデータ) (2021-07-31T22:44:18Z) - H-Net: Unsupervised Attention-based Stereo Depth Estimation Leveraging
Epipolar Geometry [4.968452390132676]
本稿では,教師なしステレオ深度推定のためのディープラーニングフレームワークであるH-Netを紹介する。
初めて、Siameseオートエンコーダアーキテクチャが深さ推定に使用されます。
本手法は,最先端の非監視ステレオ深度推定法を上回っている。
論文 参考訳(メタデータ) (2021-04-22T19:16:35Z) - Geometry-based Occlusion-Aware Unsupervised Stereo Matching for
Autonomous Driving [26.787020338316815]
閉塞処理はステレオマッチングにおいて特に教師なし手法では難しい問題である。
我々は,隠蔽領域を検出する効果的な方法を導入し,隠蔽領域に対処する新しい教師なしトレーニング戦略を提案する。
我々の手法はステレオマッチングの他の教師なし手法よりも優れています。
論文 参考訳(メタデータ) (2020-10-21T01:22:55Z) - Unsupervised Feature Learning for Event Data: Direct vs Inverse Problem
Formulation [53.850686395708905]
イベントベースのカメラは、ピクセルごとの明るさ変化の非同期ストリームを記録する。
本稿では,イベントデータからの表現学習のための単一層アーキテクチャに焦点を当てる。
我々は,最先端手法と比較して,認識精度が最大9%向上したことを示す。
論文 参考訳(メタデータ) (2020-09-23T10:40:03Z) - AdaStereo: A Simple and Efficient Approach for Adaptive Stereo Matching [50.06646151004375]
AdaStereoと呼ばれる新しいドメイン適応パイプラインは、ディープステレオマッチングネットワークにマルチレベル表現をアライメントすることを目的としている。
我々のAdaStereoモデルは、KITTI、Middlebury、ETH3D、DrivingStereoなど、複数のステレオベンチマークで最先端のクロスドメインパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2020-04-09T16:15:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。