論文の概要: PVStereo: Pyramid Voting Module for End-to-End Self-Supervised Stereo
Matching
- arxiv url: http://arxiv.org/abs/2103.07094v1
- Date: Fri, 12 Mar 2021 05:27:14 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-15 13:14:01.798784
- Title: PVStereo: Pyramid Voting Module for End-to-End Self-Supervised Stereo
Matching
- Title(参考訳): PVStereo: エンドツーエンドのステレオマッチングのためのピラミッド投票モジュール
- Authors: Hengli Wang, Rui Fan, Peide Cai, Ming Liu
- Abstract要約: 本稿では,ピラミッド投票モジュール(PVM)と,OptStereoと呼ばれる新しいDCNNアーキテクチャからなる,堅牢で効果的な自己監督型ステレオマッチング手法を提案する。
具体的には、OptStereoは最初にマルチスケールのコストボリュームを構築し、その後、繰り返し単位を採用し、高分解能で不一致推定を反復的に更新します。
hkust-driveデータセット(大規模な合成ステレオデータセット)を、異なる照明条件と気象条件下で研究目的で収集した。
- 参考スコア(独自算出の注目度): 14.603116313499648
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Supervised learning with deep convolutional neural networks (DCNNs) has seen
huge adoption in stereo matching. However, the acquisition of large-scale
datasets with well-labeled ground truth is cumbersome and labor-intensive,
making supervised learning-based approaches often hard to implement in
practice. To overcome this drawback, we propose a robust and effective
self-supervised stereo matching approach, consisting of a pyramid voting module
(PVM) and a novel DCNN architecture, referred to as OptStereo. Specifically,
our OptStereo first builds multi-scale cost volumes, and then adopts a
recurrent unit to iteratively update disparity estimations at high resolution;
while our PVM can generate reliable semi-dense disparity images, which can be
employed to supervise OptStereo training. Furthermore, we publish the
HKUST-Drive dataset, a large-scale synthetic stereo dataset, collected under
different illumination and weather conditions for research purposes. Extensive
experimental results demonstrate the effectiveness and efficiency of our
self-supervised stereo matching approach on the KITTI Stereo benchmarks and our
HKUST-Drive dataset. PVStereo, our best-performing implementation, greatly
outperforms all other state-of-the-art self-supervised stereo matching
approaches. Our project page is available at sites.google.com/view/pvstereo.
- Abstract(参考訳): 深層畳み込みニューラルネットワーク(DCNN)による教師付き学習はステレオマッチングに大きく採用されている。
しかし、十分にラベル付けされた基盤真理を持つ大規模データセットの取得は煩雑で労働集約的であり、教師付き学習ベースのアプローチを実践することはしばしば困難である。
この欠点を克服するため,我々は,ピラミッド投票モジュール(PVM)と新しいDCNNアーキテクチャ(OptStereo)からなる,堅牢で効果的な自己教師型ステレオマッチング手法を提案する。
具体的には、我々のopstereoは、まず、マルチスケールなコストボリュームを構築し、その後、反復的に、高解像度で異質な推定値を更新するために、recurrent unitを採用しています。
さらに,大規模合成ステレオデータセットであるHKUST-Driveデータセットを,異なる照明条件と気象条件で収集し,研究目的で公開する。
KITTI StereoベンチマークとHKUST-Driveデータセットを用いた自己教師型ステレオマッチング手法の有効性と有効性を示した。
当社のベストパフォーマンス実装であるPVStereoは、他の最先端の自己監視型ステレオマッチングアプローチを大幅に上回ります。
プロジェクトページはsites.google.com/view/pvstereoで閲覧できます。
関連論文リスト
- UniTT-Stereo: Unified Training of Transformer for Enhanced Stereo Matching [18.02254687807291]
UniTT-StereoはTransformerベースのステレオアーキテクチャの可能性を最大化する手法である。
UniTT-Stereoの最先端性能は、ETH3D、KITTI 2012、KITTI 2015データセットなどの様々なベンチマークで検証されている。
論文 参考訳(メタデータ) (2024-09-04T09:02:01Z) - OpenStereo: A Comprehensive Benchmark for Stereo Matching and Strong Baseline [25.4712469033627]
我々はOpenStereoと呼ばれるフレキシブルで効率的なステレオマッチングを開発する。
OpenStereoには10以上のネットワークモデルのトレーニングと推論コードが含まれている。
我々は, 立体マッチングにおける最近の展開の総合的分析とデコンストラクションを, 包括的アブレーション実験を通じて実施する。
私たちのStereoBaseは、SceneFlow、KITTI 2015、2012(Reflective)で第1位であり、すべてのメトリクスで最高のパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2023-12-01T04:35:47Z) - Uncertainty Guided Adaptive Warping for Robust and Efficient Stereo
Matching [77.133400999703]
相関に基づくステレオマッチングは優れた性能を達成した。
固定モデルによる現在のメソッドは、さまざまなデータセットで均一に動作しない。
本稿では,ロバストなステレオマッチングのための相関を動的に計算する新しい視点を提案する。
論文 参考訳(メタデータ) (2023-07-26T09:47:37Z) - AdaStereo: An Efficient Domain-Adaptive Stereo Matching Approach [50.855679274530615]
本稿では,AdaStereoというドメイン適応型アプローチを提案する。
我々のモデルは、KITTI、Middlebury、ETH3D、DrivingStereoなど、複数のベンチマークで最先端のクロスドメイン性能を実現している。
提案手法は,様々なドメイン適応設定に対して堅牢であり,迅速な適応アプリケーションシナリオや実環境展開に容易に組み込むことができる。
論文 参考訳(メタデータ) (2021-12-09T15:10:47Z) - SMD-Nets: Stereo Mixture Density Networks [68.56947049719936]
SMD-Nets(Stereo Mixture Density Networks)は、幅広い2Dおよび3Dアーキテクチャに対応したシンプルで効果的な学習フレームワークです。
具体的には,バイモーダル混合密度を出力表現として活用し,不連続近傍の鋭く正確な不一致推定を可能にすることを示す。
我々は8Mpx解像度のステレオペアと現実世界のステレオデータセットからなる、新しい高解像度でリアルな合成ステレオデータセットに関する包括的な実験を行う。
論文 参考訳(メタデータ) (2021-04-08T16:15:46Z) - Reversing the cycle: self-supervised deep stereo through enhanced
monocular distillation [51.714092199995044]
多くの分野において、自己教師付き学習ソリューションは急速に進化し、教師付きアプローチでギャップを埋めている。
本稿では,両者の相互関係を逆転する自己教師型パラダイムを提案する。
深層ステレオネットワークを訓練するために,単分子完備ネットワークを通じて知識を抽出する。
論文 参考訳(メタデータ) (2020-08-17T07:40:22Z) - Self-adapting confidence estimation for stereo [48.56220165347967]
本稿では,ステレオアルゴリズムやネットワークに自己適応的な信頼度推定を可能にする,フレキシブルで軽量なソリューションを提案する。
当社の戦略は,ステレオシステムとのシームレスな統合を可能にするだけでなく,その自己適応能力によって,現場でのアウト・オブ・ザ・ボックス(out-of-the-box)デプロイメントも実現しています。
論文 参考訳(メタデータ) (2020-08-14T16:17:28Z) - Expanding Sparse Guidance for Stereo Matching [24.74333370941674]
局所特徴強調のためのRGB画像に関するスパースキューを拡大する新しい空間拡張手法を提案する。
提案手法は,最先端のステレオアルゴリズムを極めてスパースな手法で大幅に向上させる。
論文 参考訳(メタデータ) (2020-04-24T06:41:11Z) - AdaStereo: A Simple and Efficient Approach for Adaptive Stereo Matching [50.06646151004375]
AdaStereoと呼ばれる新しいドメイン適応パイプラインは、ディープステレオマッチングネットワークにマルチレベル表現をアライメントすることを目的としている。
我々のAdaStereoモデルは、KITTI、Middlebury、ETH3D、DrivingStereoなど、複数のステレオベンチマークで最先端のクロスドメインパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2020-04-09T16:15:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。