論文の概要: OpenStereo: A Comprehensive Benchmark for Stereo Matching and Strong
Baseline
- arxiv url: http://arxiv.org/abs/2312.00343v1
- Date: Fri, 1 Dec 2023 04:35:47 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-04 15:39:39.681287
- Title: OpenStereo: A Comprehensive Benchmark for Stereo Matching and Strong
Baseline
- Title(参考訳): OpenStereo: ステレオマッチングと強力なベースラインのための総合ベンチマーク
- Authors: Xianda Guo, Juntao Lu, Chenming Zhang, Yiqi Wang, Yiqun Duan, Tian
Yang, Zheng Zhu, Long Chen
- Abstract要約: 我々はOpenStereoと呼ばれるフレキシブルで効率的なステレオマッチングを開発する。
OpenStereoには12以上のネットワークモデルのトレーニングと推論コードが含まれている。
SceneFlowデータセットの実験を行い、元の論文で報告されたパフォーマンス指標を達成または超えた。
- 参考スコア(独自算出の注目度): 26.429115627831877
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Stereo matching, a pivotal technique in computer vision, plays a crucial role
in robotics, autonomous navigation, and augmented reality. Despite the
development of numerous impressive methods in recent years, replicating their
results and determining the most suitable architecture for practical
application remains challenging. Addressing this gap, our paper introduces a
comprehensive benchmark focusing on practical applicability rather than solely
on performance enhancement. Specifically, we develop a flexible and efficient
stereo matching codebase, called OpenStereo. OpenStereo includes training and
inference codes of more than 12 network models, making it, to our knowledge,
the most complete stereo matching toolbox available. Based on OpenStereo, we
conducted experiments on the SceneFlow dataset and have achieved or surpassed
the performance metrics reported in the original paper. Additionally, we
conduct an in-depth revisitation of recent developments in stereo matching
through ablative experiments. These investigations inspired the creation of
StereoBase, a simple yet strong baseline model. Our extensive comparative
analyses of StereoBase against numerous contemporary stereo matching methods on
the SceneFlow dataset demonstrate its remarkably strong performance. The source
code is available at https://github.com/XiandaGuo/OpenStereo.
- Abstract(参考訳): コンピュータビジョンにおける重要な技術であるステレオマッチングは、ロボット工学、自律ナビゲーション、拡張現実において重要な役割を果たす。
近年、数多くの印象的な手法が開発されているにもかかわらず、その結果を複製し、実用的なアプリケーションに適したアーキテクチャを決定することは依然として困難である。
このギャップに対処するため,本論文では,性能向上に留まらず,実用性に焦点をあてた総合ベンチマークを提案する。
具体的には,OpenStereoと呼ばれる,柔軟で効率的なステレオマッチングコードベースを開発する。
openstereoには12以上のネットワークモデルのトレーニングと推論コードが含まれており、私たちの知る限り、最も完全なステレオマッチングツールボックスです。
OpenStereoをベースにSceneFlowデータセットの実験を行い、元の論文で報告されたパフォーマンス指標を達成または超えた。
さらに,最近のステレオマッチングの進展を,アブレーション実験によって詳細に再検討する。
これらの調査は、シンプルだが強力なベースラインモデルであるStereoBaseの開発にインスピレーションを与えた。
SceneFlowデータセット上での多数のステレオマッチング手法に対するStereoBaseの広範な比較分析により,その顕著な性能が示された。
ソースコードはhttps://github.com/XiandaGuo/OpenStereoで入手できる。
関連論文リスト
- Stereo Anything: Unifying Stereo Matching with Large-Scale Mixed Data [26.029499450825092]
我々は、ロバストなステレオマッチングのためのソリューションであるStereoAnythingを紹介する。
ラベル付きステレオ画像を収集し,ラベル付きモノクロ画像から合成ステレオペアを生成することにより,データセットをスケールアップする。
5つの公開データセット上で,モデルのゼロショット能力を広範囲に評価した。
論文 参考訳(メタデータ) (2024-11-21T11:59:04Z) - Match Stereo Videos via Bidirectional Alignment [15.876953256378224]
最近の学習に基づく手法は、独立ステレオペアのパフォーマンスの最適化に重点を置いており、ビデオの時間的矛盾につながる。
本稿では,新しいビデオ処理フレームワークBiDAStereoとプラグイン安定化ネットワークBiDAStabilizerを紹介する。
本稿では,自然景観に着目したリアルな合成データセットとベンチマークと,様々な都市景観のステレオカメラが捉えた実世界のデータセットを定性評価として提示する。
論文 参考訳(メタデータ) (2024-09-30T13:37:29Z) - MC-Stereo: Multi-peak Lookup and Cascade Search Range for Stereo
Matching [15.786593303130477]
本稿では,MC-Stereoと呼ばれる新しい反復最適化アーキテクチャを提案する。
マルチピークルックアップ戦略により、マッチングにおけるマルチピーク分布問題を緩和する。
粗大な概念をカスケード検索範囲を通じて反復的なフレームワークに統合する。
MC-Stereo は KITTI-2012 と KITTI-2015 のベンチマークで一般に公開されているすべての手法の中で第1位である。
論文 参考訳(メタデータ) (2023-11-04T07:26:27Z) - Simple and Controllable Music Generation [94.61958781346176]
MusicGenは単一の言語モデル(LM)であり、圧縮された離散的な音楽表現、すなわちトークンの複数のストリームで動作する。
以前の作業とは異なり、MusicGenはシングルステージのトランスフォーマーLMと効率的なトークンインターリービングパターンで構成されている。
論文 参考訳(メタデータ) (2023-06-08T15:31:05Z) - AdaStereo: An Efficient Domain-Adaptive Stereo Matching Approach [50.855679274530615]
本稿では,AdaStereoというドメイン適応型アプローチを提案する。
我々のモデルは、KITTI、Middlebury、ETH3D、DrivingStereoなど、複数のベンチマークで最先端のクロスドメイン性能を実現している。
提案手法は,様々なドメイン適応設定に対して堅牢であり,迅速な適応アプリケーションシナリオや実環境展開に容易に組み込むことができる。
論文 参考訳(メタデータ) (2021-12-09T15:10:47Z) - PVStereo: Pyramid Voting Module for End-to-End Self-Supervised Stereo
Matching [14.603116313499648]
本稿では,ピラミッド投票モジュール(PVM)と,OptStereoと呼ばれる新しいDCNNアーキテクチャからなる,堅牢で効果的な自己監督型ステレオマッチング手法を提案する。
具体的には、OptStereoは最初にマルチスケールのコストボリュームを構築し、その後、繰り返し単位を採用し、高分解能で不一致推定を反復的に更新します。
hkust-driveデータセット(大規模な合成ステレオデータセット)を、異なる照明条件と気象条件下で研究目的で収集した。
論文 参考訳(メタデータ) (2021-03-12T05:27:14Z) - On the confidence of stereo matching in a deep-learning era: a
quantitative evaluation [124.09613797008099]
ステレオマッチングにおける信頼度推定の分野における10年以上の発展を概観する。
本研究では,異なるステレオアルゴリズムのプールに適用した場合と,最先端のディープステレオネットワークと組み合わせる場合とで,各測定値の異なる挙動について検討する。
論文 参考訳(メタデータ) (2021-01-02T11:40:17Z) - Reversing the cycle: self-supervised deep stereo through enhanced
monocular distillation [51.714092199995044]
多くの分野において、自己教師付き学習ソリューションは急速に進化し、教師付きアプローチでギャップを埋めている。
本稿では,両者の相互関係を逆転する自己教師型パラダイムを提案する。
深層ステレオネットワークを訓練するために,単分子完備ネットワークを通じて知識を抽出する。
論文 参考訳(メタデータ) (2020-08-17T07:40:22Z) - Self-adapting confidence estimation for stereo [48.56220165347967]
本稿では,ステレオアルゴリズムやネットワークに自己適応的な信頼度推定を可能にする,フレキシブルで軽量なソリューションを提案する。
当社の戦略は,ステレオシステムとのシームレスな統合を可能にするだけでなく,その自己適応能力によって,現場でのアウト・オブ・ザ・ボックス(out-of-the-box)デプロイメントも実現しています。
論文 参考訳(メタデータ) (2020-08-14T16:17:28Z) - AdaStereo: A Simple and Efficient Approach for Adaptive Stereo Matching [50.06646151004375]
AdaStereoと呼ばれる新しいドメイン適応パイプラインは、ディープステレオマッチングネットワークにマルチレベル表現をアライメントすることを目的としている。
我々のAdaStereoモデルは、KITTI、Middlebury、ETH3D、DrivingStereoなど、複数のステレオベンチマークで最先端のクロスドメインパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2020-04-09T16:15:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。