Fugu-MT 論文翻訳(概要): OpenStereo: A Comprehensive Benchmark for Stereo Matching and Strong Baseline

論文の概要: OpenStereo: A Comprehensive Benchmark for Stereo Matching and Strong Baseline

arxiv url: http://arxiv.org/abs/2312.00343v6
Date: Tue, 11 Jun 2024 04:41:28 GMT
ステータス: 翻訳完了
システム内更新日: 2024-06-13 00:48:47.063204
Title: OpenStereo: A Comprehensive Benchmark for Stereo Matching and Strong Baseline
Title（参考訳）: OpenStereo: ステレオマッチングと強力なベースラインのための総合ベンチマーク
Authors: Xianda Guo, Chenming Zhang, Juntao Lu, Yiqi Wang, Yiqun Duan, Tian Yang, Zheng Zhu, Long Chen,
Abstract要約: 我々はOpenStereoと呼ばれるフレキシブルで効率的なステレオマッチングを開発する。 OpenStereoには10以上のネットワークモデルのトレーニングと推論コードが含まれている。我々は, 立体マッチングにおける最近の展開の総合的分析とデコンストラクションを, 包括的アブレーション実験を通じて実施する。私たちのStereoBaseは、SceneFlow、KITTI 2015、2012(Reflective)で第1位であり、すべてのメトリクスで最高のパフォーマンスを実現しています。
参考スコア（独自算出の注目度）: 25.4712469033627
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Stereo matching aims to estimate the disparity between matching pixels in a stereo image pair, which is important to robotics, autonomous driving, and other computer vision tasks. Despite the development of numerous impressive methods in recent years, determining the most suitable architecture for practical application remains challenging. Addressing this gap, our paper introduces a comprehensive benchmark focusing on practical applicability rather than solely on individual models for optimized performance. Specifically, we develop a flexible and efficient stereo matching codebase, called OpenStereo. OpenStereo includes training and inference codes of more than 10 network models, making it, to our knowledge, the most complete stereo matching toolbox available. Based on OpenStereo, we conducted experiments and have achieved or surpassed the performance metrics reported in the original paper. Additionally, we conduct an exhaustive analysis and deconstruction of recent developments in stereo matching through comprehensive ablative experiments. These investigations inspired the creation of StereoBase, a strong baseline model. Our StereoBase ranks 1st on SceneFlow, KITTI 2015, 2012 (Reflective) among published methods and achieves the best performance across all metrics. In addition, StereoBase has strong cross-dataset generalization. Code is available at \url{https://github.com/XiandaGuo/OpenStereo}.
Abstract（参考訳）: ステレオマッチングは、ロボット工学、自律運転、その他のコンピュータビジョンタスクにおいて重要であるステレオ画像ペア内のマッチングピクセル間の格差を推定することを目的としている。近年、数多くの印象的な手法が開発されているにもかかわらず、実用アプリケーションに最も適したアーキテクチャを決定することは依然として困難である。このギャップに対処するため,本研究では,最適化性能のための個別モデルにのみ焦点をあてるのではなく,実用性を重視した総合的なベンチマークを提案する。具体的には,OpenStereoと呼ばれる,柔軟で効率的なステレオマッチングコードベースを開発する。 OpenStereoには10以上のネットワークモデルのトレーニングと推論コードが含まれています。 OpenStereoに基づいて実験を行い、元の論文で報告されたパフォーマンス指標を達成または超えた。さらに, 立体マッチングにおける最近の展開の総合的分析とデコンストラクションを, 包括的アブレーション実験を通じて実施する。これらの調査により、強力なベースラインモデルであるStereoBaseが誕生した。私たちのStereoBaseは、SceneFlow、KITTI 2015、2012(Reflective)で第1位であり、すべてのメトリクスで最高のパフォーマンスを実現しています。さらに、StereoBaseは強力なクロスデータセットの一般化を持っている。コードは \url{https://github.com/XiandaGuo/OpenStereo} で公開されている。

関連論文リスト

StereoWorld: Geometry-Aware Monocular-to-Stereo Video Generation [108.97993219426509]
StereoWorldは、高忠実なモノクル・ツー・ステレオビデオ生成のためのエンドツーエンドフレームワークである。我々のフレームワークは、幾何学的に認識された正規化で生成を明示的に監視しながら、単眼ビデオ入力のモデルを規定する。大規模なトレーニングと評価を可能にするため,高精細度ステレオビデオデータセットをキュレートする。
論文参考訳（メタデータ） (2025-12-10T06:50:16Z)
StereoCarla: A High-Fidelity Driving Dataset for Generalizable Stereo [50.25671551131985]
ステレオマッチングは、自律走行とロボット工学の深度認識を可能にする上で重要な役割を担っている。我々は、自律運転シナリオ用に設計された高忠実な合成ステレオデータセットであるStereoCarlaを提示する。
論文参考訳（メタデータ） (2025-09-16T05:14:45Z)
Procedural Dataset Generation for Zero-Shot Stereo Matching [62.21867807221371]
ゼロショットステレオデータセットに最適化されたプロシージャジェネレータを開発した。標準ベンチマークを用いてゼロショットステレオマッチング性能への影響を報告する。我々は,プロシージャステレオデータセットのさらなる研究を可能にするために,我々のシステムをオープンソース化した。
論文参考訳（メタデータ） (2025-04-23T17:59:33Z)
FoundationStereo: Zero-Shot Stereo Matching [50.79202911274819]
FoundationStereoはステレオ深度推定の基礎モデルである。まず,大規模(1Mステレオペア)合成学習データセットを構築した。その後、スケーラビリティを高めるために、多数のネットワークアーキテクチャコンポーネントを設計します。
論文参考訳（メタデータ） (2025-01-17T01:01:44Z)
Stereo Anything: Unifying Stereo Matching with Large-Scale Mixed Data [26.029499450825092]
我々は、ロバストなステレオマッチングのためのソリューションであるStereoAnythingを紹介する。ラベル付きステレオ画像を収集し,ラベル付きモノクロ画像から合成ステレオペアを生成することにより,データセットをスケールアップする。 5つの公開データセット上で,モデルのゼロショット能力を広範囲に評価した。
論文参考訳（メタデータ） (2024-11-21T11:59:04Z)
Match Stereo Videos via Bidirectional Alignment [15.876953256378224]
最近の学習に基づく手法は、独立ステレオペアのパフォーマンスの最適化に重点を置いており、ビデオの時間的矛盾につながる。本稿では,新しいビデオ処理フレームワークBiDAStereoとプラグイン安定化ネットワークBiDAStabilizerを紹介する。本稿では,自然景観に着目したリアルな合成データセットとベンチマークと,様々な都市景観のステレオカメラが捉えた実世界のデータセットを定性評価として提示する。
論文参考訳（メタデータ） (2024-09-30T13:37:29Z)
MC-Stereo: Multi-peak Lookup and Cascade Search Range for Stereo Matching [15.786593303130477]
本稿では,MC-Stereoと呼ばれる新しい反復最適化アーキテクチャを提案する。マルチピークルックアップ戦略により、マッチングにおけるマルチピーク分布問題を緩和する。粗大な概念をカスケード検索範囲を通じて反復的なフレームワークに統合する。 MC-Stereo は KITTI-2012 と KITTI-2015 のベンチマークで一般に公開されているすべての手法の中で第1位である。
論文参考訳（メタデータ） (2023-11-04T07:26:27Z)
Simple and Controllable Music Generation [94.61958781346176]
MusicGenは単一の言語モデル(LM)であり、圧縮された離散的な音楽表現、すなわちトークンの複数のストリームで動作する。以前の作業とは異なり、MusicGenはシングルステージのトランスフォーマーLMと効率的なトークンインターリービングパターンで構成されている。
論文参考訳（メタデータ） (2023-06-08T15:31:05Z)
AdaStereo: An Efficient Domain-Adaptive Stereo Matching Approach [50.855679274530615]
本稿では,AdaStereoというドメイン適応型アプローチを提案する。我々のモデルは、KITTI、Middlebury、ETH3D、DrivingStereoなど、複数のベンチマークで最先端のクロスドメイン性能を実現している。提案手法は,様々なドメイン適応設定に対して堅牢であり,迅速な適応アプリケーションシナリオや実環境展開に容易に組み込むことができる。
論文参考訳（メタデータ） (2021-12-09T15:10:47Z)
PVStereo: Pyramid Voting Module for End-to-End Self-Supervised Stereo Matching [14.603116313499648]
本稿では,ピラミッド投票モジュール(PVM)と,OptStereoと呼ばれる新しいDCNNアーキテクチャからなる,堅牢で効果的な自己監督型ステレオマッチング手法を提案する。具体的には、OptStereoは最初にマルチスケールのコストボリュームを構築し、その後、繰り返し単位を採用し、高分解能で不一致推定を反復的に更新します。 hkust-driveデータセット(大規模な合成ステレオデータセット)を、異なる照明条件と気象条件下で研究目的で収集した。
論文参考訳（メタデータ） (2021-03-12T05:27:14Z)
On the confidence of stereo matching in a deep-learning era: a quantitative evaluation [124.09613797008099]
ステレオマッチングにおける信頼度推定の分野における10年以上の発展を概観する。本研究では,異なるステレオアルゴリズムのプールに適用した場合と,最先端のディープステレオネットワークと組み合わせる場合とで,各測定値の異なる挙動について検討する。
論文参考訳（メタデータ） (2021-01-02T11:40:17Z)
Reversing the cycle: self-supervised deep stereo through enhanced monocular distillation [51.714092199995044]
多くの分野において、自己教師付き学習ソリューションは急速に進化し、教師付きアプローチでギャップを埋めている。本稿では,両者の相互関係を逆転する自己教師型パラダイムを提案する。深層ステレオネットワークを訓練するために,単分子完備ネットワークを通じて知識を抽出する。
論文参考訳（メタデータ） (2020-08-17T07:40:22Z)
Self-adapting confidence estimation for stereo [48.56220165347967]
本稿では,ステレオアルゴリズムやネットワークに自己適応的な信頼度推定を可能にする,フレキシブルで軽量なソリューションを提案する。当社の戦略は,ステレオシステムとのシームレスな統合を可能にするだけでなく,その自己適応能力によって,現場でのアウト・オブ・ザ・ボックス(out-of-the-box)デプロイメントも実現しています。
論文参考訳（メタデータ） (2020-08-14T16:17:28Z)
AdaStereo: A Simple and Efficient Approach for Adaptive Stereo Matching [50.06646151004375]
AdaStereoと呼ばれる新しいドメイン適応パイプラインは、ディープステレオマッチングネットワークにマルチレベル表現をアライメントすることを目的としている。我々のAdaStereoモデルは、KITTI、Middlebury、ETH3D、DrivingStereoなど、複数のステレオベンチマークで最先端のクロスドメインパフォーマンスを実現しています。
論文参考訳（メタデータ） (2020-04-09T16:15:13Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。