論文の概要: RAFT-Stereo: Multilevel Recurrent Field Transforms for Stereo Matching
- arxiv url: http://arxiv.org/abs/2109.07547v1
- Date: Wed, 15 Sep 2021 19:27:31 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-17 13:59:57.500163
- Title: RAFT-Stereo: Multilevel Recurrent Field Transforms for Stereo Matching
- Title(参考訳): RAFT-Stereo:ステレオマッチングのためのマルチレベルリカレントフィールド変換
- Authors: Lahav Lipson, Zachary Teed, Jia Deng
- Abstract要約: RAFT-Stereoは,光学フローネットワークRAFTをベースとした修正ステレオのための新しい深層アーキテクチャである。
画像間でより効率的に情報を伝達する多レベル畳み込みGRUを導入する。
RAFT-Stereoの修正版は正確なリアルタイム推論を行うことができる。
- 参考スコア(独自算出の注目度): 60.44903340167672
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce RAFT-Stereo, a new deep architecture for rectified stereo based
on the optical flow network RAFT. We introduce multi-level convolutional GRUs,
which more efficiently propagate information across the image. A modified
version of RAFT-Stereo can perform accurate real-time inference. RAFT-stereo
ranks first on the Middlebury leaderboard, outperforming the next best method
on 1px error by 29% and outperforms all published work on the ETH3D two-view
stereo benchmark. Code is available at
https://github.com/princeton-vl/RAFT-Stereo.
- Abstract(参考訳): RAFT-Stereoは,光学フローネットワークRAFTをベースとした修正ステレオの新しい深層アーキテクチャである。
画像間でより効率的に情報を伝達する多レベル畳み込みGRUを導入する。
RAFT-Stereoの修正版は正確なリアルタイム推論を行うことができる。
raft-stereo は middlebury leaderboard で第1位にランクインし、1px error の次のベストメソッドを29%上回り、eth3d two-view stereo ベンチマークで公表された全作品を上回った。
コードはhttps://github.com/princeton-vl/RAFT-Stereoで入手できる。
関連論文リスト
- UniTT-Stereo: Unified Training of Transformer for Enhanced Stereo Matching [18.02254687807291]
UniTT-StereoはTransformerベースのステレオアーキテクチャの可能性を最大化する手法である。
UniTT-Stereoの最先端性能は、ETH3D、KITTI 2012、KITTI 2015データセットなどの様々なベンチマークで検証されている。
論文 参考訳(メタデータ) (2024-09-04T09:02:01Z) - RomniStereo: Recurrent Omnidirectional Stereo Matching [6.153793254880079]
本稿では,全方向ステレオマッチング (RomniStereo) アルゴリズムを提案する。
我々の最良のモデルは、以前のSOTAベースラインよりも平均MAE値が40.7%向上する。
結果の可視化では, 合成例と実例の両方において, 明らかな優位性を示す。
論文 参考訳(メタデータ) (2024-01-09T04:06:01Z) - OpenStereo: A Comprehensive Benchmark for Stereo Matching and Strong Baseline [25.4712469033627]
我々はOpenStereoと呼ばれるフレキシブルで効率的なステレオマッチングを開発する。
OpenStereoには10以上のネットワークモデルのトレーニングと推論コードが含まれている。
我々は, 立体マッチングにおける最近の展開の総合的分析とデコンストラクションを, 包括的アブレーション実験を通じて実施する。
私たちのStereoBaseは、SceneFlow、KITTI 2015、2012(Reflective)で第1位であり、すべてのメトリクスで最高のパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2023-12-01T04:35:47Z) - Multiview Stereo with Cascaded Epipolar RAFT [73.7619703879639]
複数の校正画像から高密度点雲などの3次元モデルを再構成する重要な3次元視覚課題であるマルチビューステレオ(MVS)に対処する。
CER-MVSは、RAFT(Recurrent All-Pairs Field Transforms)アーキテクチャに基づく光学フローのための新しいアプローチであるCER-MVSを提案する。CER-MVSは、RAFTに5つの新しい変更を加える: エピポーラコストボリューム、コストボリュームカスケード、コストボリュームのマルチビュー融合、動的監視、深度マップのマルチ解像度融合。
論文 参考訳(メタデータ) (2022-05-09T18:17:05Z) - AdaStereo: An Efficient Domain-Adaptive Stereo Matching Approach [50.855679274530615]
本稿では,AdaStereoというドメイン適応型アプローチを提案する。
我々のモデルは、KITTI、Middlebury、ETH3D、DrivingStereoなど、複数のベンチマークで最先端のクロスドメイン性能を実現している。
提案手法は,様々なドメイン適応設定に対して堅牢であり,迅速な適応アプリケーションシナリオや実環境展開に容易に組み込むことができる。
論文 参考訳(メタデータ) (2021-12-09T15:10:47Z) - Conditioning Trick for Training Stable GANs [70.15099665710336]
本稿では,GANトレーニング中の不安定性問題に対応するため,ジェネレータネットワークに正規性から逸脱する条件付け手法を提案する。
我々は、生成元をシュア分解のスペクトル領域で計算された実サンプルの正規化関数から逸脱するように強制する。
論文 参考訳(メタデータ) (2020-10-12T16:50:22Z) - AdaStereo: A Simple and Efficient Approach for Adaptive Stereo Matching [50.06646151004375]
AdaStereoと呼ばれる新しいドメイン適応パイプラインは、ディープステレオマッチングネットワークにマルチレベル表現をアライメントすることを目的としている。
我々のAdaStereoモデルは、KITTI、Middlebury、ETH3D、DrivingStereoなど、複数のステレオベンチマークで最先端のクロスドメインパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2020-04-09T16:15:13Z) - RAFT: Recurrent All-Pairs Field Transforms for Optical Flow [78.92562539905951]
光フローのための新しいディープネットワークアーキテクチャであるRAFT(Recurrent All-Pairs Field Transforms)を導入する。
RAFTは画素あたりの特徴を抽出し、すべての画素に対してマルチスケールの4D相関ボリュームを構築し、フローフィールドを反復的に更新する。
RAFTは最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2020-03-26T17:12:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。