論文の概要: DCVSMNet: Double Cost Volume Stereo Matching Network
- arxiv url: http://arxiv.org/abs/2402.16473v2
- Date: Sun, 20 Oct 2024 10:24:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-22 13:12:22.844960
- Title: DCVSMNet: Double Cost Volume Stereo Matching Network
- Title(参考訳): DCVSMNet:ダブルコストボリュームステレオマッチングネットワーク
- Authors: Mahmoud Tahmasebi, Saif Huq, Kevin Meehan, Marion McAfee,
- Abstract要約: DCVSMNetは67msの推論時間と強力な一般化能力を備えた高速ステレオマッチングネットワークである。
いくつかのベンチマークデータセットの結果から、DCVSMNetは、CGI-StereoやBGNetのような手法よりも、推論時間が高いコストで精度が高いことが示されている。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: We introduce Double Cost Volume Stereo Matching Network(DCVSMNet) which is a novel architecture characterised by by two small upper (group-wise) and lower (norm correlation) cost volumes. Each cost volume is processed separately, and a coupling module is proposed to fuse the geometry information extracted from the upper and lower cost volumes. DCVSMNet is a fast stereo matching network with a 67 ms inference time and strong generalization ability which can produce competitive results compared to state-of-the-art methods. The results on several bench mark datasets show that DCVSMNet achieves better accuracy than methods such as CGI-Stereo and BGNet at the cost of greater inference time.
- Abstract(参考訳): DCVSMNet(Double Cost Volume Stereo Matching Network)は,2つの小(グループワイド)と低(ノーム相関)のコストボリュームを特徴とする新しいアーキテクチャである。
各コストボリュームは別々に処理され、上と下のコストボリュームから抽出された幾何情報を融合させる結合モジュールが提案される。
DCVSMNetは67msの推論時間と強力な一般化能力を備えた高速ステレオマッチングネットワークであり、最先端の手法と比較して競合する結果が得られる。
いくつかのベンチマークデータセットの結果から、DCVSMNetは、CGI-StereoやBGNetのような手法よりも、推論時間が高いコストで精度が高いことが示されている。
関連論文リスト
- Dr$^2$Net: Dynamic Reversible Dual-Residual Networks for Memory-Efficient Finetuning [81.0108753452546]
本稿では,メモリ消費を大幅に削減した事前学習モデルを微調整するために,動的可逆2次元ネットワーク(Dr$2$Net)を提案する。
Dr$2$Netは2種類の残差接続を含み、1つは事前訓練されたモデルの残差構造を維持し、もう1つはネットワークを可逆的にしている。
Dr$2$Netは従来の微調整に匹敵する性能を持つが、メモリ使用量は大幅に少ない。
論文 参考訳(メタデータ) (2024-01-08T18:59:31Z) - ACVNet: Attention Concatenation Volume for Accurate and Efficient Stereo
Matching [7.39503547452922]
本稿では,余剰情報を抑制するために,相関情報から注意重みを生成する新しいコストボリューム構築手法を提案する。
信頼性の高い注意重みを生成するため,マッチングコストの特異性を改善するため,マルチレベル適応パッチマッチングを提案する。
提案するコスト容積は、ほとんどのステレオマッチングネットワークにシームレスに組み込むことのできる注意結合容積 (ACV) と命名される。
論文 参考訳(メタデータ) (2022-03-04T06:28:58Z) - AdaStereo: An Efficient Domain-Adaptive Stereo Matching Approach [50.855679274530615]
本稿では,AdaStereoというドメイン適応型アプローチを提案する。
我々のモデルは、KITTI、Middlebury、ETH3D、DrivingStereoなど、複数のベンチマークで最先端のクロスドメイン性能を実現している。
提案手法は,様々なドメイン適応設定に対して堅牢であり,迅速な適応アプリケーションシナリオや実環境展開に容易に組み込むことができる。
論文 参考訳(メタデータ) (2021-12-09T15:10:47Z) - Multi-scale Iterative Residuals for Fast and Scalable Stereo Matching [13.76996108304056]
本稿では,このギャップを埋めるために,反復的マルチスケール粗粒微細化(iCFR)フレームワークを提案する。
マルチスケールのワープ機能を用いて,差分残差を推定し,コスト容積の差分探索範囲を最小限まで押し上げる。
最後に,マルチスケールアプローチに固有の精度の喪失を回復するために,改良ネットワークを適用した。
論文 参考訳(メタデータ) (2021-10-25T09:54:17Z) - DS-Net++: Dynamic Weight Slicing for Efficient Inference in CNNs and
Transformers [105.74546828182834]
本稿では,様々な難易度を持つ入力に対して,ネットワークパラメータの一部を適応的にスライスする動的ウェイトスライシングという,ハードウェア効率のよい動的推論方式を示す。
我々は、CNNのフィルタ数とCNNと変換器の多重次元を入力依存的に調整することで、動的スライム可能なネットワーク(DS-Net)と動的スライス可能なネットワーク(DS-Net++)を提案する。
論文 参考訳(メタデータ) (2021-09-21T09:57:21Z) - MutualNet: Adaptive ConvNet via Mutual Learning from Different Model
Configurations [51.85020143716815]
MutualNetは、リソース制約の多様なセットで実行できる単一のネットワークを訓練するために提案します。
提案手法は,様々なネットワーク幅と入力解像度を持つモデル構成のコホートを訓練する。
MutualNetは、さまざまなネットワーク構造に適用できる一般的なトレーニング方法論です。
論文 参考訳(メタデータ) (2021-05-14T22:30:13Z) - Multi-Scale Cost Volumes Cascade Network for Stereo Matching [9.440848600106797]
従来手法とCNNを組み合わせたMSCVNetを提案する。
提案手法の有効性を実証し,精度を大幅に向上させる。
論文 参考訳(メタデータ) (2021-02-03T08:40:17Z) - Bilateral Grid Learning for Stereo Matching Networks [22.92443311789097]
本稿では,学習したバイラテラルグリッドにおけるスライシング操作に基づくエッジ保存コストボリュームアップサンプリングモジュールを提案する。
スライス層はパラメータフリーで、高品質の高解像度のコストボリュームを得ることができます。
このモジュールをベースとしたリアルタイムネットワークを設計し、既存のリアルタイムなディープステレオマッチングネットワークより優れています。
論文 参考訳(メタデータ) (2021-01-01T09:08:01Z) - Dense Hybrid Recurrent Multi-view Stereo Net with Dynamic Consistency
Checking [54.58791377183574]
1)DRENet(Dense Reception Expanded)モジュールで,原サイズの密集した特徴マップをマルチスケールのコンテキスト情報で抽出し,2)HU-LSTM(Hybrid U-LSTM)を用いて3次元マッチングボリュームを予測深度マップに変換する。
R-MVSNetのメモリ消費は19.4%しかかからないが,本手法は最先端の手法と競合する性能を示し,メモリ消費を劇的に削減する。
論文 参考訳(メタデータ) (2020-07-21T14:59:59Z) - AdaStereo: A Simple and Efficient Approach for Adaptive Stereo Matching [50.06646151004375]
AdaStereoと呼ばれる新しいドメイン適応パイプラインは、ディープステレオマッチングネットワークにマルチレベル表現をアライメントすることを目的としている。
我々のAdaStereoモデルは、KITTI、Middlebury、ETH3D、DrivingStereoなど、複数のステレオベンチマークで最先端のクロスドメインパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2020-04-09T16:15:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。