論文の概要: Bilateral Grid Learning for Stereo Matching Networks
- arxiv url: http://arxiv.org/abs/2101.01601v2
- Date: Mon, 29 Mar 2021 02:43:10 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-16 11:08:41.955905
- Title: Bilateral Grid Learning for Stereo Matching Networks
- Title(参考訳): ステレオマッチングネットワークのためのバイラテラルグリッド学習
- Authors: Bin Xu, Yuhua Xu, Xiaoli Yang, Wei Jia, Yulan Guo
- Abstract要約: 本稿では,学習したバイラテラルグリッドにおけるスライシング操作に基づくエッジ保存コストボリュームアップサンプリングモジュールを提案する。
スライス層はパラメータフリーで、高品質の高解像度のコストボリュームを得ることができます。
このモジュールをベースとしたリアルタイムネットワークを設計し、既存のリアルタイムなディープステレオマッチングネットワークより優れています。
- 参考スコア(独自算出の注目度): 22.92443311789097
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Real-time performance of stereo matching networks is important for many
applications, such as automatic driving, robot navigation and augmented reality
(AR). Although significant progress has been made in stereo matching networks
in recent years, it is still challenging to balance real-time performance and
accuracy. In this paper, we present a novel edge-preserving cost volume
upsampling module based on the slicing operation in the learned bilateral grid.
The slicing layer is parameter-free, which allows us to obtain a high quality
cost volume of high resolution from a low-resolution cost volume under the
guide of the learned guidance map efficiently. The proposed cost volume
upsampling module can be seamlessly embedded into many existing stereo matching
networks, such as GCNet, PSMNet, and GANet. The resulting networks are
accelerated several times while maintaining comparable accuracy. Furthermore,
we design a real-time network (named BGNet) based on this module, which
outperforms existing published real-time deep stereo matching networks, as well
as some complex networks on the KITTI stereo datasets. The code is available at
https://github.com/YuhuaXu/BGNet.
- Abstract(参考訳): ステレオマッチングネットワークのリアルタイム性能は、自動走行、ロボットナビゲーション、拡張現実(AR)など多くのアプリケーションにとって重要である。
近年,ステレオマッチングネットワークは大きな進歩を遂げているが,リアルタイム性能と精度のバランスをとることは依然として困難である。
本稿では,学習用二元格子におけるスライシング操作に基づく,エッジ保存型コストアップサンプリングモジュールを提案する。
スライシング層はパラメータフリーであり、学習ガイドマップのガイドの下、低解像度のコストボリュームから高分解能の高品質なコストボリュームを効率的に得ることができる。
提案するボリュームアップサンプリングモジュールは,GCNet, PSMNet, GANetなどの既存のステレオマッチングネットワークにシームレスに組み込むことができる。
結果として得られるネットワークは、同等の精度を維持しながら、数回加速される。
さらに,本モジュールをベースとしたリアルタイムネットワーク(BGNet)を設計し,既存のリアルタイムステレオマッチングネットワークや,KITTIステレオデータセット上の複雑なネットワークより優れていることを示す。
コードはhttps://github.com/YuhuaXu/BGNetで入手できる。
関連論文リスト
- ACVNet: Attention Concatenation Volume for Accurate and Efficient Stereo
Matching [7.39503547452922]
本稿では,余剰情報を抑制するために,相関情報から注意重みを生成する新しいコストボリューム構築手法を提案する。
信頼性の高い注意重みを生成するため,マッチングコストの特異性を改善するため,マルチレベル適応パッチマッチングを提案する。
提案するコスト容積は、ほとんどのステレオマッチングネットワークにシームレスに組み込むことのできる注意結合容積 (ACV) と命名される。
論文 参考訳(メタデータ) (2022-03-04T06:28:58Z) - Dynamic Slimmable Denoising Network [64.77565006158895]
DDSNet(Dynamic Slimmable Denoising Network)は、計算量が少なくて優れたDenoising品質を実現するための一般的な手法である。
OurNetには動的ゲートによる動的推論の能力が備わっている。
我々の実験は、最先端の個別に訓練された静的 denoising ネットワークよりも一貫して優れています。
論文 参考訳(メタデータ) (2021-10-17T22:45:33Z) - AA-RMVSNet: Adaptive Aggregation Recurrent Multi-view Stereo Network [8.127449025802436]
本稿では,AA-RMVSNetというアダプティブアグリゲーションを備えた長短期記憶(LSTM)に基づく,新しいマルチビューステレオネットワークを提案する。
まず、コンテキスト認識の畳み込みとマルチスケールアグリゲーションを用いて、画像の特徴を適応的に抽出するビュー内アグリゲーションモジュールを提案する。
本稿では,すべてのビューにおいて,より整合性のあるペアを保存可能な,適応的なピクセルワイドビューアグリゲーションのためのビュー間コストボリュームアグリゲーションモジュールを提案する。
論文 参考訳(メタデータ) (2021-08-09T06:10:48Z) - MutualNet: Adaptive ConvNet via Mutual Learning from Different Model
Configurations [51.85020143716815]
MutualNetは、リソース制約の多様なセットで実行できる単一のネットワークを訓練するために提案します。
提案手法は,様々なネットワーク幅と入力解像度を持つモデル構成のコホートを訓練する。
MutualNetは、さまざまなネットワーク構造に適用できる一般的なトレーニング方法論です。
論文 参考訳(メタデータ) (2021-05-14T22:30:13Z) - Bit-Mixer: Mixed-precision networks with runtime bit-width selection [72.32693989093558]
Bit-Mixerは、テスト時間中に任意のレイヤが入札幅を変更し、ネットワーク全体の精度の高い推論能力に影響を与えることなく、メタ量子ネットワークをトレーニングする最初の方法である。
本手法は, デバイス上での展開に望ましい柔軟性を示す複合精密ネットワークを, 精度を犠牲にすることなく実現できることを示した。
論文 参考訳(メタデータ) (2021-03-31T17:58:47Z) - Learning Frequency-aware Dynamic Network for Efficient Super-Resolution [56.98668484450857]
本稿では、離散コサイン変換(dct)領域の係数に応じて入力を複数の部分に分割する新しい周波数認識動的ネットワークについて検討する。
実際、高周波部は高価な操作で処理され、低周波部は計算負荷を軽減するために安価な操作が割り当てられる。
ベンチマークSISRモデルおよびデータセット上での実験は、周波数認識動的ネットワークが様々なSISRニューラルネットワークに使用できることを示している。
論文 参考訳(メタデータ) (2021-03-15T12:54:26Z) - ES-Net: An Efficient Stereo Matching Network [4.8986598953553555]
既存のステレオマッチングネットワークは通常、性能を改善するために遅くて計算コストのかかる3D畳み込みを使用する。
本稿では,高性能かつ効率的な推定を実現する効率的なステレオネットワーク(esnet)を提案する。
論文 参考訳(メタデータ) (2021-03-05T20:11:39Z) - Multi-Scale Cost Volumes Cascade Network for Stereo Matching [9.440848600106797]
従来手法とCNNを組み合わせたMSCVNetを提案する。
提案手法の有効性を実証し,精度を大幅に向上させる。
論文 参考訳(メタデータ) (2021-02-03T08:40:17Z) - Dense Hybrid Recurrent Multi-view Stereo Net with Dynamic Consistency
Checking [54.58791377183574]
1)DRENet(Dense Reception Expanded)モジュールで,原サイズの密集した特徴マップをマルチスケールのコンテキスト情報で抽出し,2)HU-LSTM(Hybrid U-LSTM)を用いて3次元マッチングボリュームを予測深度マップに変換する。
R-MVSNetのメモリ消費は19.4%しかかからないが,本手法は最先端の手法と競合する性能を示し,メモリ消費を劇的に削減する。
論文 参考訳(メタデータ) (2020-07-21T14:59:59Z) - Continual Adaptation for Deep Stereo [52.181067640300014]
本稿では,難易度と変化の激しい環境に対処するために,深層ステレオネットワークの継続的適応パラダイムを提案する。
我々のパラダイムでは、オンラインモデルに継続的に適応するために必要な学習信号は、右から左への画像ワープや従来のステレオアルゴリズムによって自己監督から得られる。
我々のネットワークアーキテクチャと適応アルゴリズムは、初めてのリアルタイム自己適応型ディープステレオシステムを実現する。
論文 参考訳(メタデータ) (2020-07-10T08:15:58Z) - AANet: Adaptive Aggregation Network for Efficient Stereo Matching [33.39794232337985]
現在の最先端ステレオモデルは、ほとんどが高価な3D畳み込みに基づいている。
エッジフェットング問題を緩和するために,スパースポイントに基づくスケール内コストアグリゲーション手法を提案する。
また、従来のクロススケールなコスト集約アルゴリズムをニューラルネットワーク層に近似して、大きなテクスチャレス領域を処理する。
論文 参考訳(メタデータ) (2020-04-20T18:07:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。