論文の概要: Multi-Scale Cost Volumes Cascade Network for Stereo Matching
- arxiv url: http://arxiv.org/abs/2102.01940v1
- Date: Wed, 3 Feb 2021 08:40:17 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-04 23:30:24.647489
- Title: Multi-Scale Cost Volumes Cascade Network for Stereo Matching
- Title(参考訳): ステレオマッチングのためのマルチスケールコストボリュームカスケードネットワーク
- Authors: Xiaogang Jia, Wei Chen, Zhengfa Liang, Yusong Tan, Mingfei Wu
- Abstract要約: 従来手法とCNNを組み合わせたMSCVNetを提案する。
提案手法の有効性を実証し,精度を大幅に向上させる。
- 参考スコア(独自算出の注目度): 9.440848600106797
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Stereo matching is essential for robot navigation. However, the accuracy of
current widely used traditional methods is low, while methods based on CNN need
expensive computational cost and running time. This is because different cost
volumes play a crucial role in balancing speed and accuracy. Thus we propose
MSCVNet, which combines traditional methods and CNN to improve the quality of
cost volume. Concretely, our network first generates multiple 3D cost volumes
with different resolutions and then uses 2D convolutions to construct a novel
cascade hourglass network for cost aggregation. Meanwhile, we design an
algorithm to distinguish and calculate the loss for discontinuous areas of
disparity result. According to the KITTI official website, our network is much
faster than most top-performing methods(24*than CSPN, 44*than GANet, etc.).
Meanwhile, compared to traditional methods(SPS-St, SGM) and other real-time
stereo matching networks(Fast DS-CS, DispNetC, and RTSNet, etc.), our network
achieves a big improvement in accuracy, demonstrating the effectiveness of our
proposed method.
- Abstract(参考訳): ステレオマッチングはロボットナビゲーションに不可欠である。
しかし、現在広く使われている従来の手法の精度は低く、CNNに基づく手法は高価な計算コストと実行時間を必要とする。
これは、異なるコストボリュームが速度と精度のバランスにおいて重要な役割を果たすためである。
そこで、従来の手法とCNNを組み合わせたMSCVNetを提案し、コストボリュームの質を向上させます。
具体的には、まず異なる解像度で複数の3Dコストボリュームを生成し、次に2D畳み込みを用いてコストアグリゲーションのための新しいカスケード時間ガラスネットワークを構築する。
一方,不連続な不連続領域の損失を識別し計算するアルゴリズムを設計した。
KITTIの公式ウェブサイトによると、我々のネットワークは、ほとんどのトップパフォーマンスメソッド(24*than CSPN、44*than GANetなど)よりもはるかに高速です。
一方、従来の方法(SPS-St、SGM)や他のリアルタイムステレオマッチングネットワーク(Fast DS-CS、DispNetC、RTSNetなど)と比較して。
また,提案手法の有効性を示すため,ネットワークの精度が大幅に向上した。
関連論文リスト
- ACVNet: Attention Concatenation Volume for Accurate and Efficient Stereo
Matching [7.39503547452922]
本稿では,余剰情報を抑制するために,相関情報から注意重みを生成する新しいコストボリューム構築手法を提案する。
信頼性の高い注意重みを生成するため,マッチングコストの特異性を改善するため,マルチレベル適応パッチマッチングを提案する。
提案するコスト容積は、ほとんどのステレオマッチングネットワークにシームレスに組み込むことのできる注意結合容積 (ACV) と命名される。
論文 参考訳(メタデータ) (2022-03-04T06:28:58Z) - Multi-scale Iterative Residuals for Fast and Scalable Stereo Matching [13.76996108304056]
本稿では,このギャップを埋めるために,反復的マルチスケール粗粒微細化(iCFR)フレームワークを提案する。
マルチスケールのワープ機能を用いて,差分残差を推定し,コスト容積の差分探索範囲を最小限まで押し上げる。
最後に,マルチスケールアプローチに固有の精度の喪失を回復するために,改良ネットワークを適用した。
論文 参考訳(メタデータ) (2021-10-25T09:54:17Z) - DS-Net++: Dynamic Weight Slicing for Efficient Inference in CNNs and
Transformers [105.74546828182834]
本稿では,様々な難易度を持つ入力に対して,ネットワークパラメータの一部を適応的にスライスする動的ウェイトスライシングという,ハードウェア効率のよい動的推論方式を示す。
我々は、CNNのフィルタ数とCNNと変換器の多重次元を入力依存的に調整することで、動的スライム可能なネットワーク(DS-Net)と動的スライス可能なネットワーク(DS-Net++)を提案する。
論文 参考訳(メタデータ) (2021-09-21T09:57:21Z) - OMPQ: Orthogonal Mixed Precision Quantization [64.59700856607017]
混合精度量子化は、ハードウェアの多重ビット幅演算を利用して、ネットワーク量子化の全ポテンシャルを解き放つ。
本稿では、整数プログラミングの損失と高い相関関係にあるネットワーク性の概念であるプロキシメトリックを最適化することを提案する。
このアプローチは、量子化精度にほとんど妥協することなく、検索時間と必要なデータ量を桁違いに削減する。
論文 参考訳(メタデータ) (2021-09-16T10:59:33Z) - Greedy Network Enlarging [53.319011626986004]
本稿では,計算のリアルタイム化に基づくグリーディ・ネットワーク拡大手法を提案する。
異なる段階の計算をステップバイステップで修正することで、拡張されたネットワークはMACの最適な割り当てと利用を提供する。
GhostNetへの我々の手法の適用により、最先端の80.9%と84.3%のImageNet Top-1アキュラシーを実現する。
論文 参考訳(メタデータ) (2021-07-31T08:36:30Z) - MutualNet: Adaptive ConvNet via Mutual Learning from Different Model
Configurations [51.85020143716815]
MutualNetは、リソース制約の多様なセットで実行できる単一のネットワークを訓練するために提案します。
提案手法は,様々なネットワーク幅と入力解像度を持つモデル構成のコホートを訓練する。
MutualNetは、さまざまなネットワーク構造に適用できる一般的なトレーニング方法論です。
論文 参考訳(メタデータ) (2021-05-14T22:30:13Z) - Learning Frequency-aware Dynamic Network for Efficient Super-Resolution [56.98668484450857]
本稿では、離散コサイン変換(dct)領域の係数に応じて入力を複数の部分に分割する新しい周波数認識動的ネットワークについて検討する。
実際、高周波部は高価な操作で処理され、低周波部は計算負荷を軽減するために安価な操作が割り当てられる。
ベンチマークSISRモデルおよびデータセット上での実験は、周波数認識動的ネットワークが様々なSISRニューラルネットワークに使用できることを示している。
論文 参考訳(メタデータ) (2021-03-15T12:54:26Z) - ES-Net: An Efficient Stereo Matching Network [4.8986598953553555]
既存のステレオマッチングネットワークは通常、性能を改善するために遅くて計算コストのかかる3D畳み込みを使用する。
本稿では,高性能かつ効率的な推定を実現する効率的なステレオネットワーク(esnet)を提案する。
論文 参考訳(メタデータ) (2021-03-05T20:11:39Z) - Bilateral Grid Learning for Stereo Matching Networks [22.92443311789097]
本稿では,学習したバイラテラルグリッドにおけるスライシング操作に基づくエッジ保存コストボリュームアップサンプリングモジュールを提案する。
スライス層はパラメータフリーで、高品質の高解像度のコストボリュームを得ることができます。
このモジュールをベースとしたリアルタイムネットワークを設計し、既存のリアルタイムなディープステレオマッチングネットワークより優れています。
論文 参考訳(メタデータ) (2021-01-01T09:08:01Z) - Multi-view Depth Estimation using Epipolar Spatio-Temporal Networks [87.50632573601283]
一つのビデオから多視点深度を推定する新しい手法を提案する。
提案手法は,新しいEpipolar Spatio-Temporal Transformer(EST)を用いて時間的コヒーレントな深度推定を行う。
最近のMixture-of-Expertsモデルにインスパイアされた計算コストを削減するため、我々はコンパクトなハイブリッドネットワークを設計する。
論文 参考訳(メタデータ) (2020-11-26T04:04:21Z) - AANet: Adaptive Aggregation Network for Efficient Stereo Matching [33.39794232337985]
現在の最先端ステレオモデルは、ほとんどが高価な3D畳み込みに基づいている。
エッジフェットング問題を緩和するために,スパースポイントに基づくスケール内コストアグリゲーション手法を提案する。
また、従来のクロススケールなコスト集約アルゴリズムをニューラルネットワーク層に近似して、大きなテクスチャレス領域を処理する。
論文 参考訳(メタデータ) (2020-04-20T18:07:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。