論文の概要: Multi-scale Iterative Residuals for Fast and Scalable Stereo Matching
- arxiv url: http://arxiv.org/abs/2110.12769v1
- Date: Mon, 25 Oct 2021 09:54:17 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-26 16:41:47.184005
- Title: Multi-scale Iterative Residuals for Fast and Scalable Stereo Matching
- Title(参考訳): 高速かつスケーラブルなステレオマッチングのためのマルチスケール反復残差
- Authors: Kumail Raza, Ren\'e Schuster, Didier Stricker
- Abstract要約: 本稿では,このギャップを埋めるために,反復的マルチスケール粗粒微細化(iCFR)フレームワークを提案する。
マルチスケールのワープ機能を用いて,差分残差を推定し,コスト容積の差分探索範囲を最小限まで押し上げる。
最後に,マルチスケールアプローチに固有の精度の喪失を回復するために,改良ネットワークを適用した。
- 参考スコア(独自算出の注目度): 13.76996108304056
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Despite the remarkable progress of deep learning in stereo matching, there
exists a gap in accuracy between real-time models and slower state-of-the-art
models which are suitable for practical applications. This paper presents an
iterative multi-scale coarse-to-fine refinement (iCFR) framework to bridge this
gap by allowing it to adopt any stereo matching network to make it fast, more
efficient and scalable while keeping comparable accuracy. To reduce the
computational cost of matching, we use multi-scale warped features to estimate
disparity residuals and push the disparity search range in the cost volume to a
minimum limit. Finally, we apply a refinement network to recover the loss of
precision which is inherent in multi-scale approaches. We test our iCFR
framework by adopting the matching networks from state-of-the art GANet and
AANet. The result is 49$\times$ faster inference time compared to GANetdeep and
4$\times$ less memory consumption, with comparable error. Our best performing
network, which we call FRSNet is scalable even up to an input resolution of 6K
on a GTX 1080Ti, with inference time still below one second and comparable
accuracy to AANet+. It out-performs all real-time stereo methods and achieves
competitive accuracy on the KITTI benchmark.
- Abstract(参考訳): ステレオマッチングにおけるディープラーニングの顕著な進歩にもかかわらず、実際の応用に適したリアルタイムモデルと遅い最先端モデルの間には精度の差がある。
本稿では,このギャップを埋めるために,任意のステレオマッチングネットワークを導入し,高速で効率よく,かつスケーラブルな処理を実現する,反復的マルチスケール粗大化(iCFR)フレームワークを提案する。
マッチングの計算コストを削減するために,マルチスケールのワープ機能を用いて,差分残差を推定し,コスト容積の差分探索範囲を最小限に抑える。
最後に,マルチスケールアプローチに固有の精度の損失を回復するために,改良ネットワークを適用した。
我々は、最先端のGANetとAANetのマッチングネットワークを採用することで、iCFRフレームワークをテストする。
その結果は 49$\times$ GANetdeep と 4$\times$ より高速な推論時間となり、エラーは同等である。
私たちがfrsnetと呼んでいる最良のパフォーマンスネットワークは、gtx 1080tiの入力解像度6kまでスケーラブルで、推論時間は1秒以下で、aanet+と同等の精度です。
すべてのリアルタイムステレオメソッドを上回り、KITTIベンチマークで競合精度を達成する。
関連論文リスト
- Joint Pruning and Channel-wise Mixed-Precision Quantization for Efficient Deep Neural Networks [10.229120811024162]
ディープニューラルネットワーク(DNN)は、エッジデバイスへのデプロイメントに重大な課題をもたらす。
この問題に対処する一般的なアプローチは、プルーニングと混合精度量子化である。
そこで本研究では,軽量な勾配探索を用いて共同で適用するための新しい手法を提案する。
論文 参考訳(メタデータ) (2024-07-01T08:07:02Z) - FLIQS: One-Shot Mixed-Precision Floating-Point and Integer Quantization Search [50.07268323597872]
本稿では,整数浮動小数点モデルと低精度浮動小数点モデルの両方において再学習を不要とする,最初のワンショット混合量子化探索を提案する。
整数モデルでは、ImageNet上のResNet-18の精度を1.31%、ResNet-50の精度を0.90%向上させる。
従来のFP8モデルと比較して,新しい混合精度浮動小数点探索を探索し,最大0.98%改善した。
論文 参考訳(メタデータ) (2023-08-07T04:17:19Z) - Joint Channel and Weight Pruning for Model Acceleration on Moblie
Devices [37.51092726022731]
プルーニングは、計算資源の消費と精度のバランスをとるために広く採用されているプラクティスである。
We present a unified framework with Joint Channel pruning and Weight pruning (JCW)。
本稿では,JCW フレームワークに最適化された多目的進化アルゴリズムを開発した。
論文 参考訳(メタデータ) (2021-10-15T11:18:42Z) - OMPQ: Orthogonal Mixed Precision Quantization [64.59700856607017]
混合精度量子化は、ハードウェアの多重ビット幅演算を利用して、ネットワーク量子化の全ポテンシャルを解き放つ。
本稿では、整数プログラミングの損失と高い相関関係にあるネットワーク性の概念であるプロキシメトリックを最適化することを提案する。
このアプローチは、量子化精度にほとんど妥協することなく、検索時間と必要なデータ量を桁違いに削減する。
論文 参考訳(メタデータ) (2021-09-16T10:59:33Z) - Multi-Scale Cost Volumes Cascade Network for Stereo Matching [9.440848600106797]
従来手法とCNNを組み合わせたMSCVNetを提案する。
提案手法の有効性を実証し,精度を大幅に向上させる。
論文 参考訳(メタデータ) (2021-02-03T08:40:17Z) - ADCPNet: Adaptive Disparity Candidates Prediction Network for Efficient
Real-Time Stereo Matching [8.046317778069325]
粗粒度法は大規模ネットワークモデルのメモリ制約と速度制限を大幅に緩和した。
以前の粗大な設計では、粗大な格差マップを段階的に洗練するために、一定のオフセットと3つ以上のステージを使用する。
本稿では、より正確な不一致候補が提供される限り、より少ない段階で、粗い一致誤差を効率よく修正できると主張している。
論文 参考訳(メタデータ) (2020-11-18T01:18:52Z) - AQD: Towards Accurate Fully-Quantized Object Detection [94.06347866374927]
本稿では,浮動小数点演算を除去するために,AQDと呼ばれる高精度な量子化オブジェクト検出ソリューションを提案する。
我々のAQDは、非常に低ビットのスキームの下での完全精度と比較して、同等またはそれ以上の性能を実現しています。
論文 参考訳(メタデータ) (2020-07-14T09:07:29Z) - AANet: Adaptive Aggregation Network for Efficient Stereo Matching [33.39794232337985]
現在の最先端ステレオモデルは、ほとんどが高価な3D畳み込みに基づいている。
エッジフェットング問題を緩和するために,スパースポイントに基づくスケール内コストアグリゲーション手法を提案する。
また、従来のクロススケールなコスト集約アルゴリズムをニューラルネットワーク層に近似して、大きなテクスチャレス領域を処理する。
論文 参考訳(メタデータ) (2020-04-20T18:07:55Z) - Rethinking Differentiable Search for Mixed-Precision Neural Networks [83.55785779504868]
低ビット幅に量子化された重みとアクティベーションを持つ低精度ネットワークは、エッジデバイスでの推論を加速するために広く利用されている。
現在の解は均一であり、全てのフィルタに同じビット幅を使用する。
これは異なるフィルタの異なる感度を考慮せず、最適以下である。
混合精度ネットワークは、ビット幅を個々のフィルタ要求に調整することでこの問題に対処する。
論文 参考訳(メタデータ) (2020-04-13T07:02:23Z) - Triple Wins: Boosting Accuracy, Robustness and Efficiency Together by
Enabling Input-Adaptive Inference [119.19779637025444]
深層ネットワークは、(クリーンな自然画像の場合)正確さと(敵対的な摂動画像の場合)頑健さの相違に直面することを最近提案された。
本稿では,入力適応推論に関連するマルチエグジットネットワークについて検討し,モデル精度,ロバスト性,効率の最適化において「スイートポイント」を達成する上での強い期待を示す。
論文 参考訳(メタデータ) (2020-02-24T00:40:22Z) - Calibrating Deep Neural Networks using Focal Loss [77.92765139898906]
ミススキャリブレーション(Miscalibration)は、モデルの信頼性と正しさのミスマッチである。
焦点損失は、既に十分に校正されたモデルを学ぶことができることを示す。
ほぼすべてのケースにおいて精度を損なうことなく,最先端のキャリブレーションを達成できることを示す。
論文 参考訳(メタデータ) (2020-02-21T17:35:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。