論文の概要: Efficient Neighbourhood Consensus Networks via Submanifold Sparse
Convolutions
- arxiv url: http://arxiv.org/abs/2004.10566v1
- Date: Wed, 22 Apr 2020 13:37:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-10 18:33:49.127247
- Title: Efficient Neighbourhood Consensus Networks via Submanifold Sparse
Convolutions
- Title(参考訳): submanifold sparse 畳み込みによる効率的な近隣コンセンサスネットワーク
- Authors: Ignacio Rocco, Relja Arandjelovi\'c, Josef Sivic
- Abstract要約: 我々は,難解な対応問題に対して有望な性能を実証した近頃のNeighbourhood Consensus Networksを採用する。
メモリ消費の増大, 推論時間の増加, ローカル化の不十分さなど, 主な制約を克服する修正を提案する。
提案した修正により、メモリフットプリントと実行時間が10ドル以上削減され、同じ結果が得られます。
- 参考スコア(独自算出の注目度): 41.43309123350792
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this work we target the problem of estimating accurately localised
correspondences between a pair of images. We adopt the recent Neighbourhood
Consensus Networks that have demonstrated promising performance for difficult
correspondence problems and propose modifications to overcome their main
limitations: large memory consumption, large inference time and poorly
localised correspondences. Our proposed modifications can reduce the memory
footprint and execution time more than $10\times$, with equivalent results.
This is achieved by sparsifying the correlation tensor containing tentative
matches, and its subsequent processing with a 4D CNN using submanifold sparse
convolutions. Localisation accuracy is significantly improved by processing the
input images in higher resolution, which is possible due to the reduced memory
footprint, and by a novel two-stage correspondence relocalisation module. The
proposed Sparse-NCNet method obtains state-of-the-art results on the HPatches
Sequences and InLoc visual localisation benchmarks, and competitive results in
the Aachen Day-Night benchmark.
- Abstract(参考訳): 本研究では,画像間の局所的対応を正確に推定する問題を対象とする。
我々は,最近の近所のコンセンサスネットワークを採用し,困難な対応問題に対して有望な性能を示すとともに,その主な制限を克服するための修正を提案する。
提案した修正により、メモリフットプリントと実行時間を10\times$以上削減できる。
これは、仮一致を含む相関テンソルと、それに続くサブマニフォールドスパース畳み込みを用いた4次元CNNで処理することで実現される。
メモリフットプリントの削減により可能となる高解像度の入力画像を処理し、新しい2段階対応再ローカライゼーションモジュールによって、ローカライズ精度を大幅に向上する。
提案手法は,HPatches Sequences と InLoc のビジュアルローカライゼーションベンチマーク,および Aachen Day-Night ベンチマークの競合結果に対して,最先端の結果を得る。
関連論文リスト
- AdaBM: On-the-Fly Adaptive Bit Mapping for Image Super-Resolution [53.23803932357899]
我々は、処理時間を数時間から秒に短縮する最初のオンザフライ適応量子化フレームワークを導入する。
我々は,従来の適応量子化法と競合する性能を実現し,処理時間をx2000で高速化する。
論文 参考訳(メタデータ) (2024-04-04T08:37:27Z) - Scale-Aware Crowd Count Network with Annotation Error Correction [19.036693336902662]
従来のクラウドカウントネットワークは、プール層を通じてフィーチャーマップがダウンサイズされると、情報損失に悩まされる。
本稿では,ノイズの多いアノテーションの誤り訂正機能を備えたスケール・アウェア・アーキテクチャを導入するスケール・アウェア・クラウドカウンティング・ネットワーク(SACC-Net)を提案する。
論文 参考訳(メタデータ) (2023-12-28T01:36:38Z) - Deep Multi-Threshold Spiking-UNet for Image Processing [51.88730892920031]
本稿では,SNN(Spike Neural Networks)とU-Netアーキテクチャを組み合わせた,画像処理のためのスパイキング-UNetの概念を紹介する。
効率的なスパイキング-UNetを実現するためには,スパイクによる高忠実度情報伝播の確保と,効果的なトレーニング戦略の策定という2つの課題に直面する。
実験の結果,画像のセグメンテーションとデノイングにおいて,スパイキングUNetは非スパイキングと同等の性能を発揮することがわかった。
論文 参考訳(メタデータ) (2023-07-20T16:00:19Z) - SqueezeLLM: Dense-and-Sparse Quantization [80.32162537942138]
LLMにおける生成推論の主なボトルネックは、単一のバッチ推論のための計算ではなく、メモリ帯域幅である。
学習後量子化フレームワークであるSqueezeLLMを導入し、最大3ビットの超低精度でのロスレス圧縮を実現する。
本フレームワークは,2次情報に基づく最適ビット精度割当を探索する感度ベース非一様量子化法と,2次情報に基づくDense-and-Sparse分解法と,2次情報量割当値と感度重み値を効率的にスパース形式で格納するDense-and-Sparse分解法である。
論文 参考訳(メタデータ) (2023-06-13T08:57:54Z) - Improving Transformer-based Image Matching by Cascaded Capturing
Spatially Informative Keypoints [44.90917854990362]
変換器を用いたカスケードマッチングモデル -- Cascade Feature Matching TRansformer (CasMTR) を提案する。
我々は、信頼性マップを通じてキーポイントをフィルタリングするために、単純で効果的な非最大抑圧(NMS)後処理を使用する。
CasMTRは、室内および屋外のポーズ推定および視覚的位置推定において最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-03-06T04:32:34Z) - DeepSplit: Scalable Verification of Deep Neural Networks via Operator
Splitting [70.62923754433461]
入力摂動に対するディープニューラルネットワークの最悪の性能を分析することは、大規模な非最適化問題の解決につながる。
解析解を持つ小さなサブプロブレムに分割することで,問題の凸緩和を直接高精度に解ける新しい手法を提案する。
論文 参考訳(メタデータ) (2021-06-16T20:43:49Z) - $\mathbb{X}$Resolution Correspondence Networks [15.214155342197474]
本稿では,照明変化や視点変化,スタイルの違いに挑戦しながら,重なり合う視野を持つ対の像間の正確な密接な対応を確立することを目的とする。
論文 参考訳(メタデータ) (2020-12-17T18:57:58Z) - Improving accuracy and speeding up Document Image Classification through
parallel systems [4.102028235659611]
RVL-CDIPデータセットで、より軽量なモデルで以前の結果を改善することができることを示す。
画像入力のみを増強できるアンサンブルパイプラインを提案する。
最後に、PyTorchとDeep Learningフレームワーク間のトレーニングパフォーマンスの違いを明らかにします。
論文 参考訳(メタデータ) (2020-06-16T13:36:07Z) - Image Fine-grained Inpainting [89.17316318927621]
拡張畳み込みの密結合を利用してより大きく効果的な受容場を得る一段階モデルを提案する。
この効率的なジェネレータをよく訓練するために、頻繁に使用されるVGG特徴整合損失を除いて、新しい自己誘導回帰損失を設計する。
また、局所的・グローバルな分枝を持つ識別器を用いて、局所的・グローバルな内容の整合性を確保する。
論文 参考訳(メタデータ) (2020-02-07T03:45:25Z) - Compression of descriptor models for mobile applications [26.498907514590165]
深層ニューラルネットワークにおける計算コスト,モデルサイズ,マッチング精度のトレードオフを評価する。
我々は、深度的に分離可能な層を用いることで、学習重量の顕著な冗長性を観察する。
本稿では,標準的な畳み込みと奥行き分離可能な畳み込みを補間する手段を提供する,畳み込み-Depthwise-Pointwise(CDP)層を提案する。
論文 参考訳(メタデータ) (2020-01-09T17:00:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。