論文の概要: Aggregating Multiple Bio-Inspired Image Region Classifiers For Effective
And Lightweight Visual Place Recognition
- arxiv url: http://arxiv.org/abs/2312.12995v1
- Date: Wed, 20 Dec 2023 12:57:01 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-21 15:41:47.463041
- Title: Aggregating Multiple Bio-Inspired Image Region Classifiers For Effective
And Lightweight Visual Place Recognition
- Title(参考訳): バイオインスパイアされた複数画像領域分類器の有効かつ軽量な視覚的位置認識への応用
- Authors: Bruno Arcanjo, Bruno Ferrarini, Maria Fasli, Michael Milford, Klaus D.
McDonald-Maier and Shoaib Ehsan
- Abstract要約: 本稿では,VPR性能を大幅に改善したRereaDrosoNetと呼ばれる,新しいマルチDrosoNetローカライゼーションシステムを提案する。
我々のアプローチは、DrosoNetsの異なるグループを原画像の異なる分割分割に特化することに依存している。
我々は,全てのDrosoNetの出力を最終位置予測に組み合わせるための新しい投票モジュールを導入する。
- 参考スコア(独自算出の注目度): 22.09628302234166
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Visual place recognition (VPR) enables autonomous systems to localize
themselves within an environment using image information. While VPR techniques
built upon a Convolutional Neural Network (CNN) backbone dominate
state-of-the-art VPR performance, their high computational requirements make
them unsuitable for platforms equipped with low-end hardware. Recently, a
lightweight VPR system based on multiple bio-inspired classifiers, dubbed
DrosoNets, has been proposed, achieving great computational efficiency at the
cost of reduced absolute place retrieval performance. In this work, we propose
a novel multi-DrosoNet localization system, dubbed RegionDrosoNet, with
significantly improved VPR performance, while preserving a low-computational
profile. Our approach relies on specializing distinct groups of DrosoNets on
differently sliced partitions of the original image, increasing extrinsic model
differentiation. Furthermore, we introduce a novel voting module to combine the
outputs of all DrosoNets into the final place prediction which considers
multiple top refence candidates from each DrosoNet. RegionDrosoNet outperforms
other lightweight VPR techniques when dealing with both appearance changes and
viewpoint variations. Moreover, it competes with computationally expensive
methods on some benchmark datasets at a small fraction of their online
inference time.
- Abstract(参考訳): 視覚的位置認識(VPR)は、自律システムが画像情報を用いて環境内をローカライズすることを可能にする。
畳み込みニューラルネットワーク(CNN)のバックボーン上に構築されたVPR技術は、最先端のVPR性能を支配しているが、その高い計算要求により、ローエンドハードウェアを搭載したプラットフォームには適さない。
近年,DrosoNetsと呼ばれる複数のバイオインスパイアされた分類器をベースとした軽量なVPRシステムが提案され,絶対位置検索性能の低下による計算効率の向上が図られている。
本研究では,低計算プロファイルを保ちながら,VPR性能を著しく向上した領域DrosoNetと呼ばれる新しいマルチDrosoNetローカライズシステムを提案する。
我々のアプローチは、DrosoNetsの異なるグループを原画像の異なる分割分割に特化させることに依存し、外生的モデルの微分を増大させる。
さらに,すべてのDrosoNetの出力を,各DrosoNetの複数のトップレフェンス候補を考慮した最終位置予測に組み合わせた,新しい投票モジュールを導入する。
RegionDrosoNetは、外観の変化と視点の変化の両方を扱う場合、他の軽量VPR技術よりも優れている。
さらに、オンライン推論時間のごく一部で、いくつかのベンチマークデータセットで計算コストの高いメソッドと競合する。
関連論文リスト
- Task-Oriented Real-time Visual Inference for IoVT Systems: A Co-design Framework of Neural Networks and Edge Deployment [61.20689382879937]
タスク指向エッジコンピューティングは、データ分析をエッジにシフトすることで、この問題に対処する。
既存の手法は、高いモデル性能と低いリソース消費のバランスをとるのに苦労している。
ニューラルネットワークアーキテクチャを最適化する新しい協調設計フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-29T19:02:54Z) - ELGC-Net: Efficient Local-Global Context Aggregation for Remote Sensing Change Detection [65.59969454655996]
本稿では,変化領域を正確に推定するために,リッチな文脈情報を利用する効率的な変化検出フレームワークELGC-Netを提案する。
提案するELGC-Netは、リモートセンシング変更検出ベンチマークにおいて、最先端の性能を新たに設定する。
また,ELGC-Net-LWも導入した。
論文 参考訳(メタデータ) (2024-03-26T17:46:25Z) - ClusVPR: Efficient Visual Place Recognition with Clustering-based
Weighted Transformer [13.0858576267115]
ClusVPRは重複する領域における冗長な情報の特定の問題と、小さなオブジェクトの表現に対処する新しいアプローチである。
ClusVPRはClustering-based weighted Transformer Network (CWTNet)と呼ばれるユニークなパラダイムを導入した
また,パラメータ数を大幅に削減し,モデル効率を向上させる最適化VLAD層を導入する。
論文 参考訳(メタデータ) (2023-10-06T09:01:15Z) - Patch-DrosoNet: Classifying Image Partitions With Fly-Inspired Models
For Lightweight Visual Place Recognition [22.58641358408613]
我々はDrosoNetの新しいトレーニング手法を提案し、参照画像の異なる領域で個別のモデルを訓練する。
また、各DrosoNetユニットがクエリ画像の各部分の配置予測を生成できる畳み込み型予測手法も導入する。
提案手法は,超コンパクトで軽量なアルゴリズムを維持しつつ,従来の作業のVPR性能を大幅に向上させる。
論文 参考訳(メタデータ) (2023-05-09T08:25:49Z) - Ghost-dil-NetVLAD: A Lightweight Neural Network for Visual Place Recognition [3.6249801498927923]
本稿では,GhostCNNと呼ばれるフロントエンド認識モデルと学習可能なVLAD層をバックエンドとして構成した,軽量な教師付きエンドツーエンドニューラルネットワークを提案する。
提案する軽量モデルをさらに強化するため,Ghostモジュールに拡張畳み込みを加えて,より空間的意味情報を含む特徴を抽出し,精度を向上する。
論文 参考訳(メタデータ) (2021-12-22T06:05:02Z) - An Efficient and Scalable Collection of Fly-inspired Voting Units for
Visual Place Recognition in Changing Environments [20.485491385050615]
ローオーバーヘッドのVPR技術は、ローエンドの安価なハードウェアを搭載したプラットフォームを可能にする。
我々のゴールは、外観変化と小さな視点変化に対する最先端のロバスト性を達成しつつ、極端なコンパクト性と効率のアルゴリズムを提供することである。
論文 参考訳(メタデータ) (2021-09-22T19:01:20Z) - STA-VPR: Spatio-temporal Alignment for Visual Place Recognition [17.212503755962757]
画像間の距離を計測しながら空間領域から局所的な特徴を整列する適応動的時間ウォーピングアルゴリズムを提案する。
時間的アライメントに基づく画像シーケンスマッチングを行うために、局所マッチングDTWアルゴリズムを適用した。
その結果,提案手法はcnnに基づく手法を大幅に改善した。
論文 参考訳(メタデータ) (2021-03-25T03:27:42Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z) - Learning Frequency-aware Dynamic Network for Efficient Super-Resolution [56.98668484450857]
本稿では、離散コサイン変換(dct)領域の係数に応じて入力を複数の部分に分割する新しい周波数認識動的ネットワークについて検討する。
実際、高周波部は高価な操作で処理され、低周波部は計算負荷を軽減するために安価な操作が割り当てられる。
ベンチマークSISRモデルおよびデータセット上での実験は、周波数認識動的ネットワークが様々なSISRニューラルネットワークに使用できることを示している。
論文 参考訳(メタデータ) (2021-03-15T12:54:26Z) - A Deep-Unfolded Reference-Based RPCA Network For Video
Foreground-Background Separation [86.35434065681925]
本稿では,ロバスト主成分分析(RPCA)問題に対するディープアンフォールディングに基づくネットワーク設計を提案する。
既存の設計とは異なり,本手法は連続するビデオフレームのスパース表現間の時間的相関をモデル化することに焦点を当てている。
移動MNISTデータセットを用いた実験により、提案したネットワークは、ビデオフォアグラウンドとバックグラウンドの分離作業において、最近提案された最先端のRPCAネットワークより優れていることが示された。
論文 参考訳(メタデータ) (2020-10-02T11:40:09Z) - Image Fine-grained Inpainting [89.17316318927621]
拡張畳み込みの密結合を利用してより大きく効果的な受容場を得る一段階モデルを提案する。
この効率的なジェネレータをよく訓練するために、頻繁に使用されるVGG特徴整合損失を除いて、新しい自己誘導回帰損失を設計する。
また、局所的・グローバルな分枝を持つ識別器を用いて、局所的・グローバルな内容の整合性を確保する。
論文 参考訳(メタデータ) (2020-02-07T03:45:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。