論文の概要: Binary Neural Networks for Memory-Efficient and Effective Visual Place
Recognition in Changing Environments
- arxiv url: http://arxiv.org/abs/2010.00716v2
- Date: Sun, 23 Jan 2022 10:48:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-12 08:29:32.724790
- Title: Binary Neural Networks for Memory-Efficient and Effective Visual Place
Recognition in Changing Environments
- Title(参考訳): 変化する環境におけるメモリ効率と効果的な視覚位置認識のためのバイナリニューラルネットワーク
- Authors: Bruno Ferrarini, Michael Milford, Klaus D. McDonald-Maier and Shoaib
Ehsan
- Abstract要約: 視覚的場所認識(VPR)は、視覚データを用いて、ある場所が訪れたかどうかを判断するロボットの能力である。
CNNベースのアプローチは、小さなロボットやドローンのようなリソース制約のあるプラットフォームには適さない。
本稿では,メモリ要求と計算労力を大幅に削減する,超コンパクトモデルの新たなクラスを提案する。
- 参考スコア(独自算出の注目度): 24.674034243725455
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Visual place recognition (VPR) is a robot's ability to determine whether a
place was visited before using visual data. While conventional hand-crafted
methods for VPR fail under extreme environmental appearance changes, those
based on convolutional neural networks (CNNs) achieve state-of-the-art
performance but result in heavy runtime processes and model sizes that demand a
large amount of memory. Hence, CNN-based approaches are unsuitable for
resource-constrained platforms, such as small robots and drones. In this paper,
we take a multi-step approach of decreasing the precision of model parameters,
combining it with network depth reduction and fewer neurons in the classifier
stage to propose a new class of highly compact models that drastically reduces
the memory requirements and computational effort while maintaining
state-of-the-art VPR performance. To the best of our knowledge, this is the
first attempt to propose binary neural networks for solving the visual place
recognition problem effectively under changing conditions and with
significantly reduced resource requirements. Our best-performing binary neural
network, dubbed FloppyNet, achieves comparable VPR performance when considered
against its full-precision and deeper counterparts while consuming 99% less
memory and increasing the inference speed seven times.
- Abstract(参考訳): 視覚的場所認識(VPR)は、視覚データを用いて、ある場所が訪れたかどうかを判断するロボットの能力である。
vprの従来の手作りの手法は、極端な環境変化下では失敗するが、畳み込みニューラルネットワーク(cnns)に基づく手法は最先端のパフォーマンスを実現するが、大量のメモリを必要とする重いランタイムプロセスとモデルサイズをもたらす。
したがって、CNNベースのアプローチは、小さなロボットやドローンのようなリソース制約のあるプラットフォームには適さない。
本稿では, モデルパラメータの精度を低下させ, ネットワーク深さの低減と分類段階のニューロンの減少を併用して, 最先端のVPR性能を維持しつつ, メモリ要求と計算労力を大幅に削減する, 高度にコンパクトなモデルの新たなクラスを提案する。
我々の知識を最大限に活用するため、条件の変化とリソース要求の大幅な低減により視覚的な場所認識問題を効果的に解決するためのバイナリニューラルネットワークを提案する最初の試みである。
我々の最高のパフォーマンスを持つバイナリニューラルネットワークであるFloppyNetは、その完全精度と深い精度に対して考慮し、99%のメモリを消費し、推論速度を7倍に向上する。
関連論文リスト
- Heterogenous Memory Augmented Neural Networks [84.29338268789684]
ニューラルネットワークのための新しいヘテロジニアスメモリ拡張手法を提案する。
学習可能なメモリトークンをアテンション機構付きで導入することにより、膨大な計算オーバーヘッドを伴わずに性能を効果的に向上させることができる。
In-distriion (ID) と Out-of-distriion (OOD) の両方の条件下での様々な画像およびグラフベースのタスクに対するアプローチを示す。
論文 参考訳(メタデータ) (2023-10-17T01:05:28Z) - OLLA: Decreasing the Memory Usage of Neural Networks by Optimizing the
Lifetime and Location of Arrays [6.418232942455968]
OLLAは、ニューラルネットワークのトレーニングに使用されるテンソルの寿命とメモリ位置を最適化するアルゴリズムである。
問題のエンコーディングを単純化し、最先端のニューラルネットワークのサイズにスケールするためのアプローチを可能にするために、いくつかの手法を提案する。
論文 参考訳(メタデータ) (2022-10-24T02:39:13Z) - Variable Bitrate Neural Fields [75.24672452527795]
本稿では,特徴格子を圧縮し,メモリ消費を最大100倍に削減する辞書手法を提案する。
辞書の最適化をベクトル量子化オートデコーダ問題として定式化し、直接監督できない空間において、エンドツーエンドの離散神経表現を学習する。
論文 参考訳(メタデータ) (2022-06-15T17:58:34Z) - Highly-Efficient Binary Neural Networks for Visual Place Recognition [24.674034243725455]
VPRは、既知の位置が検出された場合にロボットが作業空間に自分自身をローカライズできるようにするため、自律ナビゲーションの基本的なタスクである。
CNNベースの技術は最先端のVPR性能をアーカイブするが、計算集約的でエネルギー需要が高い。
本稿では,第1の畳み込み層を置き換えるために,深く分離可能な因子分解とバイナライゼーションを組み合わせたVPR用BNNのクラスを提案する。
論文 参考訳(メタデータ) (2022-02-24T22:05:11Z) - Event Neural Networks [13.207573300016277]
イベントニューラルネットワーク(EvNets)は、繰り返しを利用して、ビデオ推論タスクの大幅な削減を実現する。
従来のニューラルネットを仮想的にEvNetに変換することは可能であることを示す。
本研究では,高レベルかつ低レベルの視覚処理において,最先端のニューラルネットワークにおける本手法の有効性を実証する。
論文 参考訳(メタデータ) (2021-12-02T00:08:48Z) - Compact representations of convolutional neural networks via weight
pruning and quantization [63.417651529192014]
本稿では、音源符号化に基づく畳み込みニューラルネットワーク(CNN)の新しいストレージフォーマットを提案し、重み付けと量子化の両方を活用する。
我々は、全接続層で0.6%、ネットワーク全体で5.44%のスペース占有率を削減し、最低でもベースラインと同じくらいの競争力を発揮する。
論文 参考訳(メタデータ) (2021-08-28T20:39:54Z) - Binary Graph Neural Networks [69.51765073772226]
グラフニューラルネットワーク(gnns)は、不規則データに対する表現学習のための強力で柔軟なフレームワークとして登場した。
本稿では,グラフニューラルネットワークのバイナライゼーションのための異なる戦略を提示し,評価する。
モデルの慎重な設計とトレーニングプロセスの制御によって、バイナリグラフニューラルネットワークは、挑戦的なベンチマークの精度において、適度なコストでトレーニングできることを示しています。
論文 参考訳(メタデータ) (2020-12-31T18:48:58Z) - EvoPose2D: Pushing the Boundaries of 2D Human Pose Estimation using
Accelerated Neuroevolution with Weight Transfer [82.28607779710066]
生物進化にインスパイアされたニューラル・アーキテクチャー・サーチの一形態であるニューラル・エボリューションの2次元ヒューマン・ポーズ・ネットワークの設計への応用について検討する。
本手法は,最先端の手設計ネットワークよりも効率的かつ高精度なネットワーク設計を実現する。
論文 参考訳(メタデータ) (2020-11-17T05:56:16Z) - Exploiting the ConvLSTM: Human Action Recognition using Raw Depth
Video-Based Recurrent Neural Networks [0.0]
本稿では,畳み込み長短期記憶ユニット,すなわちConvLSTMに基づく2つのニューラルネットワークを提案し,比較する。
提案モデルは,最先端手法と比較して,計算コストの低い競合認識精度を実現する。
論文 参考訳(メタデータ) (2020-06-13T23:35:59Z) - Widening and Squeezing: Towards Accurate and Efficient QNNs [125.172220129257]
量子化ニューラルネットワーク(QNN)は、非常に安価な計算とストレージオーバーヘッドのため、業界にとって非常に魅力的なものだが、その性能は、完全な精度パラメータを持つネットワークよりも悪い。
既存の手法の多くは、より効果的なトレーニング技術を利用して、特にバイナリニューラルネットワークの性能を高めることを目的としている。
本稿では,従来の完全精度ネットワークで高次元量子化機能に特徴を投影することで,この問題に対処する。
論文 参考訳(メタデータ) (2020-02-03T04:11:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。