論文の概要: Forming a sparse representation for visual place recognition using a
neurorobotic approach
- arxiv url: http://arxiv.org/abs/2109.14916v1
- Date: Thu, 30 Sep 2021 08:26:22 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-01 14:41:53.564661
- Title: Forming a sparse representation for visual place recognition using a
neurorobotic approach
- Title(参考訳): 神経ロボティクスによる視覚位置認識のためのスパース表現の形成
- Authors: Sylvain Colomer, Nicolas Cuperlier, Guillaume Bresson, Olivier Romain
- Abstract要約: 本稿では,視覚情報符号化のための新しい教師なしニューラルネットワークモデルを提案する。
視覚野の構造にインスパイアされたモデルは、よりコンパクトな視覚情報コードを構築するために、トポロジカルなスパースコーディングとプールの層を交互に置き換える。
- 参考スコア(独自算出の注目度): 0.8476382415486065
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper introduces a novel unsupervised neural network model for visual
information encoding which aims to address the problem of large-scale visual
localization. Inspired by the structure of the visual cortex, the model (namely
HSD) alternates layers of topologic sparse coding and pooling to build a more
compact code of visual information. Intended for visual place recognition (VPR)
systems that use local descriptors, the impact of its integration in a
bio-inpired model for self-localization (LPMP) is evaluated. Our experimental
results on the KITTI dataset show that HSD improves the runtime speed of LPMP
by a factor of at least 2 and its localization accuracy by 10%. A comparison
with CoHog, a state-of-the-art VPR approach, showed that our method achieves
slightly better results.
- Abstract(参考訳): 本稿では,視覚情報符号化のための教師なしニューラルネットワークモデルを提案する。
視覚野の構造にインスパイアされたモデル(HSD)は、よりコンパクトな視覚情報コードを構築するために、トポロジカルスパースコーディングとプールの層を交互に置き換える。
局所記述子を用いた視覚的位置認識(VPR)システムにおいて,自己局在化(LPMP)のためのバイオインスピレーションモデルへの統合の影響を評価する。
KITTIデータセットを用いた実験の結果,HSDはLPMPのランタイム速度を少なくとも2倍改善し,ローカライゼーション精度は10%向上した。
最先端のVPR手法であるCoHogとの比較により,本手法の精度は若干向上した。
関連論文リスト
- Visual Neural Decoding via Improved Visual-EEG Semantic Consistency [3.4061238650474657]
EEG機能をCLIP埋め込みスペースに直接マッピングするメソッドは、マッピングバイアスを導入し、セマンティックな矛盾を引き起こす可能性がある。
最適アライメントを容易にするために,これらの2つのモードのセマンティックな特徴を明示的に抽出する Visual-EEG Semantic Decouple Framework を提案する。
提案手法は,ゼロショットニューラルデコードタスクの最先端化を実現する。
論文 参考訳(メタデータ) (2024-08-13T10:16:10Z) - Augmentation is AUtO-Net: Augmentation-Driven Contrastive Multiview
Learning for Medical Image Segmentation [3.1002416427168304]
この論文は網膜血管セグメンテーションの課題に焦点を当てている。
深層学習に基づく医用画像セグメンテーションアプローチの広範な文献レビューを提供する。
効率的でシンプルな多視点学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-11-02T06:31:08Z) - Self-supervised Learning of Contextualized Local Visual Embeddings [0.0]
Contextualized Local Visual Embeddings (CLoVE) は、密集した予測タスクに適した表現を学習する自己教師型畳み込み方式である。
CLoVEの事前訓練された表現を複数のデータセットでベンチマークする。
CLOVEは、CNNベースのアーキテクチャに対して、下流の4つの密集した予測タスクで最先端のパフォーマンスに達する。
論文 参考訳(メタデータ) (2023-10-01T00:13:06Z) - Evolutionary Computation in Action: Feature Selection for Deep Embedding
Spaces of Gigapixel Pathology Images [0.6037276428689636]
本稿では, 大規模多目的最適化(LSMOP)に基づくWSI表現の進化的アプローチを提案する。
The Cancer Genome Atlas(TC)画像を用いて,WSI表現,分類精度,特徴品質の観点から提案手法を検証した。
提案した進化的アルゴリズムは、最先端の手法によって提供されるコードよりも8%高い精度でWSIを表現するための非常にコンパクトな特徴ベクトルを求める。
論文 参考訳(メタデータ) (2023-03-02T03:36:15Z) - Convolutional Neural Generative Coding: Scaling Predictive Coding to
Natural Images [79.07468367923619]
畳み込み型神経生成符号化(Conv-NGC)を開発した。
我々は、潜伏状態マップを段階的に洗練する柔軟な神経生物学的動機付けアルゴリズムを実装した。
本研究は,脳にインスパイアされたニューラル・システムによる再建と画像復調の課題に対する効果について検討する。
論文 参考訳(メタデータ) (2022-11-22T06:42:41Z) - Adaptive Local-Component-aware Graph Convolutional Network for One-shot
Skeleton-based Action Recognition [54.23513799338309]
骨格に基づく行動認識のための適応的局所成分認識グラフ畳み込みネットワークを提案する。
我々の手法はグローバルな埋め込みよりも強力な表現を提供し、我々のモデルが最先端に到達するのに役立ちます。
論文 参考訳(メタデータ) (2022-09-21T02:33:07Z) - OCTAve: 2D en face Optical Coherence Tomography Angiography Vessel
Segmentation in Weakly-Supervised Learning with Locality Augmentation [14.322349196837209]
画素レベルのアノテーションを自動化するために,スクリブルベースの弱教師付き学習手法を提案する。
OCTAveと呼ばれる本提案手法は,スクリブルアノテートによる弱教師付き学習と,敵意と自己監督型自己監督型深層学習を組み合わせたものである。
論文 参考訳(メタデータ) (2022-07-25T14:40:56Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z) - Spatial Dependency Networks: Neural Layers for Improved Generative Image
Modeling [79.15521784128102]
画像生成装置(デコーダ)を構築するための新しいニューラルネットワークを導入し、可変オートエンコーダ(VAE)に適用する。
空間依存ネットワーク(sdns)では、ディープニューラルネットの各レベルにおける特徴マップを空間的にコヒーレントな方法で計算する。
空間依存層による階層型vaeのデコーダの強化は密度推定を大幅に改善することを示す。
論文 参考訳(メタデータ) (2021-03-16T07:01:08Z) - PaDiM: a Patch Distribution Modeling Framework for Anomaly Detection and
Localization [64.39761523935613]
本稿では,画像中の異常を同時検出・ローカライズするPatch Distribution Modeling, PaDiMを提案する。
PaDiMは、パッチの埋め込みに事前訓練された畳み込みニューラルネットワーク(CNN)を使用している。
また、CNNの異なるセマンティックレベル間の相関を利用して、異常のローカライズも改善している。
論文 参考訳(メタデータ) (2020-11-17T17:29:18Z) - Collaborative Boundary-aware Context Encoding Networks for Error Map
Prediction [65.44752447868626]
本稿では,AEP-Net と呼ばれる協調的コンテキスト符号化ネットワークを提案する。
具体的には、画像とマスクのより優れた特徴融合のための協調的な特徴変換分岐と、エラー領域の正確な局所化を提案する。
AEP-Netはエラー予測タスクの平均DSCが0.8358,0.8164であり、ピアソン相関係数が0.9873である。
論文 参考訳(メタデータ) (2020-06-25T12:42:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。