Fugu-MT 論文翻訳(概要): Forming a sparse representation for visual place recognition using a neurorobotic approach

論文の概要: Forming a sparse representation for visual place recognition using a neurorobotic approach

arxiv url: http://arxiv.org/abs/2109.14916v1
Date: Thu, 30 Sep 2021 08:26:22 GMT
ステータス: 翻訳完了
システム内更新日: 2021-10-01 14:41:53.564661
Title: Forming a sparse representation for visual place recognition using a neurorobotic approach
Title（参考訳）: 神経ロボティクスによる視覚位置認識のためのスパース表現の形成
Authors: Sylvain Colomer, Nicolas Cuperlier, Guillaume Bresson, Olivier Romain
Abstract要約: 本稿では,視覚情報符号化のための新しい教師なしニューラルネットワークモデルを提案する。視覚野の構造にインスパイアされたモデルは、よりコンパクトな視覚情報コードを構築するために、トポロジカルなスパースコーディングとプールの層を交互に置き換える。
参考スコア（独自算出の注目度）: 0.8476382415486065
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: This paper introduces a novel unsupervised neural network model for visual information encoding which aims to address the problem of large-scale visual localization. Inspired by the structure of the visual cortex, the model (namely HSD) alternates layers of topologic sparse coding and pooling to build a more compact code of visual information. Intended for visual place recognition (VPR) systems that use local descriptors, the impact of its integration in a bio-inpired model for self-localization (LPMP) is evaluated. Our experimental results on the KITTI dataset show that HSD improves the runtime speed of LPMP by a factor of at least 2 and its localization accuracy by 10%. A comparison with CoHog, a state-of-the-art VPR approach, showed that our method achieves slightly better results.
Abstract（参考訳）: 本稿では,視覚情報符号化のための教師なしニューラルネットワークモデルを提案する。視覚野の構造にインスパイアされたモデル(HSD)は、よりコンパクトな視覚情報コードを構築するために、トポロジカルスパースコーディングとプールの層を交互に置き換える。局所記述子を用いた視覚的位置認識(VPR)システムにおいて,自己局在化(LPMP)のためのバイオインスピレーションモデルへの統合の影響を評価する。 KITTIデータセットを用いた実験の結果,HSDはLPMPのランタイム速度を少なくとも2倍改善し,ローカライゼーション精度は10%向上した。最先端のVPR手法であるCoHogとの比較により,本手法の精度は若干向上した。

関連論文リスト

Simple Models, Rich Representations: Visual Decoding from Primate Intracortical Neural Signals [0.0]
霊長類の高密度皮質内記録から視覚情報を復号する問題に対処する。我々は,低分解能遅延再構成と意味的条件付き拡散を組み合わせたモジュラー生成復号パイプラインを開発した。このフレームワークは、ブレイン・コンピュータ・インタフェースとセマンティック・ニューラル・デコーディングの原則を提供する。
論文参考訳（メタデータ） (2026-01-16T09:10:31Z)
Grounding Language with Vision: A Conditional Mutual Information Calibrated Decoding Strategy for Reducing Hallucinations in LVLMs [51.93737995405164]
LVLM(Large Vision-Language Models)は幻覚の影響を受けやすいモデルである。本稿では,条件付きポイントワイド・ミューチュアル・インフォメーション(C-PMI)キャリブレーション・デコーディング・ストラテジーを導入する。提案手法は,復号効率を保ちながら,LVLMの幻覚を著しく低減することを示す。
論文参考訳（メタデータ） (2025-05-26T08:36:10Z)
Top-Down Compression: Revisit Efficient Vision Token Projection for Visual Instruction Tuning [70.57180215148125]
ビジュアルインストラクションチューニングは、大きな言語モデルで視覚世界を理解できるようにすることを目的としている。既存の手法は、精度と効率の間の難解なトレードオフに悩まされることが多い。 LLaVA-Meteorは,コア情報を妥協することなく,視覚トークンを戦略的に圧縮する手法である。
論文参考訳（メタデータ） (2025-05-17T10:22:29Z)
Visual Neural Decoding via Improved Visual-EEG Semantic Consistency [3.4061238650474657]
EEG機能をCLIP埋め込みスペースに直接マッピングするメソッドは、マッピングバイアスを導入し、セマンティックな矛盾を引き起こす可能性がある。最適アライメントを容易にするために,これらの2つのモードのセマンティックな特徴を明示的に抽出する Visual-EEG Semantic Decouple Framework を提案する。提案手法は,ゼロショットニューラルデコードタスクの最先端化を実現する。
論文参考訳（メタデータ） (2024-08-13T10:16:10Z)
Augmentation is AUtO-Net: Augmentation-Driven Contrastive Multiview Learning for Medical Image Segmentation [3.1002416427168304]
この論文は網膜血管セグメンテーションの課題に焦点を当てている。深層学習に基づく医用画像セグメンテーションアプローチの広範な文献レビューを提供する。効率的でシンプルな多視点学習フレームワークを提案する。
論文参考訳（メタデータ） (2023-11-02T06:31:08Z)
Self-supervised Learning of Contextualized Local Visual Embeddings [0.0]
Contextualized Local Visual Embeddings (CLoVE) は、密集した予測タスクに適した表現を学習する自己教師型畳み込み方式である。 CLoVEの事前訓練された表現を複数のデータセットでベンチマークする。 CLOVEは、CNNベースのアーキテクチャに対して、下流の4つの密集した予測タスクで最先端のパフォーマンスに達する。
論文参考訳（メタデータ） (2023-10-01T00:13:06Z)
Evolutionary Computation in Action: Feature Selection for Deep Embedding Spaces of Gigapixel Pathology Images [0.6037276428689636]
本稿では, 大規模多目的最適化(LSMOP)に基づくWSI表現の進化的アプローチを提案する。 The Cancer Genome Atlas(TC)画像を用いて,WSI表現,分類精度,特徴品質の観点から提案手法を検証した。提案した進化的アルゴリズムは、最先端の手法によって提供されるコードよりも8%高い精度でWSIを表現するための非常にコンパクトな特徴ベクトルを求める。
論文参考訳（メタデータ） (2023-03-02T03:36:15Z)
Convolutional Neural Generative Coding: Scaling Predictive Coding to Natural Images [79.07468367923619]
畳み込み型神経生成符号化(Conv-NGC)を開発した。我々は、潜伏状態マップを段階的に洗練する柔軟な神経生物学的動機付けアルゴリズムを実装した。本研究は,脳にインスパイアされたニューラル・システムによる再建と画像復調の課題に対する効果について検討する。
論文参考訳（メタデータ） (2022-11-22T06:42:41Z)
Adaptive Local-Component-aware Graph Convolutional Network for One-shot Skeleton-based Action Recognition [54.23513799338309]
骨格に基づく行動認識のための適応的局所成分認識グラフ畳み込みネットワークを提案する。我々の手法はグローバルな埋め込みよりも強力な表現を提供し、我々のモデルが最先端に到達するのに役立ちます。
論文参考訳（メタデータ） (2022-09-21T02:33:07Z)
OCTAve: 2D en face Optical Coherence Tomography Angiography Vessel Segmentation in Weakly-Supervised Learning with Locality Augmentation [14.322349196837209]
画素レベルのアノテーションを自動化するために,スクリブルベースの弱教師付き学習手法を提案する。 OCTAveと呼ばれる本提案手法は,スクリブルアノテートによる弱教師付き学習と,敵意と自己監督型自己監督型深層学習を組み合わせたものである。
論文参考訳（メタデータ） (2022-07-25T14:40:56Z)
Adversarial Feature Augmentation and Normalization for Visual Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文参考訳（メタデータ） (2021-03-22T20:36:34Z)
Spatial Dependency Networks: Neural Layers for Improved Generative Image Modeling [79.15521784128102]
画像生成装置(デコーダ)を構築するための新しいニューラルネットワークを導入し、可変オートエンコーダ(VAE)に適用する。空間依存ネットワーク(sdns)では、ディープニューラルネットの各レベルにおける特徴マップを空間的にコヒーレントな方法で計算する。空間依存層による階層型vaeのデコーダの強化は密度推定を大幅に改善することを示す。
論文参考訳（メタデータ） (2021-03-16T07:01:08Z)
PaDiM: a Patch Distribution Modeling Framework for Anomaly Detection and Localization [64.39761523935613]
本稿では,画像中の異常を同時検出・ローカライズするPatch Distribution Modeling, PaDiMを提案する。 PaDiMは、パッチの埋め込みに事前訓練された畳み込みニューラルネットワーク(CNN)を使用している。また、CNNの異なるセマンティックレベル間の相関を利用して、異常のローカライズも改善している。
論文参考訳（メタデータ） (2020-11-17T17:29:18Z)
Collaborative Boundary-aware Context Encoding Networks for Error Map Prediction [65.44752447868626]
本稿では,AEP-Net と呼ばれる協調的コンテキスト符号化ネットワークを提案する。具体的には、画像とマスクのより優れた特徴融合のための協調的な特徴変換分岐と、エラー領域の正確な局所化を提案する。 AEP-Netはエラー予測タスクの平均DSCが0.8358,0.8164であり、ピアソン相関係数が0.9873である。
論文参考訳（メタデータ） (2020-06-25T12:42:01Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。