論文の概要: Generalizable Reinforcement Learning with Biologically Inspired Hyperdimensional Occupancy Grid Maps for Exploration and Goal-Directed Path Planning
- arxiv url: http://arxiv.org/abs/2502.09393v1
- Date: Thu, 13 Feb 2025 15:10:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-14 20:05:35.317275
- Title: Generalizable Reinforcement Learning with Biologically Inspired Hyperdimensional Occupancy Grid Maps for Exploration and Goal-Directed Path Planning
- Title(参考訳): 生物にインスパイアされた超次元機能グリッドマップを用いた汎用強化学習による探索とゴール指向経路計画
- Authors: Shay Snyder, Ryan Shea, Andrew Capodieci, David Gorsich, Maryam Parsa,
- Abstract要約: 本研究では,従来の占領グリッドマッピング(OGM)に対するVSA-OGMの有効性について検討した。
以上の結果から,VSA-OGMは単一および複数シナリオのトレーニング構成において,同等の学習性能を維持していることが示された。
これらの結果は、BHMよりもVSA-OGMで訓練されたポリシーネットワークの一般化可能性の向上を浮き彫りにした。
- 参考スコア(独自算出の注目度): 1.945437594017991
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Real-time autonomous systems utilize multi-layer computational frameworks to perform critical tasks such as perception, goal finding, and path planning. Traditional methods implement perception using occupancy grid mapping (OGM), segmenting the environment into discretized cells with probabilistic information. This classical approach is well-established and provides a structured input for downstream processes like goal finding and path planning algorithms. Recent approaches leverage a biologically inspired mathematical framework known as vector symbolic architectures (VSA), commonly known as hyperdimensional computing, to perform probabilistic OGM in hyperdimensional space. This approach, VSA-OGM, provides native compatibility with spiking neural networks, positioning VSA-OGM as a potential neuromorphic alternative to conventional OGM. However, for large-scale integration, it is essential to assess the performance implications of VSA-OGM on downstream tasks compared to established OGM methods. This study examines the efficacy of VSA-OGM against a traditional OGM approach, Bayesian Hilbert Maps (BHM), within reinforcement learning based goal finding and path planning frameworks, across a controlled exploration environment and an autonomous driving scenario inspired by the F1-Tenth challenge. Our results demonstrate that VSA-OGM maintains comparable learning performance across single and multi-scenario training configurations while improving performance on unseen environments by approximately 47%. These findings highlight the increased generalizability of policy networks trained with VSA-OGM over BHM, reinforcing its potential for real-world deployment in diverse environments.
- Abstract(参考訳): リアルタイム自律システムは、知覚、ゴール発見、経路計画といった重要なタスクを実行するために、多層計算フレームワークを利用する。
従来の方法では、占有グリッドマッピング(OGM)を使用して認識を実装し、確率的な情報で環境を識別された細胞に分割する。
この古典的なアプローチは確立されており、ゴール探索やパス計画アルゴリズムのような下流プロセスに構造化された入力を提供する。
近年のアプローチでは、超次元計算として知られるベクトル記号アーキテクチャ(VSA)と呼ばれる生物学的に着想を得た数学的枠組みを活用し、超次元空間において確率的OGMを実行する。
このアプローチであるVSA-OGMは、スパイクニューラルネットワークとのネイティブな互換性を提供し、VSA-OGMを従来のOGMに代わる潜在的なニューロモルフィックとして位置づける。
しかし、大規模な統合では、確立されたOGM法と比較して、下流タスクにおけるVSA-OGMの性能への影響を評価することが不可欠である。
本研究では,従来のOGMアプローチであるベイジアン・ヒルベルトマップ(BHM)に対するVSA-OGMの有効性を,F1-10thチャレンジに触発された,制御された探索環境と自律運転シナリオを越えて,強化学習に基づく目標探索と経路計画フレームワークにおいて検討した。
以上の結果から,VSA-OGMは,シングルシナリオとマルチシナリオのトレーニング構成で同等の学習性能を維持しつつ,未確認環境における性能を約47%向上することが示された。
これらの結果は、BHMよりもVSA-OGMで訓練されたポリシーネットワークの一般化可能性を高め、多様な環境における現実世界の展開の可能性を高めていることを浮き彫りにしている。
関連論文リスト
- G-OSR: A Comprehensive Benchmark for Graph Open-Set Recognition [54.45837774534411]
ノードレベルとグラフレベルの両方でグラフオープンセット認識(GOSR)手法を評価するベンチマークである textbfG-OSR を導入する。
結果は、現在のGOSR手法の一般化可能性と限界に関する重要な洞察を与える。
論文 参考訳(メタデータ) (2025-03-01T13:02:47Z) - Advancing Open-Set Domain Generalization Using Evidential Bi-Level Hardest Domain Scheduler [45.71475375161575]
Open-Set Domain Generalizationでは、新しいデータ外観(ドメイン)とオープンセット条件の両方でモデルが公開される。
適応型ドメインスケジューラを実現するために,Evidential Bi-Level Hardest Domain Scheduler (EBiL-HaDS)を提案する。
論文 参考訳(メタデータ) (2024-09-26T05:57:35Z) - Parallel Strategies for Best-First Generalized Planning [51.713634067802104]
汎用計画(GP)は、複数の古典的な計画インスタンスを解くことができるアルゴリズムのようなソリューションの自動合成を研究するAIの研究分野である。
現在の進歩の1つはBest-First Generalized Planning (BFGP) の導入である。
本稿では,並列探索手法をBFGPに適用し,性能ギャップを埋める上で重要な要素であることを示す。
論文 参考訳(メタデータ) (2024-07-31T09:50:22Z) - Intelligent Hybrid Resource Allocation in MEC-assisted RAN Slicing Network [72.2456220035229]
我々は,協調型MEC支援RANスライシングシステムにおける異種サービス要求に対するSSRの最大化を目指す。
最適ハイブリッドRAポリシーをインテリジェントに学習するためのRGRLアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-05-02T01:36:13Z) - Active Neural Topological Mapping for Multi-Agent Exploration [24.91397816926568]
マルチエージェント協調探索問題では、複数のエージェントが限られた時間で感覚信号を介して見えない環境を探索する必要がある。
トポロジカルマップは、抽象的だが不可欠な情報を持つノードとエッジのみからなる、有望な代替手段である。
深層強化学習は、高速なエンドツーエンド推論を通じて(ほぼ)最適ポリシーを学ぶ大きな可能性を示している。
マルチエージェント探索作業における探索効率の向上と一般化を目的とした,Multi-Agent Neural Topological Mapping (MANTM)を提案する。
論文 参考訳(メタデータ) (2023-11-01T03:06:14Z) - Discovering General Reinforcement Learning Algorithms with Adversarial
Environment Design [54.39859618450935]
メタ学習型更新ルールは,広範囲のRLタスクで良好に機能するアルゴリズムの発見を期待して,実現可能であることを示す。
Learned Policy Gradient (LPG)のようなアルゴリズムによる印象的な初期結果にもかかわらず、これらのアルゴリズムが目に見えない環境に適用される場合、まだギャップが残っている。
本研究では,メタ教師付き学習分布の特性が,これらのアルゴリズムの性能に与える影響について検討する。
論文 参考訳(メタデータ) (2023-10-04T12:52:56Z) - Unlocking the Potential of Similarity Matching: Scalability, Supervision
and Pre-training [9.160910754837754]
バックプロパゲーション(BP)アルゴリズムは、生物学的な妥当性、計算コスト、オンライン学習に適した限界を示す。
本研究は, 生体系における観察機構と整合する, 主に教師なし類似性マッチング(SM)フレームワークに焦点を当てた。
論文 参考訳(メタデータ) (2023-08-02T20:34:55Z) - R-MAE: Regions Meet Masked Autoencoders [113.73147144125385]
我々は、自己教師付き画像表現学習のための単語の潜在的な視覚的類似として領域を探索する。
生成前トレーニングベースラインであるMasked Autoencoding (MAE) に触発されて, 画素群や領域群から学習するためのマスク付き領域オートエンコーディングを提案する。
論文 参考訳(メタデータ) (2023-06-08T17:56:46Z) - ViDA: Homeostatic Visual Domain Adapter for Continual Test Time Adaptation [48.039156140237615]
目標ドメインの継続的な変更に事前訓練されたモデルを適用するために、連続的なテスト時間適応タスクを提案する。
我々はCTTA用のVisual Domain Adapter (ViDA) を設計し、ドメイン固有知識とドメイン共有知識の両方を明示的に扱う。
提案手法は,CTTAタスクの分類とセグメント化の両方において,最先端の性能を実現する。
論文 参考訳(メタデータ) (2023-06-07T11:18:53Z) - Neuron Structure Modeling for Generalizable Remote Physiological
Measurement [35.33213338840912]
近年,リモート光胸腺造影(r)技術が注目されている。
顔ビデオから血液ボリュームパルス(BVP)を抽出し、多くのアプリケーションがよりアクセスしやすくする。
既存の手法は、目に見えない領域に対してうまく一般化するのに苦労する。
NEuron STructure Modeling (NEST) と呼ばれるドメインラベルのない手法を提案する。
論文 参考訳(メタデータ) (2023-03-10T14:44:11Z) - Multi-level Consistency Learning for Semi-supervised Domain Adaptation [85.90600060675632]
半教師付きドメイン適応(SSDA)は、完全にラベル付けされたソースドメインから学習した知識をわずかにラベル付けされたターゲットドメインに適用することを目的としている。
SSDAのための多レベル一貫性学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-05-09T06:41:18Z) - Visual-Language Navigation Pretraining via Prompt-based Environmental
Self-exploration [83.96729205383501]
本稿では,言語埋め込みの高速適応を実現するために,プロンプトベースの学習を導入する。
我々のモデルは、VLNやREVERIEを含む多様な視覚言語ナビゲーションタスクに適応することができる。
論文 参考訳(メタデータ) (2022-03-08T11:01:24Z) - Neural Motion Planning for Autonomous Parking [6.1805402105389895]
本稿では,より深い生成ネットワークと従来の動き計画手法を組み合わせたハイブリッドな動き計画手法を提案する。
提案手法は与えられた状態の表現を効果的に学習し,アルゴリズムの性能向上を示す。
論文 参考訳(メタデータ) (2021-11-12T14:29:38Z) - Large-scale Autonomous Flight with Real-time Semantic SLAM under Dense
Forest Canopy [48.51396198176273]
本研究では,大規模自律飛行とリアルタイムセマンティックマッピングを,挑戦的なアンダーキャノピー環境下で実現可能な統合システムを提案する。
我々は、スキャン全体で関連付けられ、木のトランクモデルと同様にロボットのポーズを制約するために使用されるLiDARデータから、木の幹と地面の平面を検出し、モデル化する。
ドリフト補償機構は、プランナー最適性とコントローラ安定性を維持しつつ、セマンティックSLAM出力を用いたドリフトをリアルタイムで最小化するように設計されている。
論文 参考訳(メタデータ) (2021-09-14T07:24:53Z) - An FEA surrogate model with Boundary Oriented Graph Embedding approach [28.104112546546947]
グラフニューラルネットワーク(GNN)のための境界指向グラフ埋め込み(BOGE)アプローチを提案する。
BOGEのアプローチでは、構造化メッシュ要素をグラフに埋め込むことができ、大規模な三角形メッシュベースのFAA結果に対して効率的な回帰を行うことができる。
3層DeepGCNモデルによるBOGEアプローチは、応力場予測のためのMSE 0.011706 (2.41% MAPE) と、位相最適化のための0.002735 MSE (0.01) 以上の誤差を持つ1.58%の要素) による回帰を導出する。
論文 参考訳(メタデータ) (2021-08-30T20:35:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。