論文の概要: Generalizable Reinforcement Learning with Biologically Inspired Hyperdimensional Occupancy Grid Maps for Exploration and Goal-Directed Path Planning
- arxiv url: http://arxiv.org/abs/2502.09393v1
- Date: Thu, 13 Feb 2025 15:10:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-14 13:49:10.744964
- Title: Generalizable Reinforcement Learning with Biologically Inspired Hyperdimensional Occupancy Grid Maps for Exploration and Goal-Directed Path Planning
- Title(参考訳): 生物にインスパイアされた超次元機能グリッドマップを用いた汎用強化学習による探索とゴール指向経路計画
- Authors: Shay Snyder, Ryan Shea, Andrew Capodieci, David Gorsich, Maryam Parsa,
- Abstract要約: 本研究では,従来の占領グリッドマッピング(OGM)に対するVSA-OGMの有効性について検討した。
以上の結果から,VSA-OGMは単一および複数シナリオのトレーニング構成において,同等の学習性能を維持していることが示された。
これらの結果は、BHMよりもVSA-OGMで訓練されたポリシーネットワークの一般化可能性の向上を浮き彫りにした。
- 参考スコア(独自算出の注目度): 1.945437594017991
- License:
- Abstract: Real-time autonomous systems utilize multi-layer computational frameworks to perform critical tasks such as perception, goal finding, and path planning. Traditional methods implement perception using occupancy grid mapping (OGM), segmenting the environment into discretized cells with probabilistic information. This classical approach is well-established and provides a structured input for downstream processes like goal finding and path planning algorithms. Recent approaches leverage a biologically inspired mathematical framework known as vector symbolic architectures (VSA), commonly known as hyperdimensional computing, to perform probabilistic OGM in hyperdimensional space. This approach, VSA-OGM, provides native compatibility with spiking neural networks, positioning VSA-OGM as a potential neuromorphic alternative to conventional OGM. However, for large-scale integration, it is essential to assess the performance implications of VSA-OGM on downstream tasks compared to established OGM methods. This study examines the efficacy of VSA-OGM against a traditional OGM approach, Bayesian Hilbert Maps (BHM), within reinforcement learning based goal finding and path planning frameworks, across a controlled exploration environment and an autonomous driving scenario inspired by the F1-Tenth challenge. Our results demonstrate that VSA-OGM maintains comparable learning performance across single and multi-scenario training configurations while improving performance on unseen environments by approximately 47%. These findings highlight the increased generalizability of policy networks trained with VSA-OGM over BHM, reinforcing its potential for real-world deployment in diverse environments.
- Abstract(参考訳): リアルタイム自律システムは、知覚、ゴール発見、経路計画といった重要なタスクを実行するために、多層計算フレームワークを利用する。
従来の方法では、占有グリッドマッピング(OGM)を使用して認識を実装し、確率的な情報で環境を識別された細胞に分割する。
この古典的なアプローチは確立されており、ゴール探索やパス計画アルゴリズムのような下流プロセスに構造化された入力を提供する。
近年のアプローチでは、超次元計算として知られるベクトル記号アーキテクチャ(VSA)と呼ばれる生物学的に着想を得た数学的枠組みを活用し、超次元空間において確率的OGMを実行する。
このアプローチであるVSA-OGMは、スパイクニューラルネットワークとのネイティブな互換性を提供し、VSA-OGMを従来のOGMに代わる潜在的なニューロモルフィックとして位置づける。
しかし、大規模な統合では、確立されたOGM法と比較して、下流タスクにおけるVSA-OGMの性能への影響を評価することが不可欠である。
本研究では,従来のOGMアプローチであるベイジアン・ヒルベルトマップ(BHM)に対するVSA-OGMの有効性を,F1-10thチャレンジに触発された,制御された探索環境と自律運転シナリオを越えて,強化学習に基づく目標探索と経路計画フレームワークにおいて検討した。
以上の結果から,VSA-OGMは,シングルシナリオとマルチシナリオのトレーニング構成で同等の学習性能を維持しつつ,未確認環境における性能を約47%向上することが示された。
これらの結果は、BHMよりもVSA-OGMで訓練されたポリシーネットワークの一般化可能性を高め、多様な環境における現実世界の展開の可能性を高めていることを浮き彫りにしている。
関連論文リスト
- Without Paired Labeled Data: An End-to-End Self-Supervised Paradigm for UAV-View Geo-Localization [2.733505168507872]
UAV-View Geo-Localizationは、GPSタグ付き衛星画像を取得することで、UAVの正確な位置を確認することを目的としている。
既存の手法は、トレーニングのためにアノテーション付きペアデータを必要とする教師付き学習パラダイムに依存している。
本稿では,UAVビューのジオローカライゼーションのための軽量なエンドツーエンドの自己組織化フレームワークであるDynamic Memory-Driven and Neighborhood Information Learning Networkを提案する。
論文 参考訳(メタデータ) (2025-02-17T02:53:08Z) - Parallel Strategies for Best-First Generalized Planning [51.713634067802104]
汎用計画(GP)は、複数の古典的な計画インスタンスを解くことができるアルゴリズムのようなソリューションの自動合成を研究するAIの研究分野である。
現在の進歩の1つはBest-First Generalized Planning (BFGP) の導入である。
本稿では,並列探索手法をBFGPに適用し,性能ギャップを埋める上で重要な要素であることを示す。
論文 参考訳(メタデータ) (2024-07-31T09:50:22Z) - Intelligent Hybrid Resource Allocation in MEC-assisted RAN Slicing Network [72.2456220035229]
我々は,協調型MEC支援RANスライシングシステムにおける異種サービス要求に対するSSRの最大化を目指す。
最適ハイブリッドRAポリシーをインテリジェントに学習するためのRGRLアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-05-02T01:36:13Z) - Active Neural Topological Mapping for Multi-Agent Exploration [24.91397816926568]
マルチエージェント協調探索問題では、複数のエージェントが限られた時間で感覚信号を介して見えない環境を探索する必要がある。
トポロジカルマップは、抽象的だが不可欠な情報を持つノードとエッジのみからなる、有望な代替手段である。
深層強化学習は、高速なエンドツーエンド推論を通じて(ほぼ)最適ポリシーを学ぶ大きな可能性を示している。
マルチエージェント探索作業における探索効率の向上と一般化を目的とした,Multi-Agent Neural Topological Mapping (MANTM)を提案する。
論文 参考訳(メタデータ) (2023-11-01T03:06:14Z) - Discovering General Reinforcement Learning Algorithms with Adversarial
Environment Design [54.39859618450935]
メタ学習型更新ルールは,広範囲のRLタスクで良好に機能するアルゴリズムの発見を期待して,実現可能であることを示す。
Learned Policy Gradient (LPG)のようなアルゴリズムによる印象的な初期結果にもかかわらず、これらのアルゴリズムが目に見えない環境に適用される場合、まだギャップが残っている。
本研究では,メタ教師付き学習分布の特性が,これらのアルゴリズムの性能に与える影響について検討する。
論文 参考訳(メタデータ) (2023-10-04T12:52:56Z) - Unlocking the Potential of Similarity Matching: Scalability, Supervision
and Pre-training [9.160910754837754]
バックプロパゲーション(BP)アルゴリズムは、生物学的な妥当性、計算コスト、オンライン学習に適した限界を示す。
本研究は, 生体系における観察機構と整合する, 主に教師なし類似性マッチング(SM)フレームワークに焦点を当てた。
論文 参考訳(メタデータ) (2023-08-02T20:34:55Z) - Multi-level Consistency Learning for Semi-supervised Domain Adaptation [85.90600060675632]
半教師付きドメイン適応(SSDA)は、完全にラベル付けされたソースドメインから学習した知識をわずかにラベル付けされたターゲットドメインに適用することを目的としている。
SSDAのための多レベル一貫性学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-05-09T06:41:18Z) - Visual-Language Navigation Pretraining via Prompt-based Environmental
Self-exploration [83.96729205383501]
本稿では,言語埋め込みの高速適応を実現するために,プロンプトベースの学習を導入する。
我々のモデルは、VLNやREVERIEを含む多様な視覚言語ナビゲーションタスクに適応することができる。
論文 参考訳(メタデータ) (2022-03-08T11:01:24Z) - Neural Motion Planning for Autonomous Parking [6.1805402105389895]
本稿では,より深い生成ネットワークと従来の動き計画手法を組み合わせたハイブリッドな動き計画手法を提案する。
提案手法は与えられた状態の表現を効果的に学習し,アルゴリズムの性能向上を示す。
論文 参考訳(メタデータ) (2021-11-12T14:29:38Z) - An FEA surrogate model with Boundary Oriented Graph Embedding approach [28.104112546546947]
グラフニューラルネットワーク(GNN)のための境界指向グラフ埋め込み(BOGE)アプローチを提案する。
BOGEのアプローチでは、構造化メッシュ要素をグラフに埋め込むことができ、大規模な三角形メッシュベースのFAA結果に対して効率的な回帰を行うことができる。
3層DeepGCNモデルによるBOGEアプローチは、応力場予測のためのMSE 0.011706 (2.41% MAPE) と、位相最適化のための0.002735 MSE (0.01) 以上の誤差を持つ1.58%の要素) による回帰を導出する。
論文 参考訳(メタデータ) (2021-08-30T20:35:01Z) - Trajectory Design for UAV-Based Internet-of-Things Data Collection: A
Deep Reinforcement Learning Approach [93.67588414950656]
本稿では,無人航空機(UAV)による3D環境におけるIoT(Internet-of-Things)システムについて検討する。
本稿では,TD3-TDCTMアルゴリズムの完成時間最小化のためのトラジェクトリ設計を提案する。
シミュレーションの結果,従来の3つの非学習ベースライン法よりもTD3-TDCTMアルゴリズムの方が優れていることが示された。
論文 参考訳(メタデータ) (2021-07-23T03:33:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。