論文の概要: When Remembering and Planning are Worth it: Navigating under Change
- arxiv url: http://arxiv.org/abs/2602.15274v1
- Date: Tue, 17 Feb 2026 00:15:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-18 16:03:17.94504
- Title: When Remembering and Planning are Worth it: Navigating under Change
- Title(参考訳): 思い出と計画の価値 - 変化の下でのナビゲート
- Authors: Omid Madani, J. Brian Burns, Reza Eghbali, Thomas L. Dean,
- Abstract要約: 我々は,不確実な環境の変化において,異なる種類の記憶と利用が空間ナビゲーションにどのように役立つかを研究する。
私たちが研究する単純な採餌作業では、私たちのエージェントは毎日、自宅から障壁、食べ物まで、その道を見つける必要があります。
単純なものから洗練されたものまで、さまざまなメモリと学習の使い方で、さまざまな戦略を検討します。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We explore how different types and uses of memory can aid spatial navigation in changing uncertain environments. In the simple foraging task we study, every day, our agent has to find its way from its home, through barriers, to food. Moreover, the world is non-stationary: from day to day, the location of the barriers and food may change, and the agent's sensing such as its location information is uncertain and very limited. Any model construction, such as a map, and use, such as planning, needs to be robust against these challenges, and if any learning is to be useful, it needs to be adequately fast. We look at a range of strategies, from simple to sophisticated, with various uses of memory and learning. We find that an architecture that can incorporate multiple strategies is required to handle (sub)tasks of a different nature, in particular for exploration and search, when food location is not known, and for planning a good path to a remembered (likely) food location. An agent that utilizes non-stationary probability learning techniques to keep updating its (episodic) memories and that uses those memories to build maps and plan on the fly (imperfect maps, i.e. noisy and limited to the agent's experience) can be increasingly and substantially more efficient than the simpler (minimal-memory) agents, as the task difficulties such as distance to goal are raised, as long as the uncertainty, from localization and change, is not too large.
- Abstract(参考訳): 我々は,不確実な環境の変化において,異なる種類のメモリと利用が空間ナビゲーションにどのように役立つかを探る。
私たちが研究する単純な採餌作業では、私たちのエージェントは毎日、自宅から障壁、食べ物まで、その道を見つける必要があります。
さらに、世界は非定常的であり、日ごとに障壁や食物の位置が変化し、その位置情報のようなエージェントの感覚は不確実であり、非常に限られている。
マップのようなモデルの構築と計画のような利用は、これらの課題に対して堅牢でなければならない。
単純なものから洗練されたものまで、さまざまなメモリと学習の使い方で、さまざまな戦略を検討します。
複数の戦略を組み込むことが可能なアーキテクチャは、異なる性質の(サブ)タスク、特に探索と探索、食品の場所が不明な場合に対処し、記憶された(類似した)食品の場所への適切な経路を計画するために必要である。
非定常確率学習技術を用いて(絶対的な)記憶を更新し続け、それらの記憶を用いて地図を構築し、ハエ(例えば、エージェントの経験に制限された不完全な地図)を計画するエージェントは、より単純な(最小限の)エージェントよりも大幅に効率が良くなる。
関連論文リスト
- Memory Matters More: Event-Centric Memory as a Logic Map for Agent Searching and Reasoning [55.251697395358285]
大規模言語モデル(LLM)は、環境を推論し、計画し、相互作用するインテリジェントエージェントとして、ますます多くデプロイされている。
長期のシナリオに効果的にスケールするには、そのようなエージェントの重要な機能は、過去の経験を保持し、整理し、取り出すことができるメモリメカニズムである。
イベント理論にインスパイアされたイベント中心のメモリフレームワークであるCompassMemを提案する。
論文 参考訳(メタデータ) (2026-01-08T08:44:07Z) - AI planning in the imagination: High-level planning on learned abstract
search spaces [68.75684174531962]
我々は,エージェントが訓練中に学習する抽象的な検索空間において,エージェントが計画することを可能にする,PiZeroと呼ばれる新しい手法を提案する。
本研究では,旅行セールスマン問題,ソコバン問題,2048年,施設立地問題,パックマン問題など,複数の分野で評価を行った。
論文 参考訳(メタデータ) (2023-08-16T22:47:16Z) - Long Short-Term Memory for Spatial Encoding in Multi-Agent Path Planning [0.34410212782758043]
強化学習は、望ましい経路計画行動に対応する政策ネットワークの訓練に使用される。
長期記憶モジュール(Long Short-Term Memory Module)は、不特定数の状態と、不定数のエージェントをエンコードするために提案される。
提案手法は,実環境における衝突のない自律走行を行う最大4機のドローンの飛行試験結果を示すことによって検証される。
論文 参考訳(メタデータ) (2022-03-21T09:16:56Z) - ViKiNG: Vision-Based Kilometer-Scale Navigation with Geographic Hints [94.60414567852536]
長距離航法には、計画と局所的な移動可能性の推論の両方が必要である。
学習と計画を統合する学習に基づくアプローチを提案する。
ViKiNGは、画像ベースの学習コントローラを利用できる。
論文 参考訳(メタデータ) (2022-02-23T02:14:23Z) - Towards mental time travel: a hierarchical memory for reinforcement
learning agents [9.808027857786781]
強化学習エージェントは、特に遅延や邪魔なタスクの後、過去の詳細を忘れることが多い。
エージェントが過去を詳細に記憶するのに役立つ階層型トランスフォーマーメモリ(HTM)を提案する。
HTMのエージェントは、トレーニング対象よりも桁違い長いタスクシーケンスに外挿することができ、メタラーニング環境からゼロショットを一般化してエピソード間の知識を維持することもできる。
論文 参考訳(メタデータ) (2021-05-28T18:12:28Z) - Structured Scene Memory for Vision-Language Navigation [155.63025602722712]
視覚言語ナビゲーション(VLN)のための重要なアーキテクチャを提案する。
ナビゲーション中に知覚を正確に記憶できるほど区画化されている。
また、環境内の視覚的および幾何学的な手がかりを捉え、取り除く、構造化されたシーン表現としても機能する。
論文 参考訳(メタデータ) (2021-03-05T03:41:00Z) - Latent Skill Planning for Exploration and Transfer [49.25525932162891]
本稿では,この2つの手法を1つの強化学習エージェントに統合する方法について検討する。
テスト時の高速適応に部分的償却の考え方を活用する。
私たちは、困難なロコモーションタスクのスイートでデザイン決定のメリットを実演しています。
論文 参考訳(メタデータ) (2020-11-27T18:40:03Z) - Learning to Move with Affordance Maps [57.198806691838364]
物理的な空間を自律的に探索し、ナビゲートする能力は、事実上あらゆる移動型自律エージェントの基本的な要件である。
従来のSLAMベースの探索とナビゲーションのアプローチは、主にシーン幾何学の活用に重点を置いている。
学習可能な余剰マップは探索と航法の両方において従来のアプローチの強化に利用でき、性能が大幅に向上することを示します。
論文 参考訳(メタデータ) (2020-01-08T04:05:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。