論文の概要: Novelty Accommodating Multi-Agent Planning in High Fidelity Simulated
Open World
- arxiv url: http://arxiv.org/abs/2306.12654v1
- Date: Thu, 22 Jun 2023 03:44:04 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-23 15:35:36.157461
- Title: Novelty Accommodating Multi-Agent Planning in High Fidelity Simulated
Open World
- Title(参考訳): 高忠実なオープンワールドにおける新規なマルチエージェント計画
- Authors: James Chao, Wiktor Piotrowski, Mitch Manzanares, Douglas S. Lange
- Abstract要約: ノベルティ(英: Novelty)は、環境のコア特性、組成、力学を変化させる予期せぬ現象である。
これまでの研究では、新規性はエージェントのパフォーマンスに破滅的な影響を及ぼすことが示されている。
本研究では、軍事領域の現実的な高忠実度シミュレータにおいて、ドメイン非依存のAIエージェントが、斬新な動作と推論を成功させるために適応できることを実証する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Autonomous agents acting in real-world environments often need to reason with
unknown novelties interfering with their plan execution. Novelty is an
unexpected phenomenon that can alter the core characteristics, composition, and
dynamics of the environment. Novelty can occur at any time in any sufficiently
complex environment without any prior notice or explanation. Previous studies
show that novelty has catastrophic impact on agent performance. Intelligent
agents reason with an internal model of the world to understand the intricacies
of their environment and to successfully execute their plans. The introduction
of novelty into the environment usually renders their internal model inaccurate
and the generated plans no longer applicable. Novelty is particularly prevalent
in the real world where domain-specific and even predicted novelty-specific
approaches are used to mitigate the novelty's impact. In this work, we
demonstrate that a domain-independent AI agent designed to detect,
characterize, and accommodate novelty in smaller-scope physics-based games such
as Angry Birds and Cartpole can be adapted to successfully perform and reason
with novelty in realistic high-fidelity simulator of the military domain.
- Abstract(参考訳): 現実の環境で行動する自律エージェントは、しばしば計画実行に干渉する未知の新規性を推論する必要がある。
ノベルティは、環境のコア特性、構成、ダイナミクスを変化させる予期せぬ現象である。
新規性は、事前の通知や説明なしに、十分に複雑な環境でいつでも起こりうる。
これまでの研究では、新規性はエージェントのパフォーマンスに破滅的な影響を及ぼすことが示されている。
インテリジェントエージェントは、環境の複雑さを理解し、その計画をうまく実行するために、世界の内部モデルを推論します。
環境への新規性の導入は通常、内部モデルを不正確なものにし、生成された計画はもはや適用されない。
ノベルティは特に、ドメイン固有で予測されるノベルティ固有のアプローチがノベルティの影響を緩和するために使われる実世界で広く使われている。
本研究では,angry birds や cartpole などの小型物理系ゲームにおいて,新奇性を検出,特徴化し,適応するドメインに依存しないaiエージェントを,軍用ドメインの現実的な高精細シミュレータにおいて,新奇性をうまく実行し,理性に適合させることを実証する。
関連論文リスト
- A Meta-Engine Framework for Interleaved Task and Motion Planning using Topological Refinements [51.54559117314768]
タスク・アンド・モーション・プランニング(タスク・アンド・モーション・プランニング、TAMP)は、自動化された計画問題の解決策を見つけるための問題である。
本稿では,TAMP問題のモデル化とベンチマークを行うための,汎用的でオープンソースのフレームワークを提案する。
移動エージェントと複数のタスク状態依存障害を含むTAMP問題を解決する革新的なメタ技術を導入する。
論文 参考訳(メタデータ) (2024-08-11T14:57:57Z) - AgentGen: Enhancing Planning Abilities for Large Language Model based Agent via Environment and Task Generation [81.32722475387364]
大規模言語モデルに基づくエージェントが注目され、ますます人気が高まっている。
計画能力は LLM ベースのエージェントの重要な構成要素であり、通常は初期状態から望ましい目標を達成する必要がある。
近年の研究では、専門家レベルの軌跡を指導訓練用LLMに活用することで、効果的に計画能力を向上させることが示されている。
論文 参考訳(メタデータ) (2024-08-01T17:59:46Z) - Synergising Human-like Responses and Machine Intelligence for Planning in Disaster Response [10.294618771570985]
デュアルプロセス理論(DPT)にインスパイアされた注意に基づく認知アーキテクチャを提案する。
このフレームワークは、高速だが(人間のような)応答と、遅いが最適化されたマシンインテリジェンスの計画能力を統合する。
論文 参考訳(メタデータ) (2024-04-15T15:47:08Z) - HAZARD Challenge: Embodied Decision Making in Dynamically Changing
Environments [93.94020724735199]
HAZARDは、火災、洪水、風などの3つの予期せぬ災害シナリオで構成されている。
このベンチマークにより、さまざまなパイプラインで自律エージェントの意思決定能力を評価することができる。
論文 参考訳(メタデータ) (2024-01-23T18:59:43Z) - AI planning in the imagination: High-level planning on learned abstract
search spaces [68.75684174531962]
我々は,エージェントが訓練中に学習する抽象的な検索空間において,エージェントが計画することを可能にする,PiZeroと呼ばれる新しい手法を提案する。
本研究では,旅行セールスマン問題,ソコバン問題,2048年,施設立地問題,パックマン問題など,複数の分野で評価を行った。
論文 参考訳(メタデータ) (2023-08-16T22:47:16Z) - Egocentric Planning for Scalable Embodied Task Achievement [6.870094263016224]
エゴセントリックプランニング(Egocentric Planning)は、複雑な環境におけるタスクを解決するために、シンボリックプランニングとオブジェクト指向のPOMDPを組み合わせた革新的なアプローチである。
国内タスク用に設計されたシミュレーション環境であるALFREDにおける我々のアプローチを評価し,そのスケーラビリティを実証した。
本手法では, エージェントの行動の前提条件と影響について, 信頼性の高い認識と記号的記述の特定, 学習が必要である。
論文 参考訳(メタデータ) (2023-06-02T06:41:24Z) - Optimal task and motion planning and execution for human-robot
multi-agent systems in dynamic environments [54.39292848359306]
本稿では,タスクのシーケンシング,割り当て,実行を最適化するタスクと動作計画の組み合わせを提案する。
このフレームワークはタスクとアクションの分離に依存しており、アクションはシンボル的タスクの幾何学的実現の可能な1つの可能性である。
ロボットアームと人間の作業員がモザイクを組み立てる共同製造シナリオにおけるアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2023-03-27T01:50:45Z) - Evolving Hierarchical Memory-Prediction Machines in Multi-Task
Reinforcement Learning [4.030910640265943]
行動エージェントは、時間とともに様々な環境や目的にまたがって一般化されなければならない。
遺伝的プログラミングを用いて、制御文献から6つのユニークな環境で動作可能な、高度に一般化されたエージェントを進化させる。
進化するプログラムにおける創発的階層構造は、時間分解とメモリ上の問題環境の符号化を成功させるマルチタスクエージェントをもたらすことを示す。
論文 参考訳(メタデータ) (2021-06-23T21:34:32Z) - A Consciousness-Inspired Planning Agent for Model-Based Reinforcement
Learning [104.3643447579578]
本稿では、その状態の関連部分に動的に対応できるエンドツーエンドのモデルベース深層強化学習エージェントを提案する。
この設計により、エージェントは関連するオブジェクトに参画することで効果的に計画を学ぶことができ、配布外一般化がより良くなる。
論文 参考訳(メタデータ) (2021-06-03T19:35:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。