論文の概要: Novelty Accommodating Multi-Agent Planning in High Fidelity Simulated
Open World
- arxiv url: http://arxiv.org/abs/2306.12654v1
- Date: Thu, 22 Jun 2023 03:44:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2023-06-23 15:35:36.157461
- Title: Novelty Accommodating Multi-Agent Planning in High Fidelity Simulated
Open World
- Title(参考訳): 高忠実なオープンワールドにおける新規なマルチエージェント計画
- Authors: James Chao, Wiktor Piotrowski, Mitch Manzanares, Douglas S. Lange
- Abstract要約: ノベルティ(英: Novelty)は、環境のコア特性、組成、力学を変化させる予期せぬ現象である。
これまでの研究では、新規性はエージェントのパフォーマンスに破滅的な影響を及ぼすことが示されている。
本研究では、軍事領域の現実的な高忠実度シミュレータにおいて、ドメイン非依存のAIエージェントが、斬新な動作と推論を成功させるために適応できることを実証する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Autonomous agents acting in real-world environments often need to reason with
unknown novelties interfering with their plan execution. Novelty is an
unexpected phenomenon that can alter the core characteristics, composition, and
dynamics of the environment. Novelty can occur at any time in any sufficiently
complex environment without any prior notice or explanation. Previous studies
show that novelty has catastrophic impact on agent performance. Intelligent
agents reason with an internal model of the world to understand the intricacies
of their environment and to successfully execute their plans. The introduction
of novelty into the environment usually renders their internal model inaccurate
and the generated plans no longer applicable. Novelty is particularly prevalent
in the real world where domain-specific and even predicted novelty-specific
approaches are used to mitigate the novelty's impact. In this work, we
demonstrate that a domain-independent AI agent designed to detect,
characterize, and accommodate novelty in smaller-scope physics-based games such
as Angry Birds and Cartpole can be adapted to successfully perform and reason
with novelty in realistic high-fidelity simulator of the military domain.
- Abstract(参考訳): 現実の環境で行動する自律エージェントは、しばしば計画実行に干渉する未知の新規性を推論する必要がある。
ノベルティは、環境のコア特性、構成、ダイナミクスを変化させる予期せぬ現象である。
新規性は、事前の通知や説明なしに、十分に複雑な環境でいつでも起こりうる。
これまでの研究では、新規性はエージェントのパフォーマンスに破滅的な影響を及ぼすことが示されている。
インテリジェントエージェントは、環境の複雑さを理解し、その計画をうまく実行するために、世界の内部モデルを推論します。
環境への新規性の導入は通常、内部モデルを不正確なものにし、生成された計画はもはや適用されない。
ノベルティは特に、ドメイン固有で予測されるノベルティ固有のアプローチがノベルティの影響を緩和するために使われる実世界で広く使われている。
本研究では,angry birds や cartpole などの小型物理系ゲームにおいて,新奇性を検出,特徴化し,適応するドメインに依存しないaiエージェントを,軍用ドメインの現実的な高精細シミュレータにおいて,新奇性をうまく実行し,理性に適合させることを実証する。
関連論文リスト
- SynWorld: Virtual Scenario Synthesis for Agentic Action Knowledge Refinement [81.30121762971473]
SynWorldは、エージェントが自律的に環境を探索し、最適化し、アクションに対する理解を深めることを可能にするフレームワークである。
実験の結果,SynWorldは新しい環境下での行動知識の学習に効果的で汎用的なアプローチであることを実証した。
論文 参考訳(メタデータ) (2025-04-04T16:10:57Z) - A Meta-Engine Framework for Interleaved Task and Motion Planning using Topological Refinements [51.54559117314768]
タスク・アンド・モーション・プランニング(タスク・アンド・モーション・プランニング、TAMP)は、自動化された計画問題の解決策を見つけるための問題である。
本稿では,TAMP問題のモデル化とベンチマークを行うための,汎用的でオープンソースのフレームワークを提案する。
移動エージェントと複数のタスク状態依存障害を含むTAMP問題を解決する革新的なメタ技術を導入する。
論文 参考訳(メタデータ) (2024-08-11T14:57:57Z) - AgentGen: Enhancing Planning Abilities for Large Language Model based Agent via Environment and Task Generation [81.32722475387364]
大規模言語モデルに基づくエージェントが注目され、ますます人気が高まっている。
計画能力は LLM ベースのエージェントの重要な構成要素であり、通常は初期状態から望ましい目標を達成する必要がある。
近年の研究では、専門家レベルの軌跡を指導訓練用LLMに活用することで、効果的に計画能力を向上させることが示されている。
論文 参考訳(メタデータ) (2024-08-01T17:59:46Z) - Synergising Human-like Responses and Machine Intelligence for Planning in Disaster Response [10.294618771570985]
デュアルプロセス理論(DPT)にインスパイアされた注意に基づく認知アーキテクチャを提案する。
このフレームワークは、高速だが(人間のような)応答と、遅いが最適化されたマシンインテリジェンスの計画能力を統合する。
論文 参考訳(メタデータ) (2024-04-15T15:47:08Z) - HAZARD Challenge: Embodied Decision Making in Dynamically Changing
Environments [93.94020724735199]
HAZARDは、火災、洪水、風などの3つの予期せぬ災害シナリオで構成されている。
このベンチマークにより、さまざまなパイプラインで自律エージェントの意思決定能力を評価することができる。
論文 参考訳(メタデータ) (2024-01-23T18:59:43Z) - Agent AI: Surveying the Horizons of Multimodal Interaction [83.18367129924997]
エージェントAI(Agent AI)とは、視覚刺激や言語入力、その他の環境データを知覚できる対話型システムである。
我々は,バーチャルリアリティやシミュレートされたシーンを容易に作成し,仮想環境内に具体化されたエージェントと対話できる未来を構想する。
論文 参考訳(メタデータ) (2024-01-07T19:11:18Z) - AI planning in the imagination: High-level planning on learned abstract
search spaces [68.75684174531962]
我々は,エージェントが訓練中に学習する抽象的な検索空間において,エージェントが計画することを可能にする,PiZeroと呼ばれる新しい手法を提案する。
本研究では,旅行セールスマン問題,ソコバン問題,2048年,施設立地問題,パックマン問題など,複数の分野で評価を行った。
論文 参考訳(メタデータ) (2023-08-16T22:47:16Z) - A Domain-Independent Agent Architecture for Adaptive Operation in
Evolving Open Worlds [18.805929922009806]
HYDRAは、混合した離散連続世界で動作するモデルベースのエージェントを設計するためのフレームワークである。
これは、エージェントが様々な側面から自身の振る舞いを監視できるようにする、新しいメタ推論プロセスを実装している。
このフレームワークは、3つの異なるドメインに対して新規に認識されたエージェントを実装するために使われてきた。
論文 参考訳(メタデータ) (2023-06-09T21:54:13Z) - Human in the Loop Novelty Generation [2.320417845168326]
新規性を生成するためにドメイン依存の人間指導を必要としない環境の抽象モデルを用いた新規性生成の新しいアプローチを導入する。
本稿では,オープンソースノベルティ生成ライブラリを用いたHuman-in-the-Loopのノベルティ生成プロセスについて述べる。
以上の結果から,モノポリードメインとビズドゥームドメインの両方において,新規性を4時間以内で開発,実装,テスト,修正できるHuman-in-the-Loop方式が得られた。
論文 参考訳(メタデータ) (2023-06-07T22:30:27Z) - Egocentric Planning for Scalable Embodied Task Achievement [6.870094263016224]
エゴセントリックプランニング(Egocentric Planning)は、複雑な環境におけるタスクを解決するために、シンボリックプランニングとオブジェクト指向のPOMDPを組み合わせた革新的なアプローチである。
国内タスク用に設計されたシミュレーション環境であるALFREDにおける我々のアプローチを評価し,そのスケーラビリティを実証した。
本手法では, エージェントの行動の前提条件と影響について, 信頼性の高い認識と記号的記述の特定, 学習が必要である。
論文 参考訳(メタデータ) (2023-06-02T06:41:24Z) - NovPhy: A Testbed for Physical Reasoning in Open-world Environments [5.736794130342911]
現実の世界では、私たちはこれまで遭遇したことのない新しい状況に直面しています。
エージェントは、オープンワールドの物理的環境で適切に操作するために、新規性の影響下で機能する能力を持つ必要がある。
我々は,新規性の存在下での物理的シナリオをエージェントが説明する必要がある新しいテストベッド,NovPhyを提案する。
論文 参考訳(メタデータ) (2023-03-03T04:59:03Z) - Characterizing Novelty in the Military Domain [0.0]
運用において、リッチな環境は、トレーニングセットやエンジニアリングモデルで説明されていない課題を提示する可能性が高い。
国防高等研究計画局(DARPA)のプログラムは、新規性に堅牢なエージェントの開発を目指している。
この能力は、ミッションクリティカルな環境の中でAIが想定される役割の前に必要となる。
論文 参考訳(メタデータ) (2023-02-23T20:21:24Z) - Neuro-Symbolic World Models for Adapting to Open World Novelty [9.707805250772129]
早急なノベルティ適応のための、エンドツーエンドのトレーニング可能なニューロシンボリックワールドモデルであるWorldClonerを紹介する。
WorldClonerは、プレノベルティ環境遷移の効率的なシンボル表現を学ぶ。
WorldClonerは、想像力に基づく適応を使用してポリシー学習プロセスを強化する。
論文 参考訳(メタデータ) (2023-01-16T07:49:12Z) - Evolving Hierarchical Memory-Prediction Machines in Multi-Task
Reinforcement Learning [4.030910640265943]
行動エージェントは、時間とともに様々な環境や目的にまたがって一般化されなければならない。
遺伝的プログラミングを用いて、制御文献から6つのユニークな環境で動作可能な、高度に一般化されたエージェントを進化させる。
進化するプログラムにおける創発的階層構造は、時間分解とメモリ上の問題環境の符号化を成功させるマルチタスクエージェントをもたらすことを示す。
論文 参考訳(メタデータ) (2021-06-23T21:34:32Z) - A Consciousness-Inspired Planning Agent for Model-Based Reinforcement
Learning [104.3643447579578]
本稿では、その状態の関連部分に動的に対応できるエンドツーエンドのモデルベース深層強化学習エージェントを提案する。
この設計により、エージェントは関連するオブジェクトに参画することで効果的に計画を学ぶことができ、配布外一般化がより良くなる。
論文 参考訳(メタデータ) (2021-06-03T19:35:19Z) - Emergent Complexity and Zero-shot Transfer via Unsupervised Environment
Design [121.73425076217471]
本研究では,未知のパラメータを持つ環境を提供するUnsupervised Environment Design (UED)を提案する。
プロタゴニスト・アンタゴニストによるレグレト環境デザイン(PAIRED)と呼ぶ。
実験により, PAIREDは複雑な環境の自然なカリキュラムを生産し, PAIREDエージェントは, 高度に新規な環境での試験において, 高いゼロショット転送性能が得られることを示した。
論文 参考訳(メタデータ) (2020-12-03T17:37:01Z) - Integrating Egocentric Localization for More Realistic Point-Goal
Navigation Agents [90.65480527538723]
本研究では,ノイズ行動力学の下での自我行動の視覚的推定に依存するポイントゴールナビゲーションエージェントを開発した。
私たちのエージェントはCVPR 2020 Habitat ChallengeのPointNavトラックのランナーでした。
論文 参考訳(メタデータ) (2020-09-07T16:52:47Z) - Environment Shaping in Reinforcement Learning using State Abstraction [63.444831173608605]
状態抽象化を用いた環境形成の新しい枠組みを提案する。
私たちのキーとなるアイデアは、ノイズの多い信号で環境の大きな状態空間を抽象空間に圧縮することです。
エージェントの方針は, 形状の環境において学習し, 元の環境において, ほぼ最適動作を保っていることを示す。
論文 参考訳(メタデータ) (2020-06-23T17:00:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。