論文の概要: Abstraction of Nondeterministic Situation Calculus Action Theories --
Extended Version
- arxiv url: http://arxiv.org/abs/2305.14222v1
- Date: Sat, 20 May 2023 05:42:38 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-24 14:44:49.194801
- Title: Abstraction of Nondeterministic Situation Calculus Action Theories --
Extended Version
- Title(参考訳): 非決定論的状況計算行動理論の抽象化 -拡張版
- Authors: Bita Banihashemi, Giuseppe De Giacomo, Yves Lesp\'erance
- Abstract要約: 非決定論的領域で動作するエージェントの動作を抽象化するための一般的なフレームワークを開発する。
我々は抽象的かつ具体的な非決定論的基本作用論を持っていると仮定する。
エージェントが目標/完了タスクを抽象レベルで達成するための(強いFOND)計画/戦略を持っている場合、具体レベルでは非決定論的抽象アクションを常に実行可能であることを示す。
- 参考スコア(独自算出の注目度): 23.24285208243607
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We develop a general framework for abstracting the behavior of an agent that
operates in a nondeterministic domain, i.e., where the agent does not control
the outcome of the nondeterministic actions, based on the nondeterministic
situation calculus and the ConGolog programming language. We assume that we
have both an abstract and a concrete nondeterministic basic action theory, and
a refinement mapping which specifies how abstract actions, decomposed into
agent actions and environment reactions, are implemented by concrete ConGolog
programs. This new setting supports strategic reasoning and strategy synthesis,
by allowing us to quantify separately on agent actions and environment
reactions. We show that if the agent has a (strong FOND) plan/strategy to
achieve a goal/complete a task at the abstract level, and it can always execute
the nondeterministic abstract actions to completion at the concrete level, then
there exists a refinement of it that is a (strong FOND) plan/strategy to
achieve the refinement of the goal/task at the concrete level.
- Abstract(参考訳): 本研究では,非決定論的領域で動作するエージェントの動作を抽象化する一般的な枠組み,すなわち,非決定論的状況計算とConGologプログラミング言語に基づいて,エージェントが非決定論的行動の結果を制御しないようなフレームワークを開発する。
我々は,抽象的・具体的非決定論的基本行動理論と,抽象的行動がエージェント行動と環境反応に分解される様子を具体的コンゴログプログラムで記述した精細化写像を仮定する。
この新たな設定は、エージェントアクションと環境反応を別々に定量化することで、戦略的推論と戦略合成をサポートする。
エージェントが(強いFOND)計画/戦略を持ち、抽象レベルでゴール/完了タスクを達成でき、かつ、常に具体レベルで完了までの非決定論的抽象動作を実行することができる場合、(強いFOND)計画/戦略であり、具体レベルでゴール/タスクの洗練を達成するための改善が存在することを示す。
関連論文リスト
- DynaSaur: Large Language Agents Beyond Predefined Actions [108.75187263724838]
既存のLLMエージェントシステムは、通常、各ステップで固定セットと事前定義されたセットからアクションを選択する。
動作の動的生成と構成をオンラインで実現するLLMエージェントフレームワークを提案する。
GAIAベンチマーク実験により, このフレームワークは柔軟性が向上し, 従来の手法よりも優れていたことが確認された。
論文 参考訳(メタデータ) (2024-11-04T02:08:59Z) - Abstracting Situation Calculus Action Theories [24.181367387692944]
エージェントの高レベルな仕様と低レベルな仕様があり、どちらも基本的なアクション理論として表現されていると仮定する。
リファインメントマッピングは、各ハイレベルアクションが低レベルなConGologプログラムによってどのように実装されるかを指定する。
低レベルなアクションシーケンスに対して、一意なハイレベルなアクションシーケンスが存在することを保証するための基本的なアクション理論の制約を識別する。
論文 参考訳(メタデータ) (2024-10-09T16:34:28Z) - Learning Abstract World Model for Value-preserving Planning with Options [11.254212901595523]
所与の時間的拡張行動の構造を利用して抽象マルコフ決定過程(MDP)を学習する。
我々は、これらのスキルによる計画が、抽象MDPにおける軌跡をシミュレートすることによって、元のMDPにおける有界値損失のポリシーをもたらすことを確実にするために必要な状態抽象化を特徴付ける。
目標をベースとしたナビゲーション環境では,連続的な抽象状態の計画が成功し,抽象モデル学習が計画と学習のサンプル効率を向上させることを示す。
論文 参考訳(メタデータ) (2024-06-22T13:41:02Z) - Unified Task and Motion Planning using Object-centric Abstractions of
Motion Constraints [56.283944756315066]
本稿では,タスクとモーションプランニングを一つの検索に統一するTAMP手法を提案する。
我々のアプローチは、オフザシェルフAIサーチの計算効率を活用して、物理的に実現可能な計画が得られるような、オブジェクト中心の動作制約の抽象化に基づいている。
論文 参考訳(メタデータ) (2023-12-29T14:00:20Z) - Code Models are Zero-shot Precondition Reasoners [83.8561159080672]
シーケンシャルな意思決定タスクのために、コード表現を使ってアクションの前提条件を推論します。
本稿では,政策によって予測される行動が前提条件と一致していることを保証する事前条件対応行動サンプリング戦略を提案する。
論文 参考訳(メタデータ) (2023-11-16T06:19:27Z) - Consciousness-Inspired Spatio-Temporal Abstractions for Better Generalization in Reinforcement Learning [83.41487567765871]
Skipperはモデルベースの強化学習フレームワークである。
これは、与えられたタスクをより小さく、より管理しやすいサブタスクに自動的に一般化する。
環境の関連部分には、スパースな意思決定と集中した抽象化を可能にする。
論文 参考訳(メタデータ) (2023-09-30T02:25:18Z) - LTLf Best-Effort Synthesis in Nondeterministic Planning Domains [27.106071554421664]
完全可観測非決定性領域(FOND)におけるベストエフォート戦略(いわゆる計画)について検討する。
非決定論的計画領域の特異性を生かしたベストエフォート戦略を合成するゲーム理論合成手法を提案する。
論文 参考訳(メタデータ) (2023-08-29T10:10:41Z) - AI planning in the imagination: High-level planning on learned abstract
search spaces [68.75684174531962]
我々は,エージェントが訓練中に学習する抽象的な検索空間において,エージェントが計画することを可能にする,PiZeroと呼ばれる新しい手法を提案する。
本研究では,旅行セールスマン問題,ソコバン問題,2048年,施設立地問題,パックマン問題など,複数の分野で評価を行った。
論文 参考訳(メタデータ) (2023-08-16T22:47:16Z) - Exploration Policies for On-the-Fly Controller Synthesis: A
Reinforcement Learning Approach [0.0]
強化学習(RL)に基づく非有界学習のための新しい手法を提案する。
我々のエージェントは、非常に観察可能な部分的なRLタスクでスクラッチから学習し、トレーニング中に見つからないケースで、全体のパフォーマンスを上回ります。
論文 参考訳(メタデータ) (2022-10-07T20:28:25Z) - Inventing Relational State and Action Abstractions for Effective and
Efficient Bilevel Planning [26.715198108255162]
我々は状態と行動の抽象化を学習するための新しいフレームワークを開発する。
我々は、対象のアイデンティティや数値を一般化するリレーショナル、ニューロシンボリックな抽象化を学ぶ。
学習した抽象化によって、より長い地平線のホールドアウトタスクを迅速に解決できることが示されています。
論文 参考訳(メタデータ) (2022-03-17T22:13:09Z) - Generalized Inverse Planning: Learning Lifted non-Markovian Utility for
Generalizable Task Representation [83.55414555337154]
本研究では,人間の実演からこのような有用性を学ぶことを研究する。
本稿では,本領域におけるユーティリティ学習のための新しい探索手法である一般化逆計画を提案する。
計算フレームワークである最大エントロピー逆計画(MEIP)について概説し、非マルコフ的効用と関連する概念を生成的に学習する。
論文 参考訳(メタデータ) (2020-11-12T21:06:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。