論文の概要: Abstracting Situation Calculus Action Theories
- arxiv url: http://arxiv.org/abs/2410.14712v1
- Date: Wed, 09 Oct 2024 16:34:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-27 05:11:51.723050
- Title: Abstracting Situation Calculus Action Theories
- Title(参考訳): 計算機行動理論の抽象化
- Authors: Bita Banihashemi, Giuseppe De Giacomo, Yves Lespérance,
- Abstract要約: エージェントの高レベルな仕様と低レベルな仕様があり、どちらも基本的なアクション理論として表現されていると仮定する。
リファインメントマッピングは、各ハイレベルアクションが低レベルなConGologプログラムによってどのように実装されるかを指定する。
低レベルなアクションシーケンスに対して、一意なハイレベルなアクションシーケンスが存在することを保証するための基本的なアクション理論の制約を識別する。
- 参考スコア(独自算出の注目度): 24.181367387692944
- License:
- Abstract: We develop a general framework for agent abstraction based on the situation calculus and the ConGolog agent programming language. We assume that we have a high-level specification and a low-level specification of the agent, both represented as basic action theories. A refinement mapping specifies how each high-level action is implemented by a low-level ConGolog program and how each high-level fluent can be translated into a low-level formula. We define a notion of sound abstraction between such action theories in terms of the existence of a suitable bisimulation between their respective models. Sound abstractions have many useful properties that ensure that we can reason about the agent's actions (e.g., executability, projection, and planning) at the abstract level, and refine and concretely execute them at the low level. We also characterize the notion of complete abstraction where all actions (including exogenous ones) that the high level thinks can happen can in fact occur at the low level. To facilitate verifying that one has a sound/complete abstraction relative to a mapping, we provide a set of necessary and sufficient conditions. Finally, we identify a set of basic action theory constraints that ensure that for any low-level action sequence, there is a unique high-level action sequence that it refines. This allows us to track/monitor what the low-level agent is doing and describe it in abstract terms (i.e., provide high-level explanations, for instance, to a client or manager).
- Abstract(参考訳): 本研究では,状況計算とConGologエージェント言語に基づくエージェント抽象化のための汎用フレームワークを開発する。
エージェントの高レベルな仕様と低レベルな仕様があり、どちらも基本的なアクション理論として表現されていると仮定する。
低レベルなConGologプログラムによって、各ハイレベルなアクションがどのように実装され、また、各ハイレベルなフロートが低レベルな公式に変換されるかを指定する。
そこで本研究では,各モデル間の適切なバイシミュレートが存在するという観点から,このような行動理論間の音の抽象化の概念を定義した。
音の抽象化には、抽象レベルでエージェントのアクション(例えば、実行可能性、投影、計画)を推論できることを保証する多くの有用な特性があり、それらを低レベルで洗練し、具体的に実行します。
我々はまた、ハイレベルが実際に低レベルで起こりうるすべての行動(外生的行動を含む)が実際に起こりうる完全な抽象化の概念を特徴づける。
マッピングに対する音響・完全抽象化の検証を容易にするため,必要な条件と十分な条件のセットを提供する。
最後に、低レベルなアクションシーケンスに対して、それが洗練するユニークなハイレベルなアクションシーケンスが存在することを確実にする基本的なアクション理論の制約を識別する。
これにより、低レベルのエージェントが何をしているかを追跡し、それを抽象的な用語で記述することができます(例えば、クライアントやマネージャに高レベルの説明を提供するなど)。
関連論文リスト
- Building Minimal and Reusable Causal State Abstractions for
Reinforcement Learning [63.58935783293342]
Causal Bisimulation Modeling (CBM) は、各タスクのダイナミクスと報酬関数の因果関係を学習し、最小限のタスク固有の抽象化を導出する手法である。
CBMの学習された暗黙的ダイナミクスモデルは、明確なものよりも根底にある因果関係と状態抽象化を正確に識別する。
論文 参考訳(メタデータ) (2024-01-23T05:43:15Z) - AI planning in the imagination: High-level planning on learned abstract
search spaces [68.75684174531962]
我々は,エージェントが訓練中に学習する抽象的な検索空間において,エージェントが計画することを可能にする,PiZeroと呼ばれる新しい手法を提案する。
本研究では,旅行セールスマン問題,ソコバン問題,2048年,施設立地問題,パックマン問題など,複数の分野で評価を行った。
論文 参考訳(メタデータ) (2023-08-16T22:47:16Z) - Abstraction of Nondeterministic Situation Calculus Action Theories --
Extended Version [23.24285208243607]
非決定論的領域で動作するエージェントの動作を抽象化するための一般的なフレームワークを開発する。
我々は抽象的かつ具体的な非決定論的基本作用論を持っていると仮定する。
エージェントが目標/完了タスクを抽象レベルで達成するための(強いFOND)計画/戦略を持っている場合、具体レベルでは非決定論的抽象アクションを常に実行可能であることを示す。
論文 参考訳(メタデータ) (2023-05-20T05:42:38Z) - Abstracting Noisy Robot Programs [17.04153879817609]
本稿では,確率的および動的システムの抽象化へのアプローチについて述べる。
確率論的信念を持つ状況計算の変種に基づいて、バイシミュレーションの概念を定義する。
我々は、不要な詳細を省略し、実際の実行のために詳細なプログラムに変換できる抽象的なGologプログラムを得る。
論文 参考訳(メタデータ) (2022-04-07T16:04:19Z) - Inventing Relational State and Action Abstractions for Effective and
Efficient Bilevel Planning [26.715198108255162]
我々は状態と行動の抽象化を学習するための新しいフレームワークを開発する。
我々は、対象のアイデンティティや数値を一般化するリレーショナル、ニューロシンボリックな抽象化を学ぶ。
学習した抽象化によって、より長い地平線のホールドアウトタスクを迅速に解決できることが示されています。
論文 参考訳(メタデータ) (2022-03-17T22:13:09Z) - Provably Efficient Causal Model-Based Reinforcement Learning for
Systematic Generalization [30.456180468318305]
逐次的意思決定設定では、エージェントは、おそらく無限の、大きな環境の集合に対して体系的な一般化を達成することを目的としている。
本稿では,因果的視点を用いた体系的一般化の抽出可能な定式化について述べる。
特定の構造的仮定の下では、望まざる計画誤差を避けられない準最適項まで保証する単純な学習アルゴリズムを提供する。
論文 参考訳(メタデータ) (2022-02-14T08:34:51Z) - Language Models as Zero-Shot Planners: Extracting Actionable Knowledge
for Embodied Agents [111.33545170562337]
自然言語で表現された高レベルなタスクを、選択された実行可能なステップのセットに基底付ける可能性について検討する。
事前学習したLMが十分に大きく、適切に誘導された場合、ハイレベルなタスクを効果的に低レベルな計画に分解できることがわかった。
本稿では,既存の実演の条件を規定し,計画が許容可能な行動に意味的に変換される手順を提案する。
論文 参考訳(メタデータ) (2022-01-18T18:59:45Z) - Value Function Spaces: Skill-Centric State Abstractions for Long-Horizon
Reasoning [120.38381203153159]
強化学習は、複雑なタスクを効果的に実行するポリシーを訓練することができる。
長期のタスクでは、これらのメソッドのパフォーマンスは水平線とともに劣化し、しばしば推論と下層のスキルの構築を必要とします。
そこで我々は,各下層スキルに対応する値関数を用いて,そのような表現を生成するシンプルな手法として,値関数空間を提案する。
論文 参考訳(メタデータ) (2021-11-04T22:46:16Z) - Procedures as Programs: Hierarchical Control of Situated Agents through
Natural Language [81.73820295186727]
エージェント命令と制御のための階層的な手続き的知識を表現する強力な手法である,プログラムとしての手続きの形式化を提案する。
NL命令に対するIQAおよびALFREDデータセット上で、このフレームワークをインスタンス化する。
論文 参考訳(メタデータ) (2021-09-16T20:36:21Z) - What can I do here? A Theory of Affordances in Reinforcement Learning [65.70524105802156]
我々はマルコフ決定過程の学習と計画を行うエージェントのための余裕の理論を開発する。
このケースでは、任意の状況で利用可能なアクションの数を減らすことで、アフォーダンスが二重の役割を担います。
本稿では,よりシンプルで一般化された遷移モデルを推定するために,余裕を学習し,それを利用するアプローチを提案する。
論文 参考訳(メタデータ) (2020-06-26T16:34:53Z) - From proprioception to long-horizon planning in novel environments: A
hierarchical RL model [4.44317046648898]
本稿では,異なるタイプの推論を反映した,単純で3段階の階層型アーキテクチャを提案する。
本手法をMujoco Ant環境における一連のナビゲーションタスクに適用する。
論文 参考訳(メタデータ) (2020-06-11T17:19:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。