論文の概要: Lifted Forward Planning in Relational Factored Markov Decision Processes with Concurrent Actions
- arxiv url: http://arxiv.org/abs/2505.22147v1
- Date: Wed, 28 May 2025 09:08:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-29 17:35:50.523892
- Title: Lifted Forward Planning in Relational Factored Markov Decision Processes with Concurrent Actions
- Title(参考訳): 連接行動を伴う関係因子マルコフ決定過程におけるリフテッドフォワード計画
- Authors: Florian Andreas Marwitz, Tanya Braun, Ralf Möller, Marcel Gehrke,
- Abstract要約: 対象数の指数的サイズではなく,空間を格納する一階表現を提案する。
我々はまた、この表現を用いて、多くの識別不能なオブジェクトやアクションに対するポリシーを効率的に計算する、リレーショナル・フォワード・プランナーであるForeplanを紹介した。
- 参考スコア(独自算出の注目度): 3.8034305806296747
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Decision making is a central problem in AI that can be formalized using a Markov Decision Process. A problem is that, with increasing numbers of (indistinguishable) objects, the state space grows exponentially. To compute policies, the state space has to be enumerated. Even more possibilities have to be enumerated if the size of the action space depends on the size of the state space, especially if we allow concurrent actions. To tackle the exponential blow-up in the action and state space, we present a first-order representation to store the spaces in polynomial instead of exponential size in the number of objects and introduce Foreplan, a relational forward planner, which uses this representation to efficiently compute policies for numerous indistinguishable objects and actions. Additionally, we introduce an even faster approximate version of Foreplan. Moreover, Foreplan identifies how many objects an agent should act on to achieve a certain task given restrictions. Further, we provide a theoretical analysis and an empirical evaluation of Foreplan, demonstrating a speedup of at least four orders of magnitude.
- Abstract(参考訳): 意思決定はAIの中心的な問題であり、マルコフ決定プロセスを使って形式化することができる。
問題は、(区別できない)対象の数が増加するにつれて、状態空間が指数関数的に増加することである。
ポリシーを計算するには、状態空間を列挙する必要がある。
アクション空間のサイズが状態空間のサイズに依存する場合、特に並列アクションを許容する場合、さらに多くの可能性が列挙される必要がある。
動作空間と状態空間の指数的爆発に対処するために、対象数の指数的サイズではなく、多項式に空間を格納する一階述語表現と、この表現を用いて、多くの識別不可能な対象や動作に対するポリシーを効率的に計算する関係フォアプランを導入する。
さらに、Foreplanのより高速な近似バージョンも導入します。
さらに、Foreplanは、指定された制限のあるタスクを達成するために、エージェントが動作すべきオブジェクトの数を特定する。
さらに,Foreplanの理論的解析と実証評価を行い,少なくとも4桁のスピードアップを示す。
関連論文リスト
- Counting and Reasoning with Plans [19.223883847258158]
本研究は,計画空間の定量的,定性的推論のための最初の研究である。
理論的には、その複雑さについて研究し、リッチな推論モードが生まれる。
そこで我々は,計画課題を命題式に変換し,異なる計画を立てるために知識コンパイルを利用する。
論文 参考訳(メタデータ) (2025-01-31T20:03:51Z) - Unified Task and Motion Planning using Object-centric Abstractions of
Motion Constraints [56.283944756315066]
本稿では,タスクとモーションプランニングを一つの検索に統一するTAMP手法を提案する。
我々のアプローチは、オフザシェルフAIサーチの計算効率を活用して、物理的に実現可能な計画が得られるような、オブジェクト中心の動作制約の抽象化に基づいている。
論文 参考訳(メタデータ) (2023-12-29T14:00:20Z) - Skip-Plan: Procedure Planning in Instructional Videos via Condensed
Action Space Learning [85.84504287685884]
Skip-Plan(スキップ・プラン)は、訓練ビデオにおけるプロシージャ計画のための凝縮された行動空間学習法である。
アクションチェーン内の不確実なノードやエッジをスキップすることで、長いシーケンス関数と複雑なシーケンス関数を短いが信頼できるものに転送する。
我々のモデルは、凝縮された作用空間内のアクションシーケンス内で、あらゆる種類の信頼できる部分関係を探索する。
論文 参考訳(メタデータ) (2023-10-01T08:02:33Z) - AI planning in the imagination: High-level planning on learned abstract
search spaces [68.75684174531962]
我々は,エージェントが訓練中に学習する抽象的な検索空間において,エージェントが計画することを可能にする,PiZeroと呼ばれる新しい手法を提案する。
本研究では,旅行セールスマン問題,ソコバン問題,2048年,施設立地問題,パックマン問題など,複数の分野で評価を行った。
論文 参考訳(メタデータ) (2023-08-16T22:47:16Z) - Efficient Algorithms for Planning with Participation Constraints [74.74967476995572]
我々は[Zhang et al., 2022]に導入された参加制約を伴う計画の問題を考える。
この問題では、プリンシパルが決定プロセスのアクションを選択し、プリンシパルとエージェントの別々のユーティリティが生成される。
有限ホライズン設定では,これまでは$varepsilon$-approximationという付加値しか知られていなかった。
論文 参考訳(メタデータ) (2022-05-16T15:47:41Z) - Efficient Belief Space Planning in High-Dimensional State Spaces using
PIVOT: Predictive Incremental Variable Ordering Tactic [11.878820609988693]
我々は,不確実性の下でのオンライン意思決定の問題点を考察し,信頼空間における計画として定式化する。
このアプローチを PIVOT: Predictive Incremental Variable Ordering Tactic と呼ぶ。
この戦術を適用することで、状態推論の効率も向上する。
論文 参考訳(メタデータ) (2021-12-29T07:30:47Z) - Learning to Search in Task and Motion Planning with Streams [20.003445874753233]
ロボット工学におけるタスク計画問題と動作計画問題は、個別のタスク変数に対するシンボリック計画と、連続状態および動作変数に対する動作最適化を組み合わせたものである。
対象と事実の集合を最優先的に拡張する幾何学的情報に基づく記号プランナを提案する。
ブロックスタッキング操作タスクにおいて,このアルゴリズムを7DOFロボットアームに適用する。
論文 参考訳(メタデータ) (2021-11-25T15:58:31Z) - Dynamic Multi-Robot Task Allocation under Uncertainty and Temporal
Constraints [52.58352707495122]
本稿では,不確実性およびマルチエージェント協調の下での逐次意思決定における重要な計算課題を分離するマルチロボット割当アルゴリズムを提案する。
都市におけるマルチアームコンベヤベルトピック・アンド・プレイスとマルチドローン配送ディスパッチの2つの異なる領域における広範囲なシミュレーション結果について検証を行った。
論文 参考訳(メタデータ) (2020-05-27T01:10:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。