論文の概要: Projection Abstractions in Planning Under the Lenses of Abstractions for MDPs
- arxiv url: http://arxiv.org/abs/2412.02615v1
- Date: Tue, 03 Dec 2024 17:43:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-04 15:46:14.036567
- Title: Projection Abstractions in Planning Under the Lenses of Abstractions for MDPs
- Title(参考訳): MDPの抽象化レンズによる計画立案における投影抽象化
- Authors: Giuseppe Canonaco, Alberto Pozanco, Daniel Borrajo,
- Abstract要約: 抽象化の概念は、AIプランニングと割引マルコフ決定プロセス(MDP)の両方の文脈で独立に開発された。
本稿では, ディスカウントMDPのレンズを用いた計画計画における投影抽象化について考察する。
古典的あるいは確率的計画手法に基づいて構築されたプロジェクション抽象化から始めて、ディスカウントされたMDPで利用可能な抽象化フレームワークの下で、同じ抽象化がどのように得られるかを示す。
- 参考スコア(独自算出の注目度): 1.46184883556683
- License:
- Abstract: The concept of abstraction has been independently developed both in the context of AI Planning and discounted Markov Decision Processes (MDPs). However, the way abstractions are built and used in the context of Planning and MDPs is different even though lots of commonalities can be highlighted. To this day there is no work trying to relate and unify the two fields on the matter of abstractions unraveling all the different assumptions and their effect on the way they can be used. Therefore, in this paper we aim to do so by looking at projection abstractions in Planning through the lenses of discounted MDPs. Starting from a projection abstraction built according to Classical or Probabilistic Planning techniques, we will show how the same abstraction can be obtained under the abstraction frameworks available for discounted MDPs. Along the way, we will focus on computational as well as representational advantages and disadvantages of both worlds pointing out new research directions that are of interest for both fields.
- Abstract(参考訳): 抽象化の概念は、AIプランニングと割引マルコフ決定プロセス(MDP)の両方の文脈で独立に開発された。
しかし、多くの共通点が強調されているにもかかわらず、プランニングやMDPのコンテキストで抽象化を構築し、使用する方法が異なる。
この2つの分野を抽象化に関して関連づけ、統一しようとする作業は、現在、すべての異なる仮定とそれらの使用方法に対する影響を解き明かすものではありません。
そこで本稿では, ディスカウントMDPのレンズを通して, 計画における投影抽象化を考察し, その実現を目指す。
古典的あるいは確率的計画手法に基づいて構築されたプロジェクション抽象化から始めて、ディスカウントされたMDPで利用可能な抽象化フレームワークの下で、同じ抽象化がどのように得られるかを示す。
その過程で、我々は、計算だけでなく、両世界の表現上の優位性とデメリットにも焦点を合わせ、両分野にとって興味のある新しい研究方向を指摘する。
関連論文リスト
- Learning Abstract World Model for Value-preserving Planning with Options [11.254212901595523]
所与の時間的拡張行動の構造を利用して抽象マルコフ決定過程(MDP)を学習する。
我々は、これらのスキルによる計画が、抽象MDPにおける軌跡をシミュレートすることによって、元のMDPにおける有界値損失のポリシーをもたらすことを確実にするために必要な状態抽象化を特徴付ける。
目標をベースとしたナビゲーション環境では,連続的な抽象状態の計画が成功し,抽象モデル学習が計画と学習のサンプル効率を向上させることを示す。
論文 参考訳(メタデータ) (2024-06-22T13:41:02Z) - Learning Planning Abstractions from Language [28.855381137615275]
本稿では,シーケンシャルな意思決定領域における状態と行動の抽象化を学習するためのフレームワークを提案する。
言語からの抽象化(PARL)を計画する我々のフレームワークは、言語アノテーションによる実演を利用して、象徴的で抽象的なアクション空間を自動的に発見する。
論文 参考訳(メタデータ) (2024-05-06T21:24:22Z) - How to Handle Sketch-Abstraction in Sketch-Based Image Retrieval? [120.49126407479717]
スケッチの抽象化を様々なレベルで処理できるスケッチベース画像検索フレームワークを提案する。
粒度レベルの抽象理解のために、検索モデルはすべての抽象レベルを等しく扱ってはならないと規定する。
私たちのAcc.@qの損失は、評価がいかに厳格であるかという点で、スケッチが焦点を絞りたり壊したりできます。
論文 参考訳(メタデータ) (2024-03-11T23:08:29Z) - AbsPyramid: Benchmarking the Abstraction Ability of Language Models with a Unified Entailment Graph [62.685920585838616]
抽象能力は人間の知性において必須であり、言語モデルでは未探索のままである。
本稿では、抽象知識の221Kテキスト記述を統一したエンテーメントグラフであるAbsPyramidを提案する。
論文 参考訳(メタデータ) (2023-11-15T18:11:23Z) - Ideal Abstractions for Decision-Focused Learning [108.15241246054515]
本稿では,決定関連情報の損失を最小限に抑えるために,出力空間を自動的に構成する手法を提案する。
本手法は,ディープニューラルネットワークトレーニングのためのデータ取得と,閉ループ山火事管理タスクの2つの領域で実証する。
論文 参考訳(メタデータ) (2023-03-29T23:31:32Z) - Does Deep Learning Learn to Abstract? A Systematic Probing Framework [69.2366890742283]
抽象化はディープラーニングモデルにとって望ましい機能であり、具体的なインスタンスから抽象概念を誘導し、学習コンテキストを超えて柔軟に適用することを意味する。
本稿では,伝達可能性の観点から,ディープラーニングモデルの抽象化能力を検討するための体系的探索フレームワークを提案する。
論文 参考訳(メタデータ) (2023-02-23T12:50:02Z) - Inventing Relational State and Action Abstractions for Effective and
Efficient Bilevel Planning [26.715198108255162]
我々は状態と行動の抽象化を学習するための新しいフレームワークを開発する。
我々は、対象のアイデンティティや数値を一般化するリレーショナル、ニューロシンボリックな抽象化を学ぶ。
学習した抽象化によって、より長い地平線のホールドアウトタスクを迅速に解決できることが示されています。
論文 参考訳(メタデータ) (2022-03-17T22:13:09Z) - MDP Abstraction with Successor Features [14.433551477386318]
本研究では,エージェントが状態や時間的抽象化を行う強化学習の文脈における抽象化について検討する。
本研究では,後継機能に基づく新しい抽象スキームである後継抽象化を提案する。
我々の後継抽象化は、異なる環境間で伝達可能なセマンティクスで抽象環境モデルを学習することを可能にする。
論文 参考訳(メタデータ) (2021-10-18T11:35:08Z) - Learning Models as Functionals of Signed-Distance Fields for
Manipulation Planning [51.74463056899926]
本研究では,シーン内のオブジェクトを表す符号付き距離場の目的を学習する,最適化に基づく操作計画フレームワークを提案する。
オブジェクトを符号付き距離場として表現することは、ポイントクラウドや占有率の表現よりも高い精度で、様々なモデルの学習と表現を可能にする。
論文 参考訳(メタデータ) (2021-10-02T12:36:58Z) - Learning Abstract Models for Strategic Exploration and Fast Reward
Transfer [85.19766065886422]
我々は,抽象状態のマルコフ決定過程(MDP)を正確に学習し,複雑なエラーを避ける。
本手法は,最も難易度の高い3つのアーケード学習環境ゲームにおいて,強力な結果をもたらす。
学習した抽象MDPを新しい報酬関数に再利用することができ、スクラッチから訓練されたモデルフリーメソッドよりも1000倍少ないサンプルで高い報酬が得られる。
論文 参考訳(メタデータ) (2020-07-12T03:33:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。