論文の概要: General Policies, Serializations, and Planning Width
- arxiv url: http://arxiv.org/abs/2012.08033v2
- Date: Wed, 23 Dec 2020 16:14:01 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-08 13:16:35.744309
- Title: General Policies, Serializations, and Planning Width
- Title(参考訳): 一般政策、直列化、及び計画幅
- Authors: Blai Bonet and Hector Geffner
- Abstract要約: 有界幅は、ドメインエンコーディングにおいて明示的あるいは暗黙的に表現される特徴の観点から、最適の一般ポリシーを許容する計画領域の特性であることを示す。
この研究はまた、ポリシースケッチの形でドメインのシリアライズを指定するための新しいシンプルで有意義で表現力のある言語にもつながります。
- 参考スコア(独自算出の注目度): 22.112881443209726
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: It has been observed that in many of the benchmark planning domains, atomic
goals can be reached with a simple polynomial exploration procedure, called IW,
that runs in time exponential in the problem width. Such problems have indeed a
bounded width: a width that does not grow with the number of problem variables
and is often no greater than two. Yet, while the notion of width has become
part of the state-of-the-art planning algorithms like BFWS, there is still no
good explanation for why so many benchmark domains have bounded width. In this
work, we address this question by relating bounded width and serialized width
to ideas of generalized planning, where general policies aim to solve multiple
instances of a planning problem all at once. We show that bounded width is a
property of planning domains that admit optimal general policies in terms of
features that are explicitly or implicitly represented in the domain encoding.
The results are extended to much larger class of domains with bounded
serialized width where the general policies do not have to be optimal. The
study leads also to a new simple, meaningful, and expressive language for
specifying domain serializations in the form of policy sketches which can be
used for encoding domain control knowledge by hand or for learning it from
traces. The use of sketches and the meaning of the theoretical results are all
illustrated through a number of examples.
- Abstract(参考訳): 多くのベンチマーク計画領域では、問題幅が指数関数的に動く単純な多項式探索手順(iw)で原子目標に達することが観察されている。
そのような問題には、実際に有界幅がある: 問題変数の数で成長せず、しばしば2より大きい幅である。
しかし、幅の概念はBFWSのような最先端の計画アルゴリズムの一部となっているが、なぜ多くのベンチマークドメインが幅境界を持つのかについては、まだよく説明されていない。
本研究では,計画問題の複数事例を一度に解決しようとする一般計画の考え方に,境界幅と直列幅を関連付けることで,この問題に対処する。
有界幅は、ドメインエンコーディングにおいて明示的あるいは暗黙的に表現される特徴の観点から、最適の一般ポリシーを許容する計画領域の特性であることを示す。
結果は、一般的なポリシーが最適である必要がないような境界付き直列化幅を持つはるかに大きな領域に拡張される。
この研究はまた、手作業でドメイン制御の知識をエンコードしたり、トレースから学習したりできるポリシースケッチの形でドメインシリアライズを指定するための、新しいシンプルで意味のある、表現力のある言語へと導かれる。
スケッチの使用と理論的結果の意味は、すべて多くの例を通して説明されている。
関連論文リスト
- DGMamba: Domain Generalization via Generalized State Space Model [80.82253601531164]
ドメイン一般化(DG)は、様々な場面における分散シフト問題を解決することを目的としている。
Mambaは、新興状態空間モデル(SSM)として、より優れた線形複雑性と大域的受容場を持つ。
本稿では,DGMamba という新たな DG フレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-11T14:35:59Z) - Improving Retrieval Augmented Open-Domain Question-Answering with Vectorized Contexts [83.57864140378035]
本稿では,オープンドメイン質問応答タスクにおいて,より長いコンテキストをカバーできる手法を提案する。
コンテキストを効果的にエンコードする小さなエンコーダ言語モデルを利用し、エンコーダは元の入力とクロスアテンションを適用する。
微調整後、2つのホールドインデータセット、4つのホールドアウトデータセット、および2つのIn Context Learning設定のパフォーマンスが改善された。
論文 参考訳(メタデータ) (2024-04-02T15:10:11Z) - General Policies, Subgoal Structure, and Planning Width [19.373790756767278]
原子目標を持つプランニングドメインは、IWと呼ばれる単純な探索手順によって、問題幅で指数関数的に実行される。
しかし、原子目標を考慮した場合、多くのベンチマークドメインが境界幅を持つ理由については、よく説明されていない。
論文 参考訳(メタデータ) (2023-11-09T16:30:22Z) - Multi-Domain Long-Tailed Learning by Augmenting Disentangled
Representations [80.76164484820818]
多くの現実世界の分類問題には、避けられない長い尾のクラスバランスの問題がある。
本稿では,この多領域長鎖学習問題について検討し,すべてのクラスとドメインにまたがってよく一般化されたモデルを作成することを目的とする。
TALLYは、選択的均衡サンプリング戦略に基づいて、ある例のセマンティック表現と別の例のドメイン関連ニュアンスを混合することでこれを達成している。
論文 参考訳(メタデータ) (2022-10-25T21:54:26Z) - Single-domain Generalization in Medical Image Segmentation via Test-time
Adaptation from Shape Dictionary [64.5632303184502]
ドメインの一般化は通常、モデル学習のために複数のソースドメインからのデータを必要とする。
本稿では,1つのソースドメインのみで最悪のシナリオ下でモデルを学習し,異なる未確認対象ドメインに直接一般化する,重要な単一ドメインの一般化問題について考察する。
本稿では,領域間で不変なセグメンテーションのセグメンテーション先情報を抽出し,統合する医用画像セグメンテーションにおいて,この問題に対処する新しいアプローチを提案する。
論文 参考訳(メタデータ) (2022-06-29T08:46:27Z) - Learning Sketches for Decomposing Planning Problems into Subproblems of
Bounded Width: Extended Version [18.95007906887466]
スケッチは、同じドメインから引き出されたインスタンスのサブゴール構造を表す一般的な言語として導入された。
本稿では,計画領域,対象とする問題のいくつか,スケッチ幅の所望値などを自動的に与えられたスケッチを学習する問題を提示する。
スケッチ学習者およびSIW_Rプランナーは、明快で明示的な形式でドメイン構造を学習し、活用するドメイン非依存プランナーを生成する。
論文 参考訳(メタデータ) (2022-03-28T15:49:08Z) - Compound Domain Generalization via Meta-Knowledge Encoding [55.22920476224671]
マルチモーダル分布を再正規化するために,スタイル駆動型ドメイン固有正規化(SDNorm)を導入する。
組込み空間における関係モデリングを行うために,プロトタイプ表現,クラスセントロイドを利用する。
4つの標準ドメイン一般化ベンチマークの実験により、COMENはドメインの監督なしに最先端のパフォーマンスを上回ることが判明した。
論文 参考訳(メタデータ) (2022-03-24T11:54:59Z) - Expressing and Exploiting the Common Subgoal Structure of Classical
Planning Domains Using Sketches: Extended Version [17.63517562327928]
我々は、Bornt と Geffner が最近導入したポリシースケッチと呼ばれる問題分解を表現するために、単純だが強力な言語を使用します。
ポリシースケッチRは、Booleanと数値的特徴のセットと、これらの特徴の値がどのように変化するかを表現するスケッチルールのセットで構成される。
本稿では,SIW_Rアルゴリズムを用いて,SIWで解けない多くの計画領域を短時間で解けることを示す。
論文 参考訳(メタデータ) (2021-05-10T10:36:18Z) - Generalizing to Unseen Domains: A Survey on Domain Generalization [59.16754307820612]
ドメイン一般化は、1つまたは複数の異なるが関連するドメインが与えられる困難な設定を扱う。
目標は、目に見えないテストドメインに一般化できるモデルを学ぶことです。
本稿では,領域一般化の最近の進歩に対する最初のレビューを紹介する。
論文 参考訳(メタデータ) (2021-03-02T06:04:11Z) - Hierarchical Width-Based Planning and Learning [8.776765645845012]
幅に基づく探索手法は、幅広いテストベッドで最先端の性能を実証している。
2つの抽象レベルを計画する階層型アルゴリズムを提案する。
学習方針と学習価値関数を組み合わせることで,提案する階層iwが,atariゲームにおける現在のフラットiwベースのプランナーよりも少ない報酬で勝ることを示す。
論文 参考訳(メタデータ) (2021-01-15T15:37:46Z) - Learning General Policies from Small Examples Without Supervision [18.718037284357834]
一般化計画は、計画ドメインの複数のインスタンスを一度に解決する一般的なポリシーの計算に関するものです。
近年、これらのポリシーは2つのステップで計算可能であることが示されている。まず、定性的数値計画問題(QNP)の形で適切な抽象化をサンプル計画から学習する。
本稿では,サンプルプランやqnpプランナーを必要とせず,より表現力のある汎用ポリシーを計算するための代替手法を提案する。
論文 参考訳(メタデータ) (2021-01-03T19:44:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。