論文の概要: Compact Belief State Representation for Task Planning
- arxiv url: http://arxiv.org/abs/2008.10386v1
- Date: Fri, 21 Aug 2020 09:38:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-26 21:37:10.141810
- Title: Compact Belief State Representation for Task Planning
- Title(参考訳): タスク計画のためのコンパクト信念状態表現
- Authors: Evgenii Safronov, Michele Colledanchise and Lorenzo Natale
- Abstract要約: 我々は、カルデシアン積に基づく新しい信念状態表現と、信念のサブステートに対するユニオン操作を開発する。
これら2つの演算と単一変数割り当てノードは、Breief State (AOBS)のAnd-Or有向非巡回グラフを形成する
AOBS表現は、完全な信念状態よりもはるかにコンパクトであるだけでなく、ほとんどの場合においてバイナリ決定ダイアグラムよりも優れたスケールを示す。
- 参考スコア(独自算出の注目度): 8.521089975868131
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Task planning in a probabilistic belief state domains allows generating
complex and robust execution policies in those domains affected by state
uncertainty. The performance of a task planner relies on the belief state
representation. However, current belief state representation becomes easily
intractable as the number of variables and execution time grows. To address
this problem, we developed a novel belief state representation based on
cartesian product and union operations over belief substates. These two
operations and single variable assignment nodes form And-Or directed acyclic
graph of Belief State (AOBS). We show how to apply actions with probabilistic
outcomes and measure the probability of conditions holding over belief state.
We evaluated AOBS performance in simulated forward state space exploration. We
compared the size of AOBS with the size of Binary Decision Diagrams (BDD) that
were previously used to represent belief state. We show that AOBS
representation is not only much more compact than a full belief state but it
also scales better than BDD for most of the cases.
- Abstract(参考訳): 確率的信念状態ドメインにおけるタスクプランニングは、状態の不確実性によって影響を受けるこれらのドメインにおいて、複雑で堅牢な実行ポリシーを生成することができる。
タスクプランナーのパフォーマンスは、信念状態の表現に依存します。
しかし、変数の数や実行時間が大きくなると、現在の信念状態表現は容易に難解になる。
この問題に対処するため,我々はカルデシアン積に基づく新しい信念状態表現と,信念サブステートに対するユニオン操作を開発した。
これら2つの演算と単一変数割り当てノードは、Breief State (AOBS)のAnd-Or方向の非巡回グラフを形成する。
本研究では,確率的結果を用いた行動の適用方法を示し,信念状態の保留条件の確率を測る。
模擬前方空間探査におけるAOBSの性能評価を行った。
AOBSのサイズを、以前信仰状態を表すために用いられていた2値決定図(BDD)のサイズと比較した。
AOBSの表現は、完全な信念状態よりもはるかにコンパクトであるだけでなく、多くの場合、BDDよりも優れたスケールを示している。
関連論文リスト
- States Hidden in Hidden States: LLMs Emerge Discrete State Representations Implicitly [72.24742240125369]
本稿では,チェーン・オブ・ステップ・バイ・ステップの解に頼らずに,拡張された計算列を実行する本質的な能力を明らかにする。
注目すべきは、最も先進的なモデルでは、2桁の加算結果を直接出力できることだ。
論文 参考訳(メタデータ) (2024-07-16T06:27:22Z) - Quantum Pseudorandom Scramblers [4.835091081509403]
量子擬似ランダム状態発生器(PRSG)は、Haarランダム状態と計算的に区別できない出力状態を生成する。
既知のPSSG構造は、いくつかの初期状態において確実に失敗する。
任意の初期状態上で擬似乱数状態を生成する量子擬似乱数状態スクランブラ(PRSS)を構築する。
論文 参考訳(メタデータ) (2023-09-16T10:17:46Z) - Measurement-assisted non-Gaussian gate for Schr\"odinger cat states
preparation: Fock resource state versus cubic phase state [0.0]
本研究は,Fock資源状態に基づく計測補助ゲートを用いたSchr"odinger cat stateの調製について考察する。
2つのスキームの効率、すなわち、猫のような重ね合わせを高い忠実度と成功の確率で生成する能力を比較する。
論文 参考訳(メタデータ) (2023-07-12T17:55:25Z) - OpenPI-C: A Better Benchmark and Stronger Baseline for Open-Vocabulary
State Tracking [55.62705574507595]
OpenPIは、オープン語彙状態トラッキング用に注釈付けされた唯一のデータセットである。
手順レベル,ステップレベル,状態変化レベルの3つの問題を分類する。
評価指標として,クラスタベースの計量法を提案する。
論文 参考訳(メタデータ) (2023-06-01T16:48:20Z) - Accelerating Reinforcement Learning with Value-Conditional State Entropy Exploration [97.19464604735802]
探索のための有望な技術は、訪問状態分布のエントロピーを最大化することである。
エージェントが高価値の状態を訪問することを好むような、タスク報酬を伴う教師付きセットアップで苦労する傾向があります。
本稿では,値条件のエントロピーを最大化する新しい探索手法を提案する。
論文 参考訳(メタデータ) (2023-05-31T01:09:28Z) - Probabilistic pure state conversion on the majorization lattice [0.0]
絡み合いは、量子物理学の最も基本的で同時にパズリング・プロパティの1つである。
正規化格子は、純粋な絡み合った状態の許容変換を特徴付けるために効率的なフレームワークを提供することを示す。
論文 参考訳(メタデータ) (2023-03-17T16:10:50Z) - Witnessing superpositions of causal orders before the process is completed [0.0]
単一時点における量子状態の最も一般的な表現は何か。
現在の定式化は、量子演算の順序が整合的に、あるいは非整合的に重なり合う状況に適応できるだろうか?
論文 参考訳(メタデータ) (2022-09-19T16:47:53Z) - Training and Inference on Any-Order Autoregressive Models the Right Way [97.39464776373902]
Any-Order Autoregressive Models (AO-ARMs) のファミリは、任意の条件付きタスクにおいてブレークスルーのパフォーマンスを示している。
我々は、AO-ARMの以前の定式化に対して行うべき重要な改善について確認する。
本手法はトラクタビリティを損なうことなく性能を向上する。
論文 参考訳(メタデータ) (2022-05-26T18:00:02Z) - Nested Counterfactual Identification from Arbitrary Surrogate
Experiments [95.48089725859298]
観測と実験の任意の組み合わせからネスト反事実の同定について検討した。
具体的には、任意のネストされた反事実を非ネストされたものへ写像できる反ファクト的非ネスト定理(英語版)(CUT)を証明する。
論文 参考訳(メタデータ) (2021-07-07T12:51:04Z) - Discrimination of quantum states under locality constraints in the
many-copy setting [18.79968161594709]
最適平均誤差確率は常にコピー数で指数関数的に減衰することを示す。
拡張不可能な積ベース(UPB)から構築された状態のペアを提供することにより、分離可能(SEP)とPPTの操作を無限に分離することを示す。
技術的には、UPB のテンソル積が UPB であることを示す有名なステートメントの定量的版を提供することで、この結果を証明している。
論文 参考訳(メタデータ) (2020-11-25T23:26:33Z) - Off-policy Evaluation in Infinite-Horizon Reinforcement Learning with
Latent Confounders [62.54431888432302]
無限水平エルゴードマルコフ決定過程におけるOPE問題について考察する。
我々は、状態と行動の潜在変数モデルのみを考慮すれば、政策値が政治外のデータから特定できることを示す。
論文 参考訳(メタデータ) (2020-07-27T22:19:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。