論文の概要: Probabilistic Planning with Prioritized Preferences over Temporal Logic
Objectives
- arxiv url: http://arxiv.org/abs/2304.11641v1
- Date: Sun, 23 Apr 2023 13:03:27 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-25 17:24:31.815301
- Title: Probabilistic Planning with Prioritized Preferences over Temporal Logic
Objectives
- Title(参考訳): 時間的論理的対象に対する優先順位付けによる確率的計画法
- Authors: Lening Li, Hazhar Rahmani, Jie Fu
- Abstract要約: マルコフ決定過程(MDP)をモデルとした確率的環境における時間的計画に関する研究
本稿では,有限トレース上の線形時間論理を優先的に定性的選択する新しい仕様言語を提案する。
ユーザの好みに応じて期待される不満のスコアを最小化する最適ポリシーを定式化し、解き明かす。
- 参考スコア(独自算出の注目度): 26.180359884973566
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper studies temporal planning in probabilistic environments, modeled
as labeled Markov decision processes (MDPs), with user preferences over
multiple temporal goals. Existing works reflect such preferences as a
prioritized list of goals. This paper introduces a new specification language,
termed prioritized qualitative choice linear temporal logic on finite traces,
which augments linear temporal logic on finite traces with prioritized
conjunction and ordered disjunction from prioritized qualitative choice logic.
This language allows for succinctly specifying temporal objectives with
corresponding preferences accomplishing each temporal task. The finite traces
that describe the system's behaviors are ranked based on their dissatisfaction
scores with respect to the formula. We propose a systematic translation from
the new language to a weighted deterministic finite automaton. Utilizing this
computational model, we formulate and solve a problem of computing an optimal
policy that minimizes the expected score of dissatisfaction given user
preferences. We demonstrate the efficacy and applicability of the logic and the
algorithm on several case studies with detailed analyses for each.
- Abstract(参考訳): 本稿では,複数の時間的目標に対するユーザの嗜好を考慮した,確率的環境における時間的計画について検討する。
既存の作品は、優先順位付けされたゴールリストとしてそのような好みを反映している。
本稿では, 有限トレース上の線形時間論理を優先的に拡張し, 優先順位付けされた定性選択論理から順序づけられた解法を導出する, 新しい仕様言語を提案する。
この言語は時間的目的を簡潔に指定でき、それぞれの時間的タスクを達成できる。
システムの振る舞いを記述する有限トレースは、式に対する不満スコアに基づいてランク付けされる。
本稿では,新しい言語から重み付き決定論的有限オートマトンへの体系的翻訳を提案する。
この計算モデルを利用して、ユーザの好みに応じて不満足の期待スコアを最小化する最適なポリシーを定式化し、解決する。
本稿では,論理とアルゴリズムの有効性と適用性について,それぞれ詳細な解析を行い,いくつかのケーススタディで検証する。
関連論文リスト
- Causal Feature Selection via Transfer Entropy [59.999594949050596]
因果発見は、観察データによる特徴間の因果関係を特定することを目的としている。
本稿では,前向きと後向きの機能選択に依存する新たな因果的特徴選択手法を提案する。
精度および有限サンプルの場合の回帰誤差と分類誤差について理論的に保証する。
論文 参考訳(メタデータ) (2023-10-17T08:04:45Z) - On efficient computation in active inference [1.1470070927586016]
計算量を大幅に減らした有限時間地平線に対する新しい計画アルゴリズムを提案する。
また、新規かつ既存のアクティブな推論計画スキームに対して適切な目標分布を設定するプロセスを簡単にする。
論文 参考訳(メタデータ) (2023-07-02T07:38:56Z) - Probabilistic Planning with Partially Ordered Preferences over Temporal
Goals [22.77805882908817]
マルコフ決定過程(MDP)における計画計画について,時間的拡張目標よりも優先的に検討した。
本稿では、時間的に拡張された目標に対するユーザの好みを特定するために、決定論的有限オートマトンの一種である選好DFAを導入する。
構築された多目的MDPにおいて、選好仕様を前提とした弱確率的非支配ポリシーが最適であることを示す。
論文 参考訳(メタデータ) (2022-09-25T17:13:24Z) - Formalizing Preferences Over Runtime Distributions [25.899669128438322]
アルゴリズムよりも好みを記述したスコアリング関数を特徴付けるために,ユーティリティ理論のアプローチを用いる。
本稿では,不特定容量分布のモデル化における最大エントロピー手法の活用法を示す。
論文 参考訳(メタデータ) (2022-05-25T19:43:48Z) - Budgeted Classification with Rejection: An Evolutionary Method with
Multiple Objectives [0.0]
予算付きシーケンシャル分類器(BSC)プロセスは、部分的特徴取得と評価ステップのシーケンスを通じて入力を行う。
これにより、不要な特徴取得を防止するための入力の効率的な評価が可能になる。
本稿では,信頼度に基づく拒否オプション付き逐次分類器を構築するための問題固有遺伝的アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-05-01T22:05:16Z) - Regret Analysis in Deterministic Reinforcement Learning [78.31410227443102]
本稿では,最適学習アルゴリズムの分析と設計の中心となる後悔の問題を考察する。
本稿では,システムパラメータに明示的に依存する対数問題固有の後悔の下位境界について述べる。
論文 参考訳(メタデータ) (2021-06-27T23:41:57Z) - Probabilistic Planning with Preferences over Temporal Goals [21.35365462532568]
本稿では,時間目標に対する質的選好を規定する形式言語と,システムにおける選好に基づく計画手法を提案する。
自動理論モデルを用いて,提案した仕様は,各結果がサブゴールの時間列の集合を記述する場合の,異なる結果集合に対する嗜好を表現することができる。
我々は,可能な結果以上のプロセスが与えられた場合の選好満足度の価値を定義し,ラベル付きマルコフ決定過程における時間制約付き確率計画のためのアルゴリズムを開発する。
論文 参考訳(メタデータ) (2021-03-26T14:26:40Z) - Multi-Agent Reinforcement Learning with Temporal Logic Specifications [65.79056365594654]
本研究では,時間論理仕様を満たすための学習課題を,未知の環境下でエージェントのグループで検討する。
我々は、時間論理仕様のための最初のマルチエージェント強化学習手法を開発した。
主アルゴリズムの正確性と収束性を保証する。
論文 参考訳(メタデータ) (2021-02-01T01:13:03Z) - An AI-Assisted Design Method for Topology Optimization Without
Pre-Optimized Training Data [68.8204255655161]
トポロジ最適化に基づくAI支援設計手法を提示し、最適化された設計を直接的に得ることができる。
設計は、境界条件と入力データとしての充填度に基づいて、人工ニューラルネットワーク、予測器によって提供される。
論文 参考訳(メタデータ) (2020-12-11T14:33:27Z) - Optimistic Exploration even with a Pessimistic Initialisation [57.41327865257504]
最適初期化は強化学習(RL)における効率的な探索のための効果的な戦略である
特に、正の報酬しか持たないシナリオでは、Q-値はその最低値で初期化される。
本稿では、ニューラルネットワークから楽観性の源を分離する、悲観的に初期化されたQ値に対する単純なカウントベースの拡張を提案する。
論文 参考訳(メタデータ) (2020-02-26T17:15:53Z) - Options of Interest: Temporal Abstraction with Interest Functions [58.30081828754683]
一般関数近似に適した開始集合の一般化を、オプションに関連付けられた興味関数を定義することによって提供する。
我々は、関心関数に対する勾配に基づく学習アルゴリズムを導出し、新たな関心選択批判的アーキテクチャを創出する。
論文 参考訳(メタデータ) (2020-01-01T21:24:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。