論文の概要: Probabilistic Planning with Prioritized Preferences over Temporal Logic
Objectives
- arxiv url: http://arxiv.org/abs/2304.11641v1
- Date: Sun, 23 Apr 2023 13:03:27 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-25 17:24:31.815301
- Title: Probabilistic Planning with Prioritized Preferences over Temporal Logic
Objectives
- Title(参考訳): 時間的論理的対象に対する優先順位付けによる確率的計画法
- Authors: Lening Li, Hazhar Rahmani, Jie Fu
- Abstract要約: マルコフ決定過程(MDP)をモデルとした確率的環境における時間的計画に関する研究
本稿では,有限トレース上の線形時間論理を優先的に定性的選択する新しい仕様言語を提案する。
ユーザの好みに応じて期待される不満のスコアを最小化する最適ポリシーを定式化し、解き明かす。
- 参考スコア(独自算出の注目度): 26.180359884973566
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper studies temporal planning in probabilistic environments, modeled
as labeled Markov decision processes (MDPs), with user preferences over
multiple temporal goals. Existing works reflect such preferences as a
prioritized list of goals. This paper introduces a new specification language,
termed prioritized qualitative choice linear temporal logic on finite traces,
which augments linear temporal logic on finite traces with prioritized
conjunction and ordered disjunction from prioritized qualitative choice logic.
This language allows for succinctly specifying temporal objectives with
corresponding preferences accomplishing each temporal task. The finite traces
that describe the system's behaviors are ranked based on their dissatisfaction
scores with respect to the formula. We propose a systematic translation from
the new language to a weighted deterministic finite automaton. Utilizing this
computational model, we formulate and solve a problem of computing an optimal
policy that minimizes the expected score of dissatisfaction given user
preferences. We demonstrate the efficacy and applicability of the logic and the
algorithm on several case studies with detailed analyses for each.
- Abstract(参考訳): 本稿では,複数の時間的目標に対するユーザの嗜好を考慮した,確率的環境における時間的計画について検討する。
既存の作品は、優先順位付けされたゴールリストとしてそのような好みを反映している。
本稿では, 有限トレース上の線形時間論理を優先的に拡張し, 優先順位付けされた定性選択論理から順序づけられた解法を導出する, 新しい仕様言語を提案する。
この言語は時間的目的を簡潔に指定でき、それぞれの時間的タスクを達成できる。
システムの振る舞いを記述する有限トレースは、式に対する不満スコアに基づいてランク付けされる。
本稿では,新しい言語から重み付き決定論的有限オートマトンへの体系的翻訳を提案する。
この計算モデルを利用して、ユーザの好みに応じて不満足の期待スコアを最小化する最適なポリシーを定式化し、解決する。
本稿では,論理とアルゴリズムの有効性と適用性について,それぞれ詳細な解析を行い,いくつかのケーススタディで検証する。
関連論文リスト
- Learning Optimal Signal Temporal Logic Decision Trees for Classification: A Max-Flow MILP Formulation [5.924780594614676]
本稿では,データから時間的時間的論理特性を推定するための新しい枠組みを提案する。
混合整数線形プログラミング最適化問題として推論過程を定式化する。
結果木に最大フローアルゴリズムを適用すると、この問題はグローバルな最適化問題に変換される。
我々は,2クラス,複数クラス,複雑な式分類シナリオを含む3つのケーススタディを実施している。
論文 参考訳(メタデータ) (2024-07-30T16:56:21Z) - Belief-State Query Policies for Planning With Preferences Under Partial Observability [18.821166966365315]
現実の環境での計画では、ユーザーの好みに合わせて部分的な可観測性に対処する必要があることが多い。
本稿では,パラメータ化信念状態クエリ(BSQ)を用いた部分的に観察可能な設定において,エージェント行動に対するユーザの嗜好を表現する新しいフレームワークを提案する。
BSQの選好は、部分的に観測可能な環境での選好を計画する上で、計算学的に実現可能なアプローチであることを示す。
論文 参考訳(メタデータ) (2024-05-24T20:04:51Z) - Preference-Based Planning in Stochastic Environments: From Partially-Ordered Temporal Goals to Most Preferred Policies [25.731912021122287]
マルコフ決定過程としてモデル化されたシステムは、時間的に拡張された一連の目標に対して部分的に順序づけられた選好を考慮に入れている。
部分的に順序づけられた選好を計画するために、時間的目標に対する選好をMDPの政策に対する選好にマッピングする順序理論を導入する。
順序付けの下で最も好まれるポリシーは、MDP内の有限経路上の非支配確率分布を誘導する。
論文 参考訳(メタデータ) (2024-03-27T02:46:09Z) - DetermLR: Augmenting LLM-based Logical Reasoning from Indeterminacy to Determinacy [76.58614128865652]
非決定性から決定性への進化として推論過程を再考する新しい視点であるDetermLRを提案する。
まず、既知の条件を次の2つのタイプに分類する: 決定的および不決定的前提 これは、推論プロセスのオール方向を提供し、不決定的データを段階的決定的洞察に変換する際のLCMを導く。
我々は、利用可能な施設の保存と抽出、推論メモリによる推論パスの自動化、そしてその後の推論ステップに関する歴史的推論の詳細を保存する。
論文 参考訳(メタデータ) (2023-10-28T10:05:51Z) - Causal Feature Selection via Transfer Entropy [59.999594949050596]
因果発見は、観察データによる特徴間の因果関係を特定することを目的としている。
本稿では,前向きと後向きの機能選択に依存する新たな因果的特徴選択手法を提案する。
精度および有限サンプルの場合の回帰誤差と分類誤差について理論的に保証する。
論文 参考訳(メタデータ) (2023-10-17T08:04:45Z) - Probabilistic Planning with Partially Ordered Preferences over Temporal
Goals [22.77805882908817]
マルコフ決定過程(MDP)における計画計画について,時間的拡張目標よりも優先的に検討した。
本稿では、時間的に拡張された目標に対するユーザの好みを特定するために、決定論的有限オートマトンの一種である選好DFAを導入する。
構築された多目的MDPにおいて、選好仕様を前提とした弱確率的非支配ポリシーが最適であることを示す。
論文 参考訳(メタデータ) (2022-09-25T17:13:24Z) - Regret Analysis in Deterministic Reinforcement Learning [78.31410227443102]
本稿では,最適学習アルゴリズムの分析と設計の中心となる後悔の問題を考察する。
本稿では,システムパラメータに明示的に依存する対数問題固有の後悔の下位境界について述べる。
論文 参考訳(メタデータ) (2021-06-27T23:41:57Z) - Probabilistic Planning with Preferences over Temporal Goals [21.35365462532568]
本稿では,時間目標に対する質的選好を規定する形式言語と,システムにおける選好に基づく計画手法を提案する。
自動理論モデルを用いて,提案した仕様は,各結果がサブゴールの時間列の集合を記述する場合の,異なる結果集合に対する嗜好を表現することができる。
我々は,可能な結果以上のプロセスが与えられた場合の選好満足度の価値を定義し,ラベル付きマルコフ決定過程における時間制約付き確率計画のためのアルゴリズムを開発する。
論文 参考訳(メタデータ) (2021-03-26T14:26:40Z) - Multi-Agent Reinforcement Learning with Temporal Logic Specifications [65.79056365594654]
本研究では,時間論理仕様を満たすための学習課題を,未知の環境下でエージェントのグループで検討する。
我々は、時間論理仕様のための最初のマルチエージェント強化学習手法を開発した。
主アルゴリズムの正確性と収束性を保証する。
論文 参考訳(メタデータ) (2021-02-01T01:13:03Z) - An AI-Assisted Design Method for Topology Optimization Without
Pre-Optimized Training Data [68.8204255655161]
トポロジ最適化に基づくAI支援設計手法を提示し、最適化された設計を直接的に得ることができる。
設計は、境界条件と入力データとしての充填度に基づいて、人工ニューラルネットワーク、予測器によって提供される。
論文 参考訳(メタデータ) (2020-12-11T14:33:27Z) - Options of Interest: Temporal Abstraction with Interest Functions [58.30081828754683]
一般関数近似に適した開始集合の一般化を、オプションに関連付けられた興味関数を定義することによって提供する。
我々は、関心関数に対する勾配に基づく学習アルゴリズムを導出し、新たな関心選択批判的アーキテクチャを創出する。
論文 参考訳(メタデータ) (2020-01-01T21:24:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。