論文の概要: A Translation of Probabilistic Event Calculus into Markov Decision Processes
- arxiv url: http://arxiv.org/abs/2507.12989v1
- Date: Thu, 17 Jul 2025 10:56:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-18 20:10:24.460603
- Title: A Translation of Probabilistic Event Calculus into Markov Decision Processes
- Title(参考訳): 確率的事象計算のマルコフ決定過程への変換
- Authors: Lyris Xu, Fabio Aurelio D'Asaro, Luke Dickens,
- Abstract要約: 本稿では,確率的事象計算領域をマルコフ決定過程へ公式翻訳する。
結果として得られるPEC-MDP形式は、MPP向けに開発されたアルゴリズムと理論ツールの集合を、PECの解釈可能な物語領域に適用することを可能にする。
- 参考スコア(独自算出の注目度): 0.8192907805418583
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Probabilistic Event Calculus (PEC) is a logical framework for reasoning about actions and their effects in uncertain environments, which enables the representation of probabilistic narratives and computation of temporal projections. The PEC formalism offers significant advantages in interpretability and expressiveness for narrative reasoning. However, it lacks mechanisms for goal-directed reasoning. This paper bridges this gap by developing a formal translation of PEC domains into Markov Decision Processes (MDPs), introducing the concept of "action-taking situations" to preserve PEC's flexible action semantics. The resulting PEC-MDP formalism enables the extensive collection of algorithms and theoretical tools developed for MDPs to be applied to PEC's interpretable narrative domains. We demonstrate how the translation supports both temporal reasoning tasks and objective-driven planning, with methods for mapping learned policies back into human-readable PEC representations, maintaining interpretability while extending PEC's capabilities.
- Abstract(参考訳): 確率的事象計算(英: Probabilistic Event Calculus, PEC)は、確率的物語の表現と時間的プロジェクションの計算を可能にする、不確実な環境における行動とその影響を推論するための論理的枠組みである。
PEC形式主義は、物語的推論において解釈可能性と表現性において大きな利点をもたらす。
しかし、ゴール指向推論のメカニズムが欠けている。
本稿では, PECドメインをマルコフ決定過程 (MDP) に形式的に翻訳し, PECのフレキシブルなアクションセマンティクスを維持するために「アクションテイク状況」の概念を導入することにより, このギャップを埋める。
結果として得られるPEC-MDP形式は、MPP向けに開発されたアルゴリズムと理論ツールの広範な収集を、PECの解釈可能な物語領域に適用することを可能にする。
本研究では、学習したポリシーを人間可読なPEC表現にマッピングし、PECの機能を拡張しながら解釈可能性を維持する方法を用いて、時間的推論タスクと客観的計画の両方をサポートする方法を示す。
関連論文リスト
- Integrating Belief Domains into Probabilistic Logic Programs [0.16385815610837165]
本稿では,分散セマンティックスを拡張した区間型容量論理プログラムを提案する。
これは、実用アプリケーションで実現可能な新しいフレームワークの特性を記述している。
論文 参考訳(メタデータ) (2025-07-23T07:52:09Z) - CTRLS: Chain-of-Thought Reasoning via Latent State-Transition [57.51370433303236]
チェーン・オブ・シント(CoT)推論は、大規模な言語モデルで複雑な問題を解釈可能な中間ステップに分解することを可能にする。
我々は,遅延状態遷移を伴うマルコフ決定プロセス(MDP)としてCoT推論を定式化するフレームワークであるgroundingSを紹介する。
我々は、ベンチマーク推論タスクにおける推論精度、多様性、探索効率の改善を示す。
論文 参考訳(メタデータ) (2025-07-10T21:32:18Z) - Learning Symbolic Persistent Macro-Actions for POMDP Solving Over Time [52.03682298194168]
本稿では,時間的論理的推論と部分観測可能なマルコフ決定過程(POMDP)の統合を提案する。
本手法は,イベント計算(EC)に基づく線形時間論理(LTL)の断片を利用して,固有(定数)なマクロアクションを生成する。
これらのマクロアクションは、MCTS(Monte Carlo Tree Search)ベースのPOMDPソルバを時間軸上でガイドする。
論文 参考訳(メタデータ) (2025-05-06T16:08:55Z) - Inference-Time Computations for LLM Reasoning and Planning: A Benchmark and Insights [49.42133807824413]
本稿では,大規模言語モデル(LLM)の複雑な課題解決における推論と計画能力について検討する。
近年の推論時間技術の発展は,LLM推論を追加訓練なしで向上させる可能性を示している。
OpenAIのo1モデルは、マルチステップ推論と検証の新たな使用を通じて、有望なパフォーマンスを示している。
論文 参考訳(メタデータ) (2025-02-18T04:11:29Z) - Does Reasoning Emerge? Examining the Probabilities of Causation in Large Language Models [6.922021128239465]
AIの最近の進歩は、大規模言語モデル(LLM)の能力によって推進されている。
本稿では,LLMが実世界の推論機構をいかに効果的に再現できるかを評価することを目的とした,理論的かつ実用的なフレームワークを提案する。
論文 参考訳(メタデータ) (2024-08-15T15:19:11Z) - Interpretable Concept-Based Memory Reasoning [12.562474638728194]
コンセプトベースのメモリリゾナー(CMR)は、人間に理解でき、検証可能なタスク予測プロセスを提供するために設計された新しいCBMである。
CMRは、最先端のCBMに対する精度-解釈可能性のトレードオフを向上し、基礎的な真実と整合した論理規則を発見し、規則の介入を可能にし、事前デプロイ検証を可能にする。
論文 参考訳(メタデータ) (2024-07-22T10:32:48Z) - Leveraging Counterfactual Paths for Contrastive Explanations of POMDP Policies [2.4332936182093197]
XAIは、エージェント行動の説明を提供することで、混乱を減らし、システムの信頼を高めることを目的としている。
POMDPは、遷移と状態の不確実性を推論できる柔軟なフレームワークを提供する。
本研究は,POMDPポリシーの対照的な説明を生成するために,ユーザが提供する反ファクトファクトの活用について検討する。
論文 参考訳(メタデータ) (2024-03-28T18:19:38Z) - Learning Logic Specifications for Policy Guidance in POMDPs: an
Inductive Logic Programming Approach [57.788675205519986]
我々は任意の解法によって生成されるPOMDP実行から高品質なトレースを学習する。
我々は、データと時間効率のIndu Logic Programming(ILP)を利用して、解釈可能な信念に基づくポリシー仕様を生成する。
ASP(Answer Set Programming)で表現された学習は、ニューラルネットワークよりも優れた性能を示し、より少ない計算時間で最適な手作りタスクに類似していることを示す。
論文 参考訳(メタデータ) (2024-02-29T15:36:01Z) - From Heuristic to Analytic: Cognitively Motivated Strategies for
Coherent Physical Commonsense Reasoning [66.98861219674039]
ヒューリスティック分析推論(HAR)戦略は、モデル決定のための合理化のコヒーレンスを大幅に改善する。
以上の結果から, PLM推論の一貫性と信頼性を効果的に向上できる可能性が示唆された。
論文 参考訳(メタデータ) (2023-10-24T19:46:04Z) - DELPHIC: Practical DEL Planning via Possibilities (Extended Version) [76.75197961194182]
本研究は,実用的なDEL計画の展開を促進することを目的としている。
本稿では,メインビルディングブロックとして定義した等価なセマンティクスを,いわゆる可能性として提案する。
この主張を裏付けるために、ASPで両方のアプローチを実装し、DELPHICと従来のKripkeベースのアプローチを比較する実験的な評価を設定した。
論文 参考訳(メタデータ) (2023-07-28T10:09:45Z) - Explainability in Process Outcome Prediction: Guidelines to Obtain
Interpretable and Faithful Models [77.34726150561087]
本稿では、プロセス結果予測の分野における説明可能性モデルと説明可能性モデルの忠実性を通して、説明可能性を定義する。
本稿では,イベントログの仕様に基づいて適切なモデルを選択することのできる,X-MOPというガイドラインのセットを提案する。
論文 参考訳(メタデータ) (2022-03-30T05:59:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。