論文の概要: CASSANDRA: Programmatic and Probabilistic Learning and Inference for Stochastic World Modeling
- arxiv url: http://arxiv.org/abs/2601.18620v1
- Date: Mon, 26 Jan 2026 15:58:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-27 15:23:08.915679
- Title: CASSANDRA: Programmatic and Probabilistic Learning and Inference for Stochastic World Modeling
- Title(参考訳): CASSANDRA:確率的世界モデリングのためのプログラム的・確率的学習と推論
- Authors: Panagiotis Lymperopoulos, Abhiramon Rajasekharan, Ian Berlot-Attwell, Stéphane Aroca-Ouellette, Kaheer Suleman,
- Abstract要約: ビジネスのような現実世界のドメインで計画する上で、世界モデルの構築は不可欠である。
ニューロシンボリックな世界モデリング手法であるCASSANDRAを提案する。
ベースラインに対する遷移予測と計画の大幅な改善を示す。
- 参考スコア(独自算出の注目度): 2.2866314233358596
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Building world models is essential for planning in real-world domains such as businesses. Since such domains have rich semantics, we can leverage world knowledge to effectively model complex action effects and causal relationships from limited data. In this work, we propose CASSANDRA, a neurosymbolic world modeling approach that leverages an LLM as a knowledge prior to construct lightweight transition models for planning. CASSANDRA integrates two components: (1) LLM-synthesized code to model deterministic features, and (2) LLM-guided structure learning of a probabilistic graphical model to capture causal relationships among stochastic variables. We evaluate CASSANDRA in (i) a small-scale coffee-shop simulator and (ii) a complex theme park business simulator, where we demonstrate significant improvements in transition prediction and planning over baselines.
- Abstract(参考訳): ビジネスのような現実世界のドメインで計画する上で、世界モデルの構築は不可欠である。
このようなドメインにはリッチなセマンティクスがあるので、世界知識を活用して、限られたデータから複雑なアクション効果や因果関係を効果的にモデル化することができる。
本研究では、LCMを知識として活用し、計画のための軽量な遷移モデルを構築するための、ニューロシンボリックな世界モデリング手法であるCASSANDRAを提案する。
CASSANDRAは,(1)LLM合成コードから決定論的特徴をモデル化し,(2)確率的図形モデルのLLM誘導構造学習により確率的変数間の因果関係を抽出する。
私たちはCASSANDRAを評価します
(i)小規模コーヒーショップシミュレータ及び小型コーヒーショップシミュレータ
(II)複雑なテーマパークビジネスシミュレータで,ベースラインの遷移予測と計画の大幅な改善を示す。
関連論文リスト
- ExoPredicator: Learning Abstract Models of Dynamic Worlds for Robot Planning [77.49815848173613]
本研究では,内因性行動とメカニズムの両方について,シンボル的状態表現と因果過程を共同で学習する抽象世界モデルのためのフレームワークを提案する。
シミュレーションされた5つのテーブルトップロボット環境の中で、学習されたモデルは、より多くのオブジェクトとより複雑な目標を持つ保留タスクに一般化した高速な計画を可能にし、幅広いベースラインを上回ります。
論文 参考訳(メタデータ) (2025-09-30T13:44:34Z) - Making Large Language Models into World Models with Precondition and Effect Knowledge [1.8561812622368763]
本研究では,Large Language Models (LLM) を2つの重要な世界モデル関数の実行に利用することができることを示す。
我々は、我々のモデルが生み出す前提条件と効果知識が、世界力学の人間の理解と一致していることを検証する。
論文 参考訳(メタデータ) (2024-09-18T19:28:04Z) - Minimal Value-Equivalent Partial Models for Scalable and Robust Planning
in Lifelong Reinforcement Learning [56.50123642237106]
モデルに基づく強化学習における一般的な実践は、エージェントの環境のあらゆる側面をモデル化するモデルを学ぶことである。
このようなモデルは、生涯にわたる強化学習シナリオにおいて、スケーラブルで堅牢な計画を実行するのに特に適していない、と我々は主張する。
我々は,「最小値部分モデル」と呼ぶ,環境の関連する側面のみをモデル化する新しい種類のモデルを提案する。
論文 参考訳(メタデータ) (2023-01-24T16:40:01Z) - Large Language Models with Controllable Working Memory [64.71038763708161]
大規模言語モデル(LLM)は、自然言語処理(NLP)の一連のブレークスルーをもたらした。
これらのモデルをさらに切り離すのは、事前訓練中に内在する膨大な量の世界的知識だ。
モデルの世界知識が、文脈で提示された事実情報とどのように相互作用するかは、まだ解明されていない。
論文 参考訳(メタデータ) (2022-11-09T18:58:29Z) - Style-Hallucinated Dual Consistency Learning for Domain Generalized
Semantic Segmentation [117.3856882511919]
本稿では、ドメインシフトを処理するためのStyle-HAllucinated Dual consistEncy Learning(SHADE)フレームワークを提案する。
SHADEは3つの実世界のデータセットの平均mIoUに対して5.07%と8.35%の精度で改善し、最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2022-04-06T02:49:06Z) - Model-based Reinforcement Learning: A Survey [2.564530030795554]
マルコフ決定過程 (Markov Decision Process, MDP) の最適化として一般に形式化された逐次意思決定は、人工知能において重要な課題である。
この問題の2つの主要なアプローチは強化学習(RL)と計画である。
本稿では、モデルベース強化学習として知られる両分野の統合について調査する。
論文 参考訳(メタデータ) (2020-06-30T12:10:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。