論文の概要: Causal-Symbolic Meta-Learning (CSML): Inducing Causal World Models for Few-Shot Generalization
- arxiv url: http://arxiv.org/abs/2509.12387v1
- Date: Mon, 15 Sep 2025 19:28:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-17 17:50:52.737427
- Title: Causal-Symbolic Meta-Learning (CSML): Inducing Causal World Models for Few-Shot Generalization
- Title(参考訳): Causal-Symbolic Meta-Learning (CSML):Few-Shot GeneralizationのためのCausal World Modelの導入
- Authors: Mohamed Zayaan S,
- Abstract要約: 本稿では,タスク分布の潜在因果構造を推定する新しいフレームワークであるCausal-Symbolic Meta-Learningを紹介する。
タスクの分散を通じて共有因果世界モデルをメタラーニングすることにより、CSMLは新しいタスクに迅速に適応できる。
実験の結果,CSMLは最先端のメタラーニングとニューロシンボリックベースラインを劇的に上回っていることがわかった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Modern deep learning models excel at pattern recognition but remain fundamentally limited by their reliance on spurious correlations, leading to poor generalization and a demand for massive datasets. We argue that a key ingredient for human-like intelligence-robust, sample-efficient learning-stems from an understanding of causal mechanisms. In this work, we introduce Causal-Symbolic Meta-Learning (CSML), a novel framework that learns to infer the latent causal structure of a task distribution. CSML comprises three key modules: a perception module that maps raw inputs to disentangled symbolic representations; a differentiable causal induction module that discovers the underlying causal graph governing these symbols and a graph-based reasoning module that leverages this graph to make predictions. By meta-learning a shared causal world model across a distribution of tasks, CSML can rapidly adapt to novel tasks, including those requiring reasoning about interventions and counterfactuals, from only a handful of examples. We introduce CausalWorld, a new physics-based benchmark designed to test these capabilities. Our experiments show that CSML dramatically outperforms state-of-the-art meta-learning and neuro-symbolic baselines, particularly on tasks demanding true causal inference.
- Abstract(参考訳): 現代のディープラーニングモデルはパターン認識に優れるが、素早い相関に頼って基本的に制限されているため、一般化の貧弱さと大量のデータセットの需要に繋がる。
我々は,人間のような知能を損なう,サンプル効率のよい学習研究において,因果的メカニズムの理解から重要な要素を論じる。
本稿では,タスク分布の潜在因果構造を推定する新しいフレームワークであるCausal-Symbolic Meta-Learning(CSML)を紹介する。
CSMLは3つの重要なモジュールから構成される: 生の入力を非絡み合ったシンボル表現にマッピングする知覚モジュール、これらのシンボルを管理する根底にある因果グラフを検出する識別可能な因果帰納モジュール、このグラフを利用して予測を行うグラフベースの推論モジュール。
タスクの分散にまたがって共有因果世界モデルをメタラーニングすることにより、CSMLは、ごく少数の例から、介入や反事実に関する推論を必要とするタスクを含む、新しいタスクに迅速に適応することができる。
CausalWorldは、これらの機能をテストするために設計された新しい物理ベースのベンチマークである。
実験の結果、CSMLは、特に真の因果推論を必要とするタスクにおいて、最先端のメタラーニングとニューロシンボリックベースラインを劇的に上回ることがわかった。
関連論文リスト
- How and Why LLMs Generalize: A Fine-Grained Analysis of LLM Reasoning from Cognitive Behaviors to Low-Level Patterns [51.02752099869218]
大きな言語モデル(LLM)は、非常に異なる一般化の振る舞いを示す。
推論を原子核スキルに分解する新しいベンチマークを導入する。
SFTモデルはよりシャープなドリフトと表面パターンへの過度な適合を示すのに対し、RL型モデルはより安定した行動プロファイルを維持し、推論スキルの崩壊に抵抗することを示す。
論文 参考訳(メタデータ) (2025-12-30T08:16:20Z) - Foundation Model for Skeleton-Based Human Action Understanding [56.89025287217221]
本稿では,統一骨格に基づくDense Representation Learningフレームワークを提案する。
USDRLはトランスフォーマーベースのDense Spatio-Temporal (DSTE)、Multi-Grained Feature Deorrelation (MG-FD)、Multi-Perspective Consistency Training (MPCT)で構成されている。
論文 参考訳(メタデータ) (2025-08-18T02:42:16Z) - Inducing Causal World Models in LLMs for Zero-Shot Physical Reasoning [7.4149859076511815]
Causal World Model Injection (CWMI)は、AIシステムに因果物理の明示的なモデルを組み込むように設計されたフレームワークである。
CWMIは、ゼロショット物理推論タスクにおいて最先端のAIシステムを大幅に上回る。
論文 参考訳(メタデータ) (2025-07-26T08:08:26Z) - Failure Modes of LLMs for Causal Reasoning on Narratives [51.19592551510628]
世界の知識と論理的推論の相互作用について検討する。
最先端の大規模言語モデル(LLM)は、しばしば表面的な一般化に依存している。
タスクの単純な再構成により、より堅牢な推論行動が引き起こされることを示す。
論文 参考訳(メタデータ) (2024-10-31T12:48:58Z) - Graph-based Unsupervised Disentangled Representation Learning via Multimodal Large Language Models [42.17166746027585]
複素データ内の因子化属性とその相互関係を学習するための双方向重み付きグラフベースフレームワークを提案する。
具体的には、グラフの初期ノードとして要素を抽出する$beta$-VAEベースのモジュールを提案する。
これらの相補的加群を統合することで、我々は細粒度、実用性、教師なしの絡み合いをうまく達成できる。
論文 参考訳(メタデータ) (2024-07-26T15:32:21Z) - Identifiable Causal Representation Learning: Unsupervised, Multi-View, and Multi-Environment [10.814585613336778]
因果表現学習は、機械学習のコアとなる強みと因果性を組み合わせることを目的としている。
この論文は、CRLが直接の監督なしに何が可能であるかを調査し、理論的基礎に寄与する。
論文 参考訳(メタデータ) (2024-06-19T09:14:40Z) - Can Large Language Models Learn Independent Causal Mechanisms? [9.274428418715347]
大きな言語モデル(LLM)は、一般的でない設定や分散シフトで同じタスクで不足する。
本研究では,抽象変数と因果関係を学習する因果モデルにより,分布の変化に対するロバスト性の向上が示された。
論文 参考訳(メタデータ) (2024-02-04T23:04:02Z) - Towards Human-like Perception: Learning Structural Causal Model in
Heterogeneous Graph [26.361815957385417]
本研究では,HG-SCM(構造因果モデルとしての異種グラフ)という新しい解を提案する。
グラフスキーマから派生したセマンティクスに基づく無知変数の構築と、高度な因果発見技術を導入して、これらの変数間のタスクレベルの因果関係を自動的に学習する。
HG-SCMは標準偏差を最小限に抑え、予測力と一般化性の両方の観点からその有効性と優位性を実証した。
論文 参考訳(メタデータ) (2023-12-10T04:34:35Z) - Interpretable Imitation Learning with Dynamic Causal Relations [65.18456572421702]
得られた知識を有向非巡回因果グラフの形で公開することを提案する。
また、この因果発見プロセスを状態依存的に設計し、潜在因果グラフのダイナミクスをモデル化する。
提案するフレームワークは,動的因果探索モジュール,因果符号化モジュール,予測モジュールの3つの部分から構成され,エンドツーエンドで訓練される。
論文 参考訳(メタデータ) (2023-09-30T20:59:42Z) - On the Generalization and Adaption Performance of Causal Models [99.64022680811281]
異なる因果発見は、データ生成プロセスを一連のモジュールに分解するために提案されている。
このようなモジュラニューラル因果モデルの一般化と適応性能について検討する。
我々の分析では、モジュラーニューラル因果モデルが、低データレギュレーションにおけるゼロおよび少数ショットの適応において、他のモデルよりも優れていることを示している。
論文 参考訳(メタデータ) (2022-06-09T17:12:32Z) - Relating Graph Neural Networks to Structural Causal Models [17.276657786213015]
因果関係は、興味のある変数とその力学関係に関する情報を伝達する構造因果モデル(SCM)によって記述することができる。
本稿では,GNNとSCMの新たな接続を確立する理論解析について述べる。
次に、GNNに基づく因果推論のための新しいモデルクラスを構築し、因果効果の同定に十分である。
論文 参考訳(メタデータ) (2021-09-09T11:16:31Z) - Systematic Evaluation of Causal Discovery in Visual Model Based
Reinforcement Learning [76.00395335702572]
AIと因果関係の中心的な目標は、抽象表現と因果構造を共同で発見することである。
因果誘導を研究するための既存の環境は、複雑なタスク固有の因果グラフを持つため、この目的には適していない。
本研究の目的は,高次変数の学習表現と因果構造の研究を促進することである。
論文 参考訳(メタデータ) (2021-07-02T05:44:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。