論文の概要: DMCD: Semantic-Statistical Framework for Causal Discovery
- arxiv url: http://arxiv.org/abs/2602.20333v1
- Date: Mon, 23 Feb 2026 20:29:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-25 17:34:53.521048
- Title: DMCD: Semantic-Statistical Framework for Causal Discovery
- Title(参考訳): DMCD:因果発見のための意味統計フレームワーク
- Authors: Samarth KaPatel, Sofia Nikiforova, Giacinto Paolo Saggese, Paul Smith,
- Abstract要約: DMCDは,変数メタデータからのセマンティックな草案作成と,観測データに対する統計的検証を統合した因果発見フレームワークである。
我々は,産業工学,環境モニタリング,ITシステム分析を対象とする,メタデータに富んだ実世界の3つのベンチマークに対するアプローチを評価した。
- 参考スコア(独自算出の注目度): 0.03499870393443267
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present DMCD (DataMap Causal Discovery), a two-phase causal discovery framework that integrates LLM-based semantic drafting from variable metadata with statistical validation on observational data. In Phase I, a large language model proposes a sparse draft DAG, serving as a semantically informed prior over the space of possible causal structures. In Phase II, this draft is audited and refined via conditional independence testing, with detected discrepancies guiding targeted edge revisions. We evaluate our approach on three metadata-rich real-world benchmarks spanning industrial engineering, environmental monitoring, and IT systems analysis. Across these datasets, DMCD achieves competitive or leading performance against diverse causal discovery baselines, with particularly large gains in recall and F1 score. Probing and ablation experiments suggest that these improvements arise from semantic reasoning over metadata rather than memorization of benchmark graphs. Overall, our results demonstrate that combining semantic priors with principled statistical verification yields a high-performing and practically effective approach to causal structure learning.
- Abstract(参考訳): DMCD(DataMap Causal Discovery)は,変動メタデータからのLCMに基づく意味的ドラフトと,観測データに対する統計的検証を統合した2相因果発見フレームワークである。
フェーズIでは、大きな言語モデルがスパースドラフトDAGを提案し、因果構造が考えられる空間に先立って意味的に情報を提供する。
第2段階では、この草案は条件付き独立試験によって監査され、修正され、検出された相違点が目標のエッジ修正を導く。
我々は,産業工学,環境モニタリング,ITシステム分析を対象とする,メタデータに富んだ実世界の3つのベンチマークに対するアプローチを評価した。
これらのデータセット全体で、DMCDは様々な因果発見ベースラインに対して、特にリコールとF1スコアで競争またはリードパフォーマンスを達成する。
探索およびアブレーション実験は、これらの改善がベンチマークグラフの記憶よりもメタデータよりも意味論的推論から生じることを示唆している。
以上の結果から,セマンティック先行と原理的統計的検証を組み合わせることで,因果構造学習における高性能かつ実用的な手法が得られた。
関連論文リスト
- STAR : Bridging Statistical and Agentic Reasoning for Large Model Performance Prediction [78.0692157478247]
本稿では,知識駆動型エージェント推論を用いて,データ駆動型静的予測を橋渡しするフレームワークSTARを提案する。
STARはスコアベースとランクベースの両方の基準線を一貫して上回ることを示す。
論文 参考訳(メタデータ) (2026-02-12T16:30:07Z) - Localized Kernel Projection Outlyingness: A Two-Stage Approach for Multi-Modal Outlier Detection [0.0]
Two-Stage LKPLOは、新しいマルチステージアウトレイラ検出フレームワークである。
従来の射影的手法の制約を克服する。
挑戦的なデータセットで最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2025-10-28T03:53:46Z) - Meta-Statistical Learning: Supervised Learning of Statistical Inference [59.463430294611626]
この研究は、大きな言語モデル(LLM)の成功を駆動するツールと原則が、分散レベルのタスクに取り組むために再利用可能であることを実証している。
本稿では,統計的推論タスクを教師付き学習問題として再構成するマルチインスタンス学習に触発されたメタ統計学習を提案する。
論文 参考訳(メタデータ) (2025-02-17T18:04:39Z) - Multi-Agent Causal Discovery Using Large Language Models [10.020595983728482]
因果発見は機械学習における重要な研究領域である。
我々はMulti-Agent Causal Discovery Framework(MAC)を紹介する。
Debate-Coding Module (DCM) と Meta-Debate Module (MDM) の2つの主要なモジュールで構成されている。
論文 参考訳(メタデータ) (2024-07-21T06:21:47Z) - DAGnosis: Localized Identification of Data Inconsistencies using
Structures [73.39285449012255]
機械学習モデルを確実に使用するためには、デプロイメント時のデータの不整合の特定と適切な処理が不可欠である。
我々は,有向非巡回グラフ(DAG)を用いて,トレーニングセットの特徴分布と非依存性を構造として符号化する。
我々の手法はDAGnosisと呼ばれ、これらの構造的相互作用を利用して、価値があり洞察に富んだデータ中心の結論をもたらす。
論文 参考訳(メタデータ) (2024-02-26T11:29:16Z) - SSL Framework for Causal Inconsistency between Structures and Representations [31.895570222735955]
因果発見と深層学習の相互補間は、ますます広範囲にわたる相互作用を引き起こしている。
不確定データは、因果構造によって表現される因果関係と、深層学習モデルによって生成される因果表現との間に矛盾がある。
因果不整合を軽減するために,介入に基づく自己教師型学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-28T08:29:49Z) - Multi-level Consistency Learning for Semi-supervised Domain Adaptation [85.90600060675632]
半教師付きドメイン適応(SSDA)は、完全にラベル付けされたソースドメインから学習した知識をわずかにラベル付けされたターゲットドメインに適用することを目的としている。
SSDAのための多レベル一貫性学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-05-09T06:41:18Z) - DRFLM: Distributionally Robust Federated Learning with Inter-client
Noise via Local Mixup [58.894901088797376]
連合学習は、生データをリークすることなく、複数の組織のデータを使用してグローバルモデルをトレーニングするための有望なアプローチとして登場した。
上記の2つの課題を同時に解決するための一般的な枠組みを提案する。
我々は、ロバストネス解析、収束解析、一般化能力を含む包括的理論的解析を提供する。
論文 参考訳(メタデータ) (2022-04-16T08:08:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。