Fugu-MT 論文翻訳(概要): DMCD: Semantic-Statistical Framework for Causal Discovery

論文の概要: DMCD: Semantic-Statistical Framework for Causal Discovery

arxiv url: http://arxiv.org/abs/2602.20333v1
Date: Mon, 23 Feb 2026 20:29:35 GMT
ステータス: 翻訳完了
システム内更新日: 2026-02-25 17:34:53.521048
Title: DMCD: Semantic-Statistical Framework for Causal Discovery
Title（参考訳）: DMCD:因果発見のための意味統計フレームワーク
Authors: Samarth KaPatel, Sofia Nikiforova, Giacinto Paolo Saggese, Paul Smith,
Abstract要約: DMCDは,変数メタデータからのセマンティックな草案作成と,観測データに対する統計的検証を統合した因果発見フレームワークである。我々は,産業工学,環境モニタリング,ITシステム分析を対象とする,メタデータに富んだ実世界の3つのベンチマークに対するアプローチを評価した。
参考スコア（独自算出の注目度）: 0.03499870393443267
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We present DMCD (DataMap Causal Discovery), a two-phase causal discovery framework that integrates LLM-based semantic drafting from variable metadata with statistical validation on observational data. In Phase I, a large language model proposes a sparse draft DAG, serving as a semantically informed prior over the space of possible causal structures. In Phase II, this draft is audited and refined via conditional independence testing, with detected discrepancies guiding targeted edge revisions. We evaluate our approach on three metadata-rich real-world benchmarks spanning industrial engineering, environmental monitoring, and IT systems analysis. Across these datasets, DMCD achieves competitive or leading performance against diverse causal discovery baselines, with particularly large gains in recall and F1 score. Probing and ablation experiments suggest that these improvements arise from semantic reasoning over metadata rather than memorization of benchmark graphs. Overall, our results demonstrate that combining semantic priors with principled statistical verification yields a high-performing and practically effective approach to causal structure learning.
Abstract（参考訳）: DMCD(DataMap Causal Discovery)は,変動メタデータからのLCMに基づく意味的ドラフトと,観測データに対する統計的検証を統合した2相因果発見フレームワークである。フェーズIでは、大きな言語モデルがスパースドラフトDAGを提案し、因果構造が考えられる空間に先立って意味的に情報を提供する。第2段階では、この草案は条件付き独立試験によって監査され、修正され、検出された相違点が目標のエッジ修正を導く。我々は,産業工学,環境モニタリング,ITシステム分析を対象とする,メタデータに富んだ実世界の3つのベンチマークに対するアプローチを評価した。これらのデータセット全体で、DMCDは様々な因果発見ベースラインに対して、特にリコールとF1スコアで競争またはリードパフォーマンスを達成する。探索およびアブレーション実験は、これらの改善がベンチマークグラフの記憶よりもメタデータよりも意味論的推論から生じることを示唆している。以上の結果から,セマンティック先行と原理的統計的検証を組み合わせることで,因果構造学習における高性能かつ実用的な手法が得られた。

関連論文リスト

Reasoning-Driven Multimodal LLM for Domain Generalization [72.00754603114187]
DomainBed-Reasoning データセットを用いた領域一般化における推論の役割について検討する。 MTCT(Multi-Task Cross-Training)とSARR(Self-Aligned Reasoning Regularization)の2つのコンポーネントからなるフレームワークであるRD-MLDGを提案する。標準のDomainBedデータセットの実験は、RD-MLDGが補完的な最先端のパフォーマンスを達成することを示した。
論文参考訳（メタデータ） (2026-02-27T08:10:06Z)
STAR : Bridging Statistical and Agentic Reasoning for Large Model Performance Prediction [78.0692157478247]
本稿では,知識駆動型エージェント推論を用いて,データ駆動型静的予測を橋渡しするフレームワークSTARを提案する。 STARはスコアベースとランクベースの両方の基準線を一貫して上回ることを示す。
論文参考訳（メタデータ） (2026-02-12T16:30:07Z)
Localized Kernel Projection Outlyingness: A Two-Stage Approach for Multi-Modal Outlier Detection [0.0]
Two-Stage LKPLOは、新しいマルチステージアウトレイラ検出フレームワークである。従来の射影的手法の制約を克服する。挑戦的なデータセットで最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (2025-10-28T03:53:46Z)
Relationship Detection on Tabular Data Using Statistical Analysis and Large Language Models [4.201987249923826]
この研究は、知識グラフ(KG)を基準点として、CPAとして知られるタスクを用いて関係を検出するハイブリッドアプローチで実験する。このアプローチは、潜在的KG関係の探索空間を減少させるために統計解析を用いて、大きな言語モデル(LLM)を利用する。 SemTab チャレンジによって提供される2つのベンチマークデータセットの実験評価は、各モジュールの影響と異なる最先端 LLM の有効性を評価する。
論文参考訳（メタデータ） (2025-06-04T12:11:05Z)
Financial Data Analysis with Robust Federated Logistic Regression [7.68275287892947]
本研究では,データを複数のクライアントやロケーションに分散するフェデレートされた環境での財務データの解析に焦点をあてる。我々は,これらの目標のバランスを保とうとする,ロジスティックなロジスティック回帰に基づく堅牢なフレームワークを提案する。
論文参考訳（メタデータ） (2025-04-28T20:42:24Z)
Meta-Statistical Learning: Supervised Learning of Statistical Inference [59.463430294611626]
この研究は、大きな言語モデル(LLM)の成功を駆動するツールと原則が、分散レベルのタスクに取り組むために再利用可能であることを実証している。本稿では,統計的推論タスクを教師付き学習問題として再構成するマルチインスタンス学習に触発されたメタ統計学習を提案する。
論文参考訳（メタデータ） (2025-02-17T18:04:39Z)
Multi-Agent Causal Discovery Using Large Language Models [10.020595983728482]
因果発見は機械学習における重要な研究領域である。我々はMulti-Agent Causal Discovery Framework(MAC)を紹介する。 Debate-Coding Module (DCM) と Meta-Debate Module (MDM) の2つの主要なモジュールで構成されている。
論文参考訳（メタデータ） (2024-07-21T06:21:47Z)
DAGnosis: Localized Identification of Data Inconsistencies using Structures [73.39285449012255]
機械学習モデルを確実に使用するためには、デプロイメント時のデータの不整合の特定と適切な処理が不可欠である。我々は,有向非巡回グラフ(DAG)を用いて,トレーニングセットの特徴分布と非依存性を構造として符号化する。我々の手法はDAGnosisと呼ばれ、これらの構造的相互作用を利用して、価値があり洞察に富んだデータ中心の結論をもたらす。
論文参考訳（メタデータ） (2024-02-26T11:29:16Z)
SSL Framework for Causal Inconsistency between Structures and Representations [31.895570222735955]
因果発見と深層学習の相互補間は、ますます広範囲にわたる相互作用を引き起こしている。不確定データは、因果構造によって表現される因果関係と、深層学習モデルによって生成される因果表現との間に矛盾がある。因果不整合を軽減するために,介入に基づく自己教師型学習フレームワークを提案する。
論文参考訳（メタデータ） (2023-10-28T08:29:49Z)
Multi-level Consistency Learning for Semi-supervised Domain Adaptation [85.90600060675632]
半教師付きドメイン適応(SSDA)は、完全にラベル付けされたソースドメインから学習した知識をわずかにラベル付けされたターゲットドメインに適用することを目的としている。 SSDAのための多レベル一貫性学習フレームワークを提案する。
論文参考訳（メタデータ） (2022-05-09T06:41:18Z)
DRFLM: Distributionally Robust Federated Learning with Inter-client Noise via Local Mixup [58.894901088797376]
連合学習は、生データをリークすることなく、複数の組織のデータを使用してグローバルモデルをトレーニングするための有望なアプローチとして登場した。上記の2つの課題を同時に解決するための一般的な枠組みを提案する。我々は、ロバストネス解析、収束解析、一般化能力を含む包括的理論的解析を提供する。
論文参考訳（メタデータ） (2022-04-16T08:08:29Z)
Uncovering Main Causalities for Long-tailed Information Extraction [14.39860866665021]
データセットの選択バイアスによって引き起こされる長い尾の分布は、誤った相関をもたらす可能性がある。これは、データの背後にある主な因果関係を明らかにすることを目的とした、新しいフレームワークである。
論文参考訳（メタデータ） (2021-09-11T08:08:24Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。