論文の概要: NoisyCausal: A Benchmark for Evaluating Causal Reasoning Under Structured Noise
- arxiv url: http://arxiv.org/abs/2605.04313v1
- Date: Tue, 05 May 2026 21:26:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-07 18:41:07.552695
- Title: NoisyCausal: A Benchmark for Evaluating Causal Reasoning Under Structured Noise
- Title(参考訳): NoisyCausal: 構造雑音下での因果推論評価ベンチマーク
- Authors: Zhi Xu, Yun Fu,
- Abstract要約: 自然言語の因果推論には、関連する変数を特定し、それらの相互作用を理解し、効果や介入について推論する必要がある。
構造雑音下での因果推論を評価するための新しいベンチマークであるNoisyCausalを紹介する。
これらの課題に対処するために,LLMと明示的な因果構造を組み合わせたモジュラー推論フレームワークを提案する。
- 参考スコア(独自算出の注目度): 33.130357221784166
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Causal reasoning in natural language requires identifying relevant variables, understanding their interactions, and reasoning about effects and interventions, often under noisy or ambiguous conditions. While large language models (LLMs) exhibit strong general reasoning abilities, they struggle to disentangle correlation from causation, particularly when observations are partially incorrect or irrelevant information is present. In this work, we introduce NoisyCausal, a new benchmark designed to evaluate causal reasoning under structured noise. Each instance is generated from a ground-truth causal graph and contextualized with a natural language scenario by injecting controllable forms of noise, such as irrelevant distractors, value perturbations, confounding, and partial observability. Moreover, we propose a modular reasoning framework that combines LLMs with explicit causal structure to address these challenges. Our method prompts the LLM to extract variables, construct a causal graph from context, and then reformulates the reasoning task as a structured prompt grounded in this graph. Rather than relying on statistical patterns alone, the LLM is guided by symbolic structure, enabling more interpretable and robust inference. Experimental results show that our method significantly outperforms standard prompting and reasoning baselines on NoisyCausal. Furthermore, it generalizes well to external benchmarks such as Cladder without task-specific tuning. Our findings highlight the importance of combining causal abstractions with language-driven reasoning to achieve faithful and robust causal understanding in LLMs.
- Abstract(参考訳): 自然言語の因果推論には、関連する変数を特定し、それらの相互作用を理解し、しばしばノイズやあいまいな条件下で、効果や介入について推論する必要がある。
大規模言語モデル(LLM)は、強い一般的な推論能力を示すが、因果関係から相関関係を乱すのに苦労する。
本研究では,構造雑音下での因果推論を評価するための新しいベンチマークであるNoisyCausalを紹介する。
それぞれのインスタンスは、地味な因果グラフから生成され、無関係なイントラクタ、値摂動、コンバウンディング、部分的可観測性などの制御可能なノイズを注入することで、自然言語のシナリオでコンテキスト化される。
さらに,LLMを明示的な因果構造と組み合わせ,これらの課題に対処するモジュラー推論フレームワークを提案する。
提案手法は, LLMに変数を抽出し, 文脈から因果グラフを構築し, このグラフを基盤とした構造化されたプロンプトとして推論タスクを再構成する。
統計的パターンのみに頼るのではなく、LLMはシンボル構造によって導かれ、より解釈可能で堅牢な推論を可能にしている。
実験結果から,本手法はNoisyCausal上での標準的プロンプトおよび推論基準を著しく上回ることがわかった。
さらに、タスク固有のチューニングなしで、Cradderのような外部ベンチマークによく当てはまる。
本研究は,LLMにおける因果的理解を忠実かつ堅牢にするために,因果的抽象と言語による推論を組み合わせることの重要性を強調した。
関連論文リスト
- LLM-Assisted Causal Structure Disambiguation and Factor Extraction for Legal Judgment Prediction [4.655574344274635]
本稿では,大規模言語モデルと統計的因果探索を融合した拡張因果推論フレームワークを提案する。
提案手法は,予測精度とロバスト性の両方において,最先端のベースラインを著しく上回る。
論文 参考訳(メタデータ) (2026-03-12T02:14:16Z) - CausalFlip: A Benchmark for LLM Causal Judgment Beyond Semantic Matching [50.65932158912512]
そこで我々は,新しい大言語モデルの開発を促進するために,因果推論ベンチマークCausalFlipを提案する。
CaulFlipは、イベントトリプル上に構築された因果判断の質問で構成されており、共同創設者、チェーン、コライダーの関係が異なっている。
回答のみのトレーニング,明示的なチェーン・オブ・ソート監視,そして内在型因果推論アプローチなどを含む,複数の訓練パラダイムによるLCMの評価を行った。
論文 参考訳(メタデータ) (2026-02-23T18:06:15Z) - Causal Prompting for Implicit Sentiment Analysis with Large Language Models [21.39152516811571]
Implicit Sentiment Analysis (ISA) は、明示的に述べられるのではなく、示唆される感情を推測することを目的としている。
近年,Large Language Models (LLMs) を用いたプロンプトベースの手法がISAで実現されている。
我々は,CoT推論に正面調整を組み込んだ因果的プロンプトフレームワークであるCAPITALを提案する。
論文 参考訳(メタデータ) (2025-07-01T03:01:09Z) - ACCESS : A Benchmark for Abstract Causal Event Discovery and Reasoning [47.540945048737434]
我々は、抽象因果イベントの発見と推論のために設計されたベンチマークである textttACCESS を紹介する。
本稿では,暗黙的なコモンセンス因果的知識の大規模データセットから,イベント一般化のための抽象化を識別するためのパイプラインを提案する。
論文 参考訳(メタデータ) (2025-02-12T06:19:02Z) - Failure Modes of LLMs for Causal Reasoning on Narratives [51.19592551510628]
世界の知識と論理的推論の相互作用について検討する。
最先端の大規模言語モデル(LLM)は、しばしば表面的な一般化に依存している。
タスクの単純な再構成により、より堅牢な推論行動が引き起こされることを示す。
論文 参考訳(メタデータ) (2024-10-31T12:48:58Z) - Zero-shot Causal Graph Extrapolation from Text via LLMs [50.596179963913045]
我々は,自然言語から因果関係を推定する大規模言語モデル (LLM) の能力を評価する。
LLMは、(特別な)トレーニングサンプルを必要とせずにペア関係のベンチマークで競合性能を示す。
我々は、反復的なペアワイズクエリを通して因果グラフを外挿するアプローチを拡張した。
論文 参考訳(メタデータ) (2023-12-22T13:14:38Z) - Modeling Hierarchical Reasoning Chains by Linking Discourse Units and
Key Phrases for Reading Comprehension [80.99865844249106]
本稿では,論理的推論の基盤として,対話レベルと単語レベルの両方の文脈を扱う総合グラフネットワーク(HGN)を提案する。
具体的には、ノードレベルの関係とタイプレベルの関係は、推論過程におけるブリッジと解釈できるが、階層的な相互作用機構によってモデル化される。
論文 参考訳(メタデータ) (2023-06-21T07:34:27Z) - Systematic Evaluation of Causal Discovery in Visual Model Based
Reinforcement Learning [76.00395335702572]
AIと因果関係の中心的な目標は、抽象表現と因果構造を共同で発見することである。
因果誘導を研究するための既存の環境は、複雑なタスク固有の因果グラフを持つため、この目的には適していない。
本研究の目的は,高次変数の学習表現と因果構造の研究を促進することである。
論文 参考訳(メタデータ) (2021-07-02T05:44:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。