論文の概要: LLM Explainability with Counterfactual Chains and Causal Graphs
- arxiv url: http://arxiv.org/abs/2606.05972v1
- Date: Thu, 04 Jun 2026 10:15:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-05 22:39:44.718085
- Title: LLM Explainability with Counterfactual Chains and Causal Graphs
- Title(参考訳): LLM Explainability with Counterfactal Chains and Causal Graphs
- Authors: Nirit Nussbaum-Hoffer, Nitay Calderon, Liat Ein-Dor, Roi Reichart,
- Abstract要約: 因果グラフはメカニズムを透過的にするための高レベル言語を提供する。
最近の研究では、Large Language Models (LLMs) を用いて、外世界のプロセスの因果グラフを復元している。
LLM推論自体をモデル化するために因果グラフを使用し、モデルがどのように認識し、予測を生成するために高レベルの概念を整理するかを、ステークホルダーに透過的なビューを提供する。
- 参考スコア(独自算出の注目度): 19.857433252352482
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Causal graphs provide a high-level language for making mechanisms transparent. Recent work uses Large Language Models (LLMs) to recover causal graphs of external-world processes. Instead, in this paper, we use causal graphs to model LLM inference itself, providing stakeholders with a transparent view of how the model perceives and organizes high-level concepts to produce a prediction. We propose a four-phase method for constructing such graphs. Given a target LLM and a set of textual examples, our method discovers class-discriminative, human-interpretable concepts and maps each input to LLM-perceived concept states. We then introduce an MCMC-inspired counterfactual augmentation procedure that expands the sparse observational data through chains of counterfactuals. This enables stable causal discovery with $σ$-CG, yielding informative, interpretable graphs. We apply our method to three LLMs across disease diagnosis, sentiment analysis, and LLM-as-a-judge classification tasks. We evaluate the learned graphs for predictive fidelity and structural stability, and the MCMC-inspired augmentation for convergence and downstream utility. Our results show that the discovered causal graphs capture meaningful dependencies consistent with LLMs' reasoning. Together, this paper provides a foundation for concept-level explainability of LLMs.
- Abstract(参考訳): 因果グラフはメカニズムを透過的にするための高レベル言語を提供する。
最近の研究では、Large Language Models (LLMs) を用いて、外世界のプロセスの因果グラフを復元している。
そこで本論文では,LLM推論自体をモデル化するために因果グラフを用い,モデルがどのように認識し,高レベルの概念を整理し,予測を生成するのかを,ステークホルダーに透過的な視点で示す。
このようなグラフを構築するための4相法を提案する。
対象のLLMとテキスト例の集合から,分類的,人間的解釈可能な概念を発見し,各入力をLLM認識された概念状態にマッピングする。
次に,MCMCにインスパイアされた反ファクト改善手法を導入し,反ファクトの連鎖を通してスパース観測データを拡大する。
これにより$σ$-CGで安定した因果発見が可能となり、情報的で解釈可能なグラフが得られる。
本手法は, 疾患診断, 感情分析, LLM-as-a-judge 分類タスクの3つの LLM に適用した。
予測的忠実度と構造安定性の学習グラフと,MCMCにインスパイアされた収束・下流ユーティリティの強化について検討した。
その結果, 因果グラフは LLM の推論と一致した有意な依存関係を捉えていることがわかった。
本稿では,LLMの概念レベルの説明可能性の基盤を提供する。
関連論文リスト
- Mapping the Minds of LLMs: A Graph-Based Analysis of Reasoning LLM [11.181783720439563]
大規模言語モデル(LLM)は、拡張されたChain-of-Thought(CoT)生成を通じて洗練された推論能力を示す。
RLMは、数発のプロンプトによる性能劣化など、直感的で不安定な動作を示すことが多い。
RLMの推論過程をより良くモデル化するための統一的なグラフベース分析フレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-20T03:54:57Z) - How Do Large Language Models Understand Graph Patterns? A Benchmark for Graph Pattern Comprehension [53.6373473053431]
この研究は、グラフパターンタスクにおける大規模言語モデルの能力を評価するためのベンチマークを導入する。
我々は,LLMが用語的記述と位相的記述の両方に基づいて,グラフパターンを理解できるかどうかを評価するベンチマークを開発した。
私たちのベンチマークでは、合成データセットと実際のデータセットの両方と、11のタスクと7のモデルで構成されています。
論文 参考訳(メタデータ) (2024-10-04T04:48:33Z) - Revisiting the Graph Reasoning Ability of Large Language Models: Case Studies in Translation, Connectivity and Shortest Path [53.71787069694794]
大規模言語モデル(LLM)のグラフ推論能力に着目する。
グラフ記述変換,グラフ接続,最短パス問題という3つの基本グラフタスクにおけるLLMの能力を再考する。
この結果から,LLMはテキスト記述によるグラフ構造理解に失敗し,これらの基本課題に対して様々な性能を示すことが可能であることが示唆された。
論文 参考訳(メタデータ) (2024-08-18T16:26:39Z) - Learning on Graphs with Large Language Models(LLMs): A Deep Dive into Model Robustness [39.57155321515097]
大規模言語モデル(LLM)は、様々な自然言語処理タスクにおいて顕著な性能を示している。
LLMがグラフ上での学習において堅牢性を示すかどうかは不明である。
論文 参考訳(メタデータ) (2024-07-16T09:05:31Z) - Can LLM Graph Reasoning Generalize beyond Pattern Memorization? [46.93972334344908]
我々は,大規模言語モデル (LLM) が,合成学習データにおける意味的,数値的,構造的,推論パターンを超えうるか否かを評価し,実世界のグラフベースタスクにおける有用性を向上させる。
トレーニング後のアライメントが現実世界のタスクに最も有望であるのに対して、LLMグラフの推論をパターンを超えて行うことは、依然としてオープンな研究課題である。
論文 参考訳(メタデータ) (2024-06-23T02:59:15Z) - Can Graph Descriptive Order Affect Solving Graph Problems with LLMs? [55.5662721046769]
大規模言語モデル(LLM)は、数学的推論や論理的推論を含む推論タスクにおいて大きな成功を収めた。
従来の研究は様々な手法を用いてLSMのグラフ推論能力について研究してきた。
重要な要素は、主に見過ごされ、グラフ記述がモデルに提示される即時順序である。
論文 参考訳(メタデータ) (2024-02-11T09:46:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。