論文の概要: An Agentic Approach to Generating XAI-Narratives
- arxiv url: http://arxiv.org/abs/2603.20003v1
- Date: Fri, 20 Mar 2026 14:49:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 19:48:39.186342
- Title: An Agentic Approach to Generating XAI-Narratives
- Title(参考訳): XAI-Narratives生成のためのエージェントアプローチ
- Authors: Yifan He, David Martens,
- Abstract要約: 本稿では,XAI物語生成と改良のためのマルチエージェントフレームワークを提案する。
このフレームワークは、複数の批判エージェントからのフィードバックに基づいて物語を生成し、修正するナレーターで構成されている。
その結果, 基本設計, 批判設計, 批判ルール設計が, 全LLMにおける物語の忠実性向上に有効であることが確認された。
- 参考スコア(独自算出の注目度): 2.073904418020962
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Explainable AI (XAI) research has experienced substantial growth in recent years. Existing XAI methods, however, have been criticized for being technical and expert-oriented, motivating the development of more interpretable and accessible explanations. In response, large language model (LLM)-generated XAI narratives have been proposed as a promising approach for translating post-hoc explanations into more accessible, natural-language explanations. In this work, we propose a multi-agent framework for XAI narrative generation and refinement. The framework comprises the Narrator, which generates and revises narratives based on feedback from multiple Critic Agents on faithfulness and coherence metrics, thereby enabling narrative improvement through iteration. We design five agentic systems (Basic Design, Critic Design, Critic-Rule Design, Coherent Design, and Coherent-Rule Design) and systematically evaluate their effectiveness across five LLMs on five tabular datasets. Results validate that the Basic Design, the Critic Design, and the Critic-Rule Design are effective in improving the faithfulness of narratives across all LLMs. Claude-4.5-Sonnet on Basic Design performs best, reducing the number of unfaithful narratives by 90% after three rounds of iteration. To address recurrent issues, we further introduce an ensemble strategy based on majority voting. This approach consistently enhances performance for four LLMs, except for DeepSeek-V3.2-Exp. These findings highlight the potential of agentic systems to produce faithful and coherent XAI narratives.
- Abstract(参考訳): 説明可能なAI(XAI)の研究は近年大きく成長している。
しかし、既存のXAI手法は、技術的かつ専門家指向であり、より解釈可能でアクセスしやすい説明の開発を動機付けていると批判されている。
これに対し,大規模言語モデル(LLM)によるXAI物語は,ポストホックな説明をよりアクセシブルで自然言語的な説明に翻訳するための有望なアプローチとして提案されている。
本研究では,XAI物語生成と改良のためのマルチエージェントフレームワークを提案する。
このフレームワークは、複数の批判エージェントからの忠実度と一貫性の指標に対するフィードバックに基づいて物語を生成し、修正し、反復による物語改善を可能にするナレーターで構成されている。
我々は,5つのエージェントシステム(基本設計,批判設計,批判ルール設計,コヒーレント設計,コヒーレントルール設計)を設計し,その効果を5つの表付きデータセット上で体系的に評価する。
その結果, 基本設計, 批判設計, 批判ルール設計が, 全LLMにおける物語の忠実性向上に有効であることが確認された。
Claude-4.5-Sonnet on Basic Design(英語版)は、3回の反復の後に、不誠実な物語の数を90%削減する。
繰り返し発生する問題に対処するため,多数決に基づくアンサンブル戦略をさらに導入する。
このアプローチは、DeepSeek-V3.2-Expを除いて、4つのLLMの性能を一貫して向上させる。
これらの知見は,忠実で一貫性のあるXAI物語を創出するエージェントシステムの可能性を浮き彫りにした。
関連論文リスト
- LogicLens: Visual-Logical Co-Reasoning for Text-Centric Forgery Analysis [10.305807834419765]
テキスト中心の偽造は、社会保障と情報認証に重大な脅威をもたらす。
テキスト中心の偽造分析の現在の手法は、粗い粒度の視覚分析に限られることが多い。
LogicLens は Visual-Textual Co-reasoning のための統合フレームワークである。
論文 参考訳(メタデータ) (2025-12-25T03:02:27Z) - Agentic Explainable Artificial Intelligence (Agentic XAI) Approach To Explore Better Explanation [7.268064183717186]
本研究では,SHAPをベースとした説明可能性とマルチモーダルLCMによる反復的改善を併用したエージェントXAIフレームワークを提案する。
わが国26田の米収量データを用いて,この枠組みを農業推薦システムとして検証した。
論文 参考訳(メタデータ) (2025-12-24T09:19:15Z) - AI-Salesman: Towards Reliable Large Language Model Driven Telemarketing [79.0112532518727]
我々はTeleSalesCorpusをリリースした。
次に、デュアルステージアーキテクチャを特徴とする新しいフレームワークであるAI-Salesmanを提案する。
提案したAI-Salesmanは,自動測定と総合的な人的評価の両方において,ベースラインモデルを大幅に上回ることを示す。
論文 参考訳(メタデータ) (2025-11-15T09:44:42Z) - AIGI-Holmes: Towards Explainable and Generalizable AI-Generated Image Detection via Multimodal Large Language Models [78.08374249341514]
AI生成コンテンツ(AIGC)の急速な発展は、誤情報を拡散するAIGIの誤用につながった。
大規模で包括的なデータセットであるHolmes-Setを導入し、画像がAI生成されているかどうかを解説したインストラクションチューニングデータセットを含む。
本研究は,MLLMの構造化説明と品質管理によるデータ生成を効率化する,Multi-Expert Juryと呼ばれる効率的なデータアノテーション手法を提案する。
さらに,視覚専門家による事前学習,教師付き微調整,直接選好最適化を含む3段階学習フレームワークであるHolmes Pipelineを提案する。
論文 参考訳(メタデータ) (2025-07-03T14:26:31Z) - Thinking About Thinking: SAGE-nano's Inverse Reasoning for Self-Aware Language Models [0.0]
大規模言語モデル(LLM)は、Chain-of-Thoughtプロンプトで複雑な推論タスクを解く際、顕著な能力を示した。
我々は, LLM を分解し, 自己の推論連鎖をポストホックで説明できる新しいパラダイムであるtextbfinverse reasoning を紹介した。
私たちの研究は、透明なAIシステムのための新たな道を作り、AIの安全性、教育、科学的発見において大きなギャップを埋めます。
論文 参考訳(メタデータ) (2025-06-30T09:53:41Z) - Understanding Software Engineering Agents Through the Lens of Traceability: An Empirical Study [15.97770416681533]
ソフトウェアエンジニアリングエージェント(SWEエージェント)は、ユーザの入力を解釈し、環境フィードバックに応答することで、自律的に動作する。
本稿では,SWEエージェントの動作を,実行トレースのレンズを通してシステマティックに解析する。
論文 参考訳(メタデータ) (2025-06-10T00:41:54Z) - The Lighthouse of Language: Enhancing LLM Agents via Critique-Guided Improvement [61.00950725408354]
大規模言語モデル(LLM)は、最近、テキストベースのアシスタントから、計画、推論、反復的な行動改善が可能な自律エージェントへと変化した。
本研究では,環境を探索するアクターモデルと,詳細な自然言語フィードバックを生成する批評家モデルからなる,新しい2人プレイヤフレームワークであるCGIを紹介する。
論文 参考訳(メタデータ) (2025-03-20T10:42:33Z) - Roadmap towards Superhuman Speech Understanding using Large Language Models [60.57947401837938]
大規模言語モデル(LLM)は、音声データと音声データを統合したものである。
GPT-4oのような最近の進歩は、エンドツーエンドのLLMの可能性を強調している。
本稿では,基本自動音声認識(ASR)から高度な超人モデルまで,5段階のロードマップを提案する。
論文 参考訳(メタデータ) (2024-10-17T06:44:06Z) - INTERACTION: A Generative XAI Framework for Natural Language Inference
Explanations [58.062003028768636]
現在のXAIアプローチは、ひとつの説明を提供することにのみ焦点をあてています。
本稿では、生成型XAIフレームワーク、InterACTION(explaIn aNd predicT thEn queRy with contextuAl CondiTional variational autO-eNcoder)を提案する。
提案するフレームワークは,説明とラベル予測の2つのステップ,および(ステップ2)異種証拠生成の2つのステップで説明を行う。
論文 参考訳(メタデータ) (2022-09-02T13:52:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。