論文の概要: XAI-Grounded Explanation Generation for Speech Deepfake Detection with Training-Free Multimodal Large Language Models
- arxiv url: http://arxiv.org/abs/2606.16137v1
- Date: Mon, 15 Jun 2026 02:55:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-16 16:21:34.043163
- Title: XAI-Grounded Explanation Generation for Speech Deepfake Detection with Training-Free Multimodal Large Language Models
- Title(参考訳): 学習自由多モーダル大言語モデルを用いた音声深度検出のためのXAI周辺説明生成
- Authors: Yupei Li, Qiyang Sun, Xiaoliang Wu, Chenxi Wang, Berrak Sisman, Björn W. Schuller,
- Abstract要約: 音声深度検出(SDD)システムは、信頼できる意思決定のために信頼できる説明を必要とする。
従来の説明可能なAI(XAI)は、モデル決定と密結合した低レベルの属性信号を生成する。
大言語モデル(LLM)に基づく説明生成は、ジェネリックおよびアングラウンド記述を生成する。
- 参考スコア(独自算出の注目度): 48.03852608747844
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Speech deepfake detection (SDD) systems require trustworthy explanations for reliable decision-making. Existing explanation ways mainly fall into two categories. Traditional explainable AI (XAI), such as gradient-based attribution, produces low-level attribution signals tightly coupled with model decisions, and harder to be understood by human than natural language explanations. Meanwhile, large language model (LLM)-based explanation generation often produces generic and ungrounded descriptions due to the lack of heuristic evidence and task-specific supervision, stemming from limited grounded explanation datasets for SDD. We therefore propose a training-free explanation framework that integrates XAI evidence with multimodal LLMs to generate grounded and specific explanations. Using the PartialSpoof dataset, we construct a grounded explanation dataset and show that methods with XAI increase inside accuracy by over 45\%, verified through human evaluation and faithfulness checks.
- Abstract(参考訳): 音声深度検出(SDD)システムは、信頼できる意思決定のために信頼できる説明を必要とする。
既存の説明方法は、主に2つのカテゴリに分類される。
勾配に基づく帰属のような従来の説明可能なAI(XAI)は、モデル決定と密結合した低レベルの帰属信号を生成する。
一方、大規模言語モデル(LLM)に基づく説明生成は、SDDの限られた基盤的説明データセットから派生した、ヒューリスティックな証拠の欠如とタスク固有の監督のために、一般的で根拠のない記述を生成することが多い。
そこで本研究では,XAIエビデンスとマルチモーダルLLMを統合した学習自由説明フレームワークを提案する。
PartialSpoof データセットを用いて、基礎的な説明データセットを構築し、XAI を用いた手法が精度を 45 % 以上向上し、人間の評価と忠実度チェックによって検証されたことを示す。
関連論文リスト
- A Two-Stage LLM Framework for Accessible and Verified XAI Explanations [0.0]
大規模言語モデル (LLMs) は、eXplainable Artificial Intelligence (XAI) メソッドの技術的出力を、アクセス可能な自然言語の説明に変換するために、ますます使われている。
本稿では, (i) 生のXAI出力を自然言語の物語に変換するExplainer LLM, (ii) 信頼度, 一貫性, 完全性, リスクの観点から評価するVerifier LLM, (iii) 検証者のフィードバックを用いてそれらを洗練・改善する反復的再送機構からなる2段階LLMメタ検証フレームワークを提案する。
論文 参考訳(メタデータ) (2026-04-14T10:15:57Z) - Human Texts Are Outliers: Detecting LLM-generated Texts via Out-of-distribution Detection [71.59834293521074]
我々は,人間によるテキストと機械によるテキストを区別する枠組みを開発した。
提案手法は,DeepFakeデータセット上で98.3%のAUROCとAUPRを8.9%のFPR95で達成する。
コード、事前トレーニングされたウェイト、デモがリリースされる。
論文 参考訳(メタデータ) (2025-10-07T08:14:45Z) - ForenX: Towards Explainable AI-Generated Image Detection with Multimodal Large Language Models [82.04858317800097]
ForenXは画像の真正性を識別するだけでなく、人間の思考に共鳴する説明を提供する新しい手法である。
ForenXは、強力なマルチモーダル大言語モデル(MLLM)を使用して、法医学的な手がかりを分析し、解釈する。
本稿では,AI生成画像における偽証拠の記述専用のデータセットであるForgReasonを紹介する。
論文 参考訳(メタデータ) (2025-08-02T15:21:26Z) - Natural Language Counterfactual Explanations for Graphs Using Large Language Models [7.560731917128082]
我々は、オープンソースのLarge Language Modelsの力を利用して、自然言語の説明を生成する。
提案手法は, 対実例の正確な自然言語表現を効果的に生成することを示す。
論文 参考訳(メタデータ) (2024-10-11T23:06:07Z) - Explaining Explainability: Towards Deeper Actionable Insights into Deep
Learning through Second-order Explainability [70.60433013657693]
2階説明可能なAI(SOXAI)は、最近インスタンスレベルからデータセットレベルまで説明可能なAI(XAI)を拡張するために提案されている。
そこで本研究では,SOXAIの動作可能な洞察に基づくトレーニングセットから無関係な概念を除外することで,モデルの性能を向上させることができることを示す。
論文 参考訳(メタデータ) (2023-06-14T23:24:01Z) - MEGAN: Multi-Explanation Graph Attention Network [1.1470070927586016]
マルチエクスラレーショングラフアテンションネットワーク(MEGAN)を提案する。
既存のグラフ説明可能性法とは異なり、ネットワークは複数のチャネルに沿ってノードとエッジの属性の説明を生成することができる。
我々の注意に基づくネットワークは完全に差別化可能であり、説明を指導的な方法で積極的に訓練することができる。
論文 参考訳(メタデータ) (2022-11-23T16:10:13Z) - INTERACTION: A Generative XAI Framework for Natural Language Inference
Explanations [58.062003028768636]
現在のXAIアプローチは、ひとつの説明を提供することにのみ焦点をあてています。
本稿では、生成型XAIフレームワーク、InterACTION(explaIn aNd predicT thEn queRy with contextuAl CondiTional variational autO-eNcoder)を提案する。
提案するフレームワークは,説明とラベル予測の2つのステップ,および(ステップ2)異種証拠生成の2つのステップで説明を行う。
論文 参考訳(メタデータ) (2022-09-02T13:52:39Z) - Interpretable Data-Based Explanations for Fairness Debugging [7.266116143672294]
Gopherは、バイアスや予期せぬモデルの振る舞いに関するコンパクトで解釈可能な、因果的な説明を生成するシステムである。
我々は,学習データに介入する程度を,サブセットの削除や更新によって定量化する因果責任の概念を導入し,バイアスを解消する。
この概念に基づいて、モデルバイアスを説明するトップkパターンを生成するための効率的なアプローチを開発する。
論文 参考訳(メタデータ) (2021-12-17T20:10:00Z) - Data Augmentation for Spoken Language Understanding via Pretrained
Language Models [113.56329266325902]
音声言語理解(SLU)モデルの訓練は、しばしばデータ不足の問題に直面している。
我々は,事前学習言語モデルを用いたデータ拡張手法を提案し,生成した発話の変動性と精度を向上した。
論文 参考訳(メタデータ) (2020-04-29T04:07:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。