Fugu-MT 論文翻訳(概要): Towards Faithful Explanations for Text Classification with Robustness Improvement and Explanation Guided Training

論文の概要: Towards Faithful Explanations for Text Classification with Robustness Improvement and Explanation Guided Training

arxiv url: http://arxiv.org/abs/2312.17591v1
Date: Fri, 29 Dec 2023 13:07:07 GMT
ステータス: 翻訳完了
システム内更新日: 2024-01-02 09:48:18.475015
Title: Towards Faithful Explanations for Text Classification with Robustness Improvement and Explanation Guided Training
Title（参考訳）: ロバスト性向上と説明指導によるテキスト分類のための忠実な説明
Authors: Dongfang Li, Baotian Hu, Qingcai Chen, Shan He
Abstract要約: 特徴属性法は、重要な入力トークンをモデル予測の説明として強調する。近年の研究では、これらの手法による説明は、忠実で堅牢であるという課題に直面している。本稿では,テキスト分類のためのロバスト性向上と説明指導による,より忠実な説明(REGEX)への指導手法を提案する。
参考スコア（独自算出の注目度）: 30.626080706755822
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Feature attribution methods highlight the important input tokens as explanations to model predictions, which have been widely applied to deep neural networks towards trustworthy AI. However, recent works show that explanations provided by these methods face challenges of being faithful and robust. In this paper, we propose a method with Robustness improvement and Explanation Guided training towards more faithful EXplanations (REGEX) for text classification. First, we improve model robustness by input gradient regularization technique and virtual adversarial training. Secondly, we use salient ranking to mask noisy tokens and maximize the similarity between model attention and feature attribution, which can be seen as a self-training procedure without importing other external information. We conduct extensive experiments on six datasets with five attribution methods, and also evaluate the faithfulness in the out-of-domain setting. The results show that REGEX improves fidelity metrics of explanations in all settings and further achieves consistent gains based on two randomization tests. Moreover, we show that using highlight explanations produced by REGEX to train select-then-predict models results in comparable task performance to the end-to-end method.
Abstract（参考訳）: 特徴属性法は、信頼できるAIに向けたディープニューラルネットワークに広く適用されてきたモデル予測の説明として重要な入力トークンを強調する。しかし、近年の研究では、これらの手法による説明は忠実で堅牢であるという課題に直面している。本稿では,テキスト分類のためのより忠実な説明(regex)に向けたロバスト性向上と説明指導トレーニングを提案する。まず,入力勾配正規化手法と仮想対角トレーニングによりモデルロバスト性を改善する。第二に、ノイズの多いトークンをマスクし、モデル注意と特徴属性の類似性を最大化し、外部情報をインポートすることなく自己学習の手順と見なすことができる。我々は,5つの帰属手法による6つのデータセットに対する広範な実験を行い,ドメイン外設定の忠実さを評価する。その結果、REGEXは全ての設定における説明の忠実度を向上し、さらに2つのランダム化テストに基づいて一貫したゲインを得ることがわかった。さらに,REGEXが生成したハイライト説明を用いて,選択列予測モデルをトレーニングすることにより,タスク性能をエンドツーエンド手法に匹敵することを示す。

関連論文リスト

SHAP-Guided Regularization in Machine Learning Models [1.0515439489916734]
本稿では,特徴量制約をモデルトレーニングに組み込んだSHAP誘導正規化フレームワークを提案する。提案手法は, アントロピーに基づくペナルティを応用し, スパース, 集中した特徴属性の促進と, 試料間の安定性の促進を図った。
論文参考訳（メタデータ） (2025-07-31T15:45:38Z)
Similarity-Guided Diffusion for Contrastive Sequential Recommendation [1.8995841954563375]
コントラスト的シーケンスレコメンデーションのための類似性誘導拡散法を提案する。本手法は,アイテム埋め込みベクトル間の類似性を利用して,意味的に一貫したノイズを生成する。対照的な学習の観点から、提案手法はより差別的な正と負のサンプルを提供する。
論文参考訳（メタデータ） (2025-07-16T03:26:24Z)
Enhancing Training Data Attribution with Representational Optimization [57.61977909113113]
トレーニングデータ属性法は、トレーニングデータがモデルの予測にどのように影響するかを測定することを目的としている。本稿では,タスク固有表現とモデル整合表現をTDAで明示的に学習することで,このギャップを埋める表現ベースアプローチであるAirRepを提案する。 AirRepは、属性品質に合わせて調整されたトレーニング可能なエンコーダと、グループワイドの影響を正確に見積もるアテンションベースのプール機構の2つの重要なイノベーションを紹介している。
論文参考訳（メタデータ） (2025-05-24T05:17:53Z)
Improving Network Interpretability via Explanation Consistency Evaluation [56.14036428778861]
本稿では、より説明可能なアクティベーションヒートマップを取得し、同時にモデル性能を向上させるフレームワークを提案する。具体的には、モデル学習において、トレーニングサンプルを適応的に重み付けするために、新しいメトリクス、すなわち説明整合性を導入する。そこで,本フレームワークは,これらのトレーニングサンプルに深い注意を払ってモデル学習を促進する。
論文参考訳（メタデータ） (2024-08-08T17:20:08Z)
Self-Supervised Dual Contouring [30.9409064656302]
本稿ではニューラルデュアルコンチューリングメッシュフレームワークのための自己教師型トレーニングスキームを提案する。生成メッシュ間の距離の整合性を促進する2つの新しい自己教師付き損失関数を用いる。単視点再構成作業における自己監督的損失によりメッシュ性能が向上することが実証された。
論文参考訳（メタデータ） (2024-05-28T12:44:28Z)
READ: Improving Relation Extraction from an ADversarial Perspective [33.44949503459933]
関係抽出(RE)に特化して設計された対角的学習法を提案する。提案手法では,シーケンスレベルの摂動とトークンレベルの摂動の両方をサンプルに導入し,個別の摂動語彙を用いてエンティティとコンテキストの摂動の探索を改善する。
論文参考訳（メタデータ） (2024-04-02T16:42:44Z)
Noisy Self-Training with Synthetic Queries for Dense Retrieval [49.49928764695172]
合成クエリと組み合わせた,ノイズの多い自己学習フレームワークを提案する。実験結果から,本手法は既存手法よりも一貫した改善が得られた。我々の手法はデータ効率が良く、競争のベースラインより優れています。
論文参考訳（メタデータ） (2023-11-27T06:19:50Z)
Towards General Visual-Linguistic Face Forgery Detection [95.73987327101143]
ディープフェイクは現実的な顔操作であり、セキュリティ、プライバシー、信頼に深刻な脅威をもたらす可能性がある。既存の方法は、このタスクを、デジタルラベルまたはマスク信号を使用して検出モデルをトレーニングするバイナリ分類として扱う。本稿では, 微粒な文レベルのプロンプトをアノテーションとして用いた, VLFFD (Visual-Linguistic Face Forgery Detection) という新しいパラダイムを提案する。
論文参考訳（メタデータ） (2023-07-31T10:22:33Z)
Preserving Knowledge Invariance: Rethinking Robustness Evaluation of Open Information Extraction [50.62245481416744]
実世界におけるオープン情報抽出モデルの評価をシミュレートする最初のベンチマークを示す。我々は、それぞれの例が知識不変のcliqueである大規模なテストベッドを設計し、注釈付けする。さらにロバスト性計量を解明することにより、その性能が全体の傾きに対して一貫して正確であるならば、モデルはロバストであると判断される。
論文参考訳（メタデータ） (2023-05-23T12:05:09Z)
Cluster-level pseudo-labelling for source-free cross-domain facial expression recognition [94.56304526014875]
表情認識のためのSFUDA法を提案する。本手法は,自己教師付き事前学習を利用して,対象データから優れた特徴表現を学習する。提案手法の有効性を4つの適応方式で検証し,FERに適用した場合,既存のSFUDA法より一貫して優れていることを示す。
論文参考訳（メタデータ） (2022-10-11T08:24:50Z)
FineDiving: A Fine-grained Dataset for Procedure-aware Action Quality Assessment [93.09267863425492]
競争力のあるスポーツビデオにおける行動の高レベル意味論と内部時間構造の両方を理解することが、予測を正確かつ解釈可能なものにする鍵である、と我々は主張する。本研究では,多様なダイビングイベントに対して,アクションプロシージャに関する詳細なアノテーションを付加した,ファインディビングと呼ばれる詳細なデータセットを構築した。
論文参考訳（メタデータ） (2022-04-07T17:59:32Z)
An Empirical Study on Explanations in Out-of-Domain Settings [35.07805573291534]
ドメイン外設定において、ポストホックな説明と本質的に忠実なモデルがどのように機能するかを検討する。その結果, ドメイン外説明の忠実度は, ドメイン内説明の充実度や包括性によって測定されることが多い。また,本研究では,全文学習モデルに対して,ドメイン外設定において,予測モデルに比較して予測性能が示された。
論文参考訳（メタデータ） (2022-02-28T19:50:23Z)
Enjoy the Salience: Towards Better Transformer-based Faithful Explanations with Word Salience [9.147707153504117]
本研究では,TextRankを用いて抽出した有能な情報に近づき,訓練中に多頭部注意機構を誘導する補助的損失関数を提案する。 5つのデータセットにわたる説明の忠実性の実験は、SaLossでトレーニングされたモデルが一貫してより忠実な説明を提供することを示している。さらに、下流タスクにおいて、後者がより高い予測性能をもたらすことを示す。
論文参考訳（メタデータ） (2021-08-31T11:21:30Z)
Self-supervised Co-training for Video Representation Learning [103.69904379356413]
実例に基づく情報ノイズコントラスト推定訓練に意味クラス正の付加を施すことの利点について検討する。本稿では,インフォネッションNCEの損失を改善するための,自己指導型協調学習手法を提案する。本研究では,2つの下流タスク(行動認識とビデオ検索)における学習表現の質を評価する。
論文参考訳（メタデータ） (2020-10-19T17:59:01Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。