論文の概要: Explaining Text Classifiers with Counterfactual Representations
- arxiv url: http://arxiv.org/abs/2402.00711v1
- Date: Thu, 1 Feb 2024 16:06:35 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-02 14:51:36.658843
- Title: Explaining Text Classifiers with Counterfactual Representations
- Title(参考訳): 事実表現を用いたテキスト分類器の解説
- Authors: Pirmin Lemberger, Antoine Saillenfest
- Abstract要約: 本稿では,テキスト表現の空間を介在させることで,対物生成の簡易な手法を提案する。
我々の介入は、パールの因果推論フレームワークで定義された反事実と整合するように理論的に健全である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: One well motivated explanation method for classifiers leverages
counterfactuals which are hypothetical events identical to real observations in
all aspects except for one categorical feature. Constructing such
counterfactual poses specific challenges for texts, however, as some attribute
values may not necessarily align with plausible real-world events. In this
paper we propose a simple method for generating counterfactuals by intervening
in the space of text representations which bypasses this limitation. We argue
that our interventions are minimally disruptive and that they are theoretically
sound as they align with counterfactuals as defined in Pearl's causal inference
framework. To validate our method, we first conduct experiments on a synthetic
dataset of counterfactuals, allowing for a direct comparison between classifier
predictions based on ground truth counterfactuals (obtained through explicit
text interventions) and our counterfactuals, derived through interventions in
the representation space. Second, we study a real world scenario where our
counterfactuals can be leveraged both for explaining a classifier and for bias
mitigation.
- Abstract(参考訳): 分類器のよく動機付けられた1つの説明法は、一つの分類的特徴を除いて全ての面における実観測と同一の仮説的事象である反事実を利用する。
しかし、そのような偽造は、ある属性値が必ずしも有望な現実世界の出来事と一致するとは限らないため、テキストに特定の課題をもたらす。
本稿では,この制限を回避したテキスト表現空間に介入することで,対物生成の簡易な手法を提案する。
我々は、我々の介入は最小限の破壊的であり、パールの因果推論フレームワークで定義された反事実と一致して理論的に健全であると主張する。
提案手法を検証するために,まず,提案手法の合成データセットを用いて実験を行い,(明示的なテキスト介入によって得られた)真偽事実に基づく分類器の予測と,表現空間の介入によって導出される偽事実との直接比較を行った。
第二に、分類器の説明とバイアス緩和の両方に反事実を活用できる現実世界のシナリオについて検討する。
関連論文リスト
- Proximal Causal Inference With Text Data [5.796482272333648]
本稿では,2つの前処理テキストデータを用いた因果推論手法を提案し,2つのゼロショットモデルを用いて2つのプロキシを推定し,それらのプロキシを近位g-形式に適用する。
ゼロショット予測のためのMIMIC-IIIおよびオープン大言語モデルを用いた実世界の臨床ノートを用いて, 合成および半合成条件下での手法の評価を行った。
論文 参考訳(メタデータ) (2024-01-12T16:51:02Z) - Prototype-based Aleatoric Uncertainty Quantification for Cross-modal
Retrieval [139.21955930418815]
クロスモーダル検索手法は、共通表現空間を共同学習することにより、視覚と言語モダリティの類似性関係を構築する。
しかし、この予測は、低品質なデータ、例えば、腐敗した画像、速いペースの動画、詳細でないテキストによって引き起こされるアレタリック不確実性のために、しばしば信頼性が低い。
本稿では, 原型に基づくAleatoric Uncertainity Quantification (PAU) フレームワークを提案する。
論文 参考訳(メタデータ) (2023-09-29T09:41:19Z) - Interpretable Automatic Fine-grained Inconsistency Detection in Text
Summarization [56.94741578760294]
本研究の目的は, 要約中の事実誤りの微粒化を予測し, 微粒化不整合検出の課題を提案することである。
要約における現実的不整合の検査方法に触発され,解析可能な微粒不整合検出モデルであるFinGrainFactを提案する。
論文 参考訳(メタデータ) (2023-05-23T22:11:47Z) - Textual Entailment Recognition with Semantic Features from Empirical
Text Representation [60.31047947815282]
テキストが仮説を包含するのは、仮説の真の価値がテキストに従う場合に限る。
本稿では,テキストと仮説のテキストの包含関係を同定する新しい手法を提案する。
本手法では,テキスト・ハイブリッド・ペア間の意味的含意関係を識別できる要素ワイド・マンハッタン距離ベクトルベースの特徴を用いる。
論文 参考訳(メタデータ) (2022-10-18T10:03:51Z) - Logical Satisfiability of Counterfactuals for Faithful Explanations in
NLI [60.142926537264714]
本稿では, 忠実度スルー・カウンタファクトの方法論について紹介する。
これは、説明に表される論理述語に基づいて、反実仮説を生成する。
そして、そのモデルが表現された論理と反ファクトの予測が一致しているかどうかを評価する。
論文 参考訳(メタデータ) (2022-05-25T03:40:59Z) - Conditional Supervised Contrastive Learning for Fair Text Classification [59.813422435604025]
対照的な学習を通してテキスト分類のための等化オッズとして知られる公平性の概念を満たす学習公正表現について研究する。
具体的には、まず、公正性制約のある学習表現と条件付き教師付きコントラスト目的との間の関係を理論的に分析する。
論文 参考訳(メタデータ) (2022-05-23T17:38:30Z) - Counterfactual Evaluation for Explainable AI [21.055319253405603]
そこで本稿では, 文献的推論の観点から, 説明の忠実さを評価する新しい手法を提案する。
離散シナリオと連続シナリオの両方において適切な反事実を見つけるために2つのアルゴリズムを導入し、取得した反事実を用いて忠実度を測定する。
論文 参考訳(メタデータ) (2021-09-05T01:38:49Z) - Nested Counterfactual Identification from Arbitrary Surrogate
Experiments [95.48089725859298]
観測と実験の任意の組み合わせからネスト反事実の同定について検討した。
具体的には、任意のネストされた反事実を非ネストされたものへ写像できる反ファクト的非ネスト定理(英語版)(CUT)を証明する。
論文 参考訳(メタデータ) (2021-07-07T12:51:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。