論文の概要: CausalSent: Interpretable Sentiment Classification with RieszNet
- arxiv url: http://arxiv.org/abs/2508.17576v1
- Date: Mon, 25 Aug 2025 00:56:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-26 18:43:45.592204
- Title: CausalSent: Interpretable Sentiment Classification with RieszNet
- Title(参考訳): CausalSent: RieszNetによる解釈可能な知覚分類
- Authors: Daniel Frees, Martin Pollack,
- Abstract要約: RieszNetをベースとしたニューラルネットワークアーキテクチャを試作し,処理効果推定精度の向上を実現した。
筆者らのフレームワークCausalSentは,半合成IMDB映画レビューにおける治療効果を正確に予測する。
本研究は,IMDB映画レビューにおける「愛」という言葉の因果効果に関する観察的ケーススタディを行い,「愛」という言葉の存在が肯定的な感情の確率を+2.9%増加させることを示した。
- 参考スコア(独自算出の注目度): 0.838951778235462
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Despite the overwhelming performance improvements offered by recent natural language procesing (NLP) models, the decisions made by these models are largely a black box. Towards closing this gap, the field of causal NLP combines causal inference literature with modern NLP models to elucidate causal effects of text features. We replicate and extend Bansal et al's work on regularizing text classifiers to adhere to estimated effects, focusing instead on model interpretability. Specifically, we focus on developing a two-headed RieszNet-based neural network architecture which achieves better treatment effect estimation accuracy. Our framework, CausalSent, accurately predicts treatment effects in semi-synthetic IMDB movie reviews, reducing MAE of effect estimates by 2-3x compared to Bansal et al's MAE on synthetic Civil Comments data. With an ensemble of validated models, we perform an observational case study on the causal effect of the word "love" in IMDB movie reviews, finding that the presence of the word "love" causes a +2.9% increase in the probability of a positive sentiment.
- Abstract(参考訳): 最近の自然言語処理(NLP)モデルによる圧倒的なパフォーマンス向上にもかかわらず、これらのモデルによる決定は主にブラックボックスである。
このギャップを埋めるために、因果的NLPの分野は、因果的推論文学と現代のNLPモデルを組み合わせて、テキスト特徴の因果的効果を解明する。
我々は、Bansalらによるテキスト分類器の正規化作業の再現と拡張を行い、その代わりにモデル解釈可能性に焦点をあてる。
具体的には、より優れた処理効果推定精度を実現するために、二つの頭を持つRieszNetベースのニューラルネットワークアーキテクチャを開発することに焦点を当てる。
筆者らのフレームワークCausalSentは、半合成IMDB映画レビューにおける治療効果を正確に予測し、Bansal et alのMAEの合成民間コメントデータと比較して、効果推定のMAEを2~3倍削減する。
検証されたモデルのアンサンブルを用いて、IMDBの映画レビューにおいて「ラブ」という言葉の因果効果に関する観察ケーススタディを行い、「ラブ」という言葉が存在すると肯定的な感情の確率が2.9%上昇することを発見した。
関連論文リスト
- Self-Rationalization in the Wild: A Large Scale Out-of-Distribution Evaluation on NLI-related tasks [59.47851630504264]
自由文の説明は表現力があり理解しやすいが、多くのデータセットには注釈付き説明データがない。
我々は、T5-LargeモデルとOLMo-7Bモデルを微調整し、微調整データ品質、微調整サンプル数、少数ショット選択方法の影響を評価した。
モデルは、自然言語推論(NLI)、ファクトチェック、抽象的な要約における幻覚検出の3つのタスクにまたがる19の多様なOODデータセットで評価される。
論文 参考訳(メタデータ) (2025-02-07T10:01:32Z) - Causal Post-Processing of Predictive Models [1.3124513975412255]
本稿では,因果関係によく適合するように予測スコアを精算する手法である因果後処理を提案する。
単調な後処理、修正後処理、モデルベースの後処理の3つの主要なCPPアプローチを導入する。
本研究は,非因果予測モデルと実験データを統合することの利点を,競合する代替手段として扱うことよりも明らかにした。
論文 参考訳(メタデータ) (2024-06-13T20:18:16Z) - Prompting or Fine-tuning? Exploring Large Language Models for Causal Graph Validation [0.0]
本研究では,因果グラフの因果性を評価するための大規模言語モデルの有用性について検討する。
本研究では,(1)ゼロショットと少数ショットの因果推論のためのプロンプトベース手法,(2)因果関係予測タスクのための微調整言語モデルの比較を行った。
論文 参考訳(メタデータ) (2024-05-29T09:06:18Z) - Estimating the Causal Effects of Natural Logic Features in Transformer-Based NLI Models [16.328341121232484]
文脈介入の効果を測定するために因果効果推定手法を適用した。
本研究はトランスフォーマーの無関係な変化に対する堅牢性と影響の高い変化に対する感受性について検討する。
論文 参考訳(メタデータ) (2024-04-03T10:22:35Z) - C-XGBoost: A tree boosting model for causal effect estimation [8.246161706153805]
因果効果推定は、平均処理効果と、治療の条件平均処理効果を、利用可能なデータから得られる結果に推定することを目的としている。
本稿では,C-XGBoost という新たな因果推論モデルを提案する。
論文 参考訳(メタデータ) (2024-03-31T17:43:37Z) - CausalDialogue: Modeling Utterance-level Causality in Conversations [83.03604651485327]
クラウドソーシングを通じて、CausalDialogueという新しいデータセットをコンパイルし、拡張しました。
このデータセットは、有向非巡回グラフ(DAG)構造内に複数の因果効果対を含む。
ニューラル会話モデルの訓練における発話レベルにおける因果性の影響を高めるために,Exponential Average Treatment Effect (ExMATE) と呼ばれる因果性強化手法を提案する。
論文 参考訳(メタデータ) (2022-12-20T18:31:50Z) - A Causal Framework to Quantify the Robustness of Mathematical Reasoning
with Language Models [81.15974174627785]
入力空間における直接的介入に対する頑健さと感度の観点から言語モデルの振舞いについて検討する。
しかし, GPT-3 Davinciモデル(175B)は, 他のGPTモデルと比較して, 頑健さと感度の両面で劇的な改善を実現している。
論文 参考訳(メタデータ) (2022-10-21T15:12:37Z) - Counterfactual Reasoning for Out-of-distribution Multimodal Sentiment
Analysis [56.84237932819403]
本稿では,OODの高次一般化に対するテキストモダリティの悪影響を推定・緩和することを目的とする。
そこで本研究では,マルチモーダル感情分析のためのモデルに依存しない反現実的フレームワークを考案した。
論文 参考訳(メタデータ) (2022-07-24T03:57:40Z) - Causally Estimating the Sensitivity of Neural NLP Models to Spurious
Features [19.770032728328733]
NLPにおける異なる形態の突発性特徴の効果を評価・比較する手段はない。
我々は,CENTと呼ばれる因果推定値を用いて,刺激性特徴に対するモデル感度を定量化する。
感度と頑健性の間に統計的に有意な逆相関が見られ、仮説を実証的に支持する。
論文 参考訳(メタデータ) (2021-10-14T05:26:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。