論文の概要: Understanding and Mitigating Spurious Correlations in Text
Classification
- arxiv url: http://arxiv.org/abs/2305.13654v1
- Date: Tue, 23 May 2023 03:55:50 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-24 19:12:32.730813
- Title: Understanding and Mitigating Spurious Correlations in Text
Classification
- Title(参考訳): テキスト分類におけるスプリアス相関の理解と緩和
- Authors: Oscar Chew, Kuan-Hao Huang, Kai-Wei Chang, Hsuan-Tien Lin
- Abstract要約: ディープラーニングモデルは、トレーニングセットに存在する急激な相関を利用する傾向があるが、一般には当てはまらない。
そこで本稿では,言語モデルがどのように突発的相関を利用するかを説明するために,近隣分析フレームワークを提案する。
- 参考スコア(独自算出の注目度): 65.59331366194179
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent work has shown that deep learning models are prone to exploit spurious
correlations that are present in the training set, yet may not hold true in
general. A sentiment classifier may erroneously learn that the token spielberg
is always tied to positive movie reviews. Relying on spurious correlations may
lead to significant degradation in generalizability and should be avoided. In
this paper, we propose a neighborhood analysis framework to explain how exactly
language models exploit spurious correlations. Driven by the analysis, we
propose a family of regularization methods, NFL (do Not Forget your Language)
to prevent the situation. Experiments on two text classification tasks show
that NFL brings a significant improvement over standard fine-tuning in terms of
robustness without sacrificing in-distribution accuracy.
- Abstract(参考訳): 近年の研究では、ディープラーニングモデルがトレーニングセットに存在する散発的な相関を活用しがちであるが、一般的には当てはまらない可能性があることが示されている。
感情分類器は、スピルバーグのトークンが常に肯定的な映画レビューに結びついていることを誤って知ることがある。
散発的な相関に依存すると、一般化可能性が大きく低下し、避けるべきである。
本稿では,言語モデルがスプリアス相関をどのように活用するかを説明するための近傍分析フレームワークを提案する。
この分析に基づいて、状況を防止するためにNFL(言語を忘れない)という正規化手法のファミリーを提案する。
2つのテキスト分類タスクの実験では、NFLは分配精度を犠牲にすることなく、ロバスト性の観点から標準微調整よりも大幅に改善されている。
関連論文リスト
- Spuriousness-Aware Meta-Learning for Learning Robust Classifiers [26.544938760265136]
Spurious correlations is brittle associations between certain attribute of inputs and target variables。
深部画像分類器はしばしばそれらを予測に利用し、相関が持たないデータの一般化が不十分になる。
スプリアス相関の影響を緩和することはロバストなモデル一般化に不可欠であるが、しばしばデータ内のスプリアス相関のアノテーションを必要とする。
論文 参考訳(メタデータ) (2024-06-15T21:41:25Z) - Learning Robust Classifiers with Self-Guided Spurious Correlation Mitigation [26.544938760265136]
ディープニューラル分類器は、入力のスプリアス属性とターゲットの間のスプリアス相関に頼り、予測を行う。
本稿では,自己誘導型スプリアス相関緩和フレームワークを提案する。
予測行動の違いを識別するために分類器の訓練を行うことで,事前知識を必要とせず,素因関係への依存を軽減できることを示す。
論文 参考訳(メタデータ) (2024-05-06T17:12:21Z) - Unsupervised Concept Discovery Mitigates Spurious Correlations [45.48778210340187]
トレーニングデータにおける急激な相関関係のモデルはしばしば脆い予測を発生させ、意図しないバイアスを導入する。
本稿では,教師なし対象中心学習と突発的相関の緩和の新たな関連性を確立する。
コバルト(CoBalT)は、サブグループの人間のラベル付けを必要とせず、効果的に素早い相関を緩和する概念バランス技術である。
論文 参考訳(メタデータ) (2024-02-20T20:48:00Z) - Noisy Correspondence Learning with Self-Reinforcing Errors Mitigation [63.180725016463974]
クロスモーダル検索は、実際は精力的な、十分に整合した大規模データセットに依存している。
我々は、新しい雑音対応学習フレームワーク、textbfSelf-textbfReinforcing textbfErrors textbfMitigation(SREM)を導入する。
論文 参考訳(メタデータ) (2023-12-27T09:03:43Z) - Identifying Spurious Correlations using Counterfactual Alignment [5.782952470371709]
急激な相関によって駆動されるモデルは、しばしば一般化性能が劣る。
本稿では,突発的相関を検出・定量化するためのCFアライメント手法を提案する。
論文 参考訳(メタデータ) (2023-12-01T20:16:02Z) - Making Retrieval-Augmented Language Models Robust to Irrelevant Context [55.564789967211844]
ALMの重要なデシプラタムは、検索された情報が関連する場合のパフォーマンスをモデル化するのに役立つことである。
近年の研究では、検索の増大がパフォーマンスに悪影響を及ぼすことが示されている。
論文 参考訳(メタデータ) (2023-10-02T18:52:35Z) - Language Model Classifier Aligns Better with Physician Word Sensitivity
than XGBoost on Readmission Prediction [86.15787587540132]
語彙レベルでモデルの振る舞いを精査する尺度である感度スコアを導入する。
本実験は,感度スコアのランク相関に基づいて,臨床医と分類医の意思決定論理を比較した。
論文 参考訳(メタデータ) (2022-11-13T23:59:11Z) - Benign Overfitting in Adversarially Robust Linear Classification [91.42259226639837]
分類器がノイズの多いトレーニングデータを記憶しながらも、優れた一般化性能を達成している「双曲オーバーフィッティング」は、機械学習コミュニティにおいて大きな注目を集めている。
本研究は, 対人訓練において, 対人訓練において, 良心過剰が実際に発生することを示し, 対人訓練に対する防御の原則的アプローチを示す。
論文 参考訳(メタデータ) (2021-12-31T00:27:31Z) - Counterfactual Invariance to Spurious Correlations: Why and How to Pass
Stress Tests [87.60900567941428]
素早い相関」とは、アナリストが重要とすべきでないと考える入力データのある側面に対するモデルの依存である。
機械学習では、これらにはノウ・イ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ」という特徴がある。
因果推論ツールを用いたストレステストについて検討した。
論文 参考訳(メタデータ) (2021-05-31T14:39:38Z) - Identifying Spurious Correlations for Robust Text Classification [9.457737910527829]
そこで本研究では,テキスト分類におけるスプリアスと真の相関を区別する手法を提案する。
我々は、治療効果推定器から得られる特徴を用いて、突発的な相関を「遺伝子」と区別する。
4つのデータセットの実験は、このアプローチを使って特徴の選択を知らせることが、より堅牢な分類につながることを示唆している。
論文 参考訳(メタデータ) (2020-10-06T03:49:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。