論文の概要: Does Robustness Improve Fairness? Approaching Fairness with Word
Substitution Robustness Methods for Text Classification
- arxiv url: http://arxiv.org/abs/2106.10826v1
- Date: Mon, 21 Jun 2021 03:20:44 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-22 15:26:04.845450
- Title: Does Robustness Improve Fairness? Approaching Fairness with Word
Substitution Robustness Methods for Text Classification
- Title(参考訳): ロバストネスは公正性を改善するか?
単語置換ロバスト性を用いたテキスト分類の公平性へのアプローチ
- Authors: Yada Pruksachatkun and Satyapriya Krishna and Jwala Dhamala and Rahul
Gupta and Kai-Wei Chang
- Abstract要約: テキスト分類作業におけるオッズと機会の平等性を改善するための単語置換ロバストネス法の有用性について検討する。
評価されたロバストネス法は公正性を向上し、トレーニングにおいてロバストネス法とバイアス緩和法の両方を用いることで、両方の面で改善が期待できる。
- 参考スコア(独自算出の注目度): 46.12560627897086
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing bias mitigation methods to reduce disparities in model outcomes
across cohorts have focused on data augmentation, debiasing model embeddings,
or adding fairness-based optimization objectives during training. Separately,
certified word substitution robustness methods have been developed to decrease
the impact of spurious features and synonym substitutions on model predictions.
While their end goals are different, they both aim to encourage models to make
the same prediction for certain changes in the input. In this paper, we
investigate the utility of certified word substitution robustness methods to
improve equality of odds and equality of opportunity on multiple text
classification tasks. We observe that certified robustness methods improve
fairness, and using both robustness and bias mitigation methods in training
results in an improvement in both fronts
- Abstract(参考訳): コホート全体のモデル結果の格差を減らす既存のバイアス緩和手法は、データの強化、モデルの埋め込みの偏り解消、トレーニング中の公平性に基づく最適化目標の追加に重点を置いている。
単語置換ロバストネス法は,素早い特徴や同義語置換がモデル予測に与える影響を低減するために開発されている。
最終目標は異なるが、どちらも入力の特定の変更に対して同じ予測を行うようモデルに促すことを目指している。
本稿では,複数のテキスト分類タスクにおけるオッズと機会の平等性を改善するための単語置換ロバストネス手法の有用性について検討する。
我々は,認定ロバストネス法が公平性を改善し,ロバストネスとバイアス緩和法の両方をトレーニング結果に用いた場合,双方が改善するのを確認した。
関連論文リスト
- Analyzing Persuasive Strategies in Meme Texts: A Fusion of Language Models with Paraphrase Enrichment [0.23020018305241333]
本稿では,ミームテキストにおける説得手法の階層的マルチラベル検出へのアプローチについて述べる。
本研究の範囲は、革新的なトレーニング技術とデータ強化戦略を通じて、モデルパフォーマンスの向上を含む。
論文 参考訳(メタデータ) (2024-07-01T20:25:20Z) - Saliency Attention and Semantic Similarity-Driven Adversarial Perturbation [0.0]
SASSP(Saliency Attention and Semantic similarity driven adversarial Perturbation)は、文脈的摂動の有効性を改善するために設計された。
提案手法は,単語選択と摂動のための3段階の戦略を取り入れたものである。
SASSPは高い攻撃成功率と低い単語摂動率を得た。
論文 参考訳(メタデータ) (2024-06-18T14:07:27Z) - Towards Fairness-Aware Adversarial Learning [13.932705960012846]
フェアネス・アウェア・アドバーサリアル・ラーニング(FAAL)という新しい学習パラダイムを提案する。
提案手法は,異なるカテゴリ間で最悪の分布を求めることを目的としており,高い確率で上界性能が得られることを保証している。
特にFAALは、不公平なロバストモデルを2つのエポックで公平に調整できるが、全体的なクリーンで堅牢なアキュラシーを損なうことはない。
論文 参考訳(メタデータ) (2024-02-27T18:01:59Z) - DAFA: Distance-Aware Fair Adversarial Training [34.94780532071229]
敵対的攻撃の下では、最悪のクラスからのサンプルに対するモデルの予測の大半は、最悪のクラスと同様のクラスに偏っている。
本稿では,クラス間の類似性を考慮し,頑健な公正性に対処するDAFA手法を提案する。
論文 参考訳(メタデータ) (2024-01-23T07:15:47Z) - Boosting Fair Classifier Generalization through Adaptive Priority Reweighing [59.801444556074394]
より優れた一般化性を持つ性能向上フェアアルゴリズムが必要である。
本稿では,トレーニングデータとテストデータ間の分散シフトがモデル一般化性に与える影響を解消する適応的リライジング手法を提案する。
論文 参考訳(メタデータ) (2023-09-15T13:04:55Z) - In and Out-of-Domain Text Adversarial Robustness via Label Smoothing [64.66809713499576]
多様なNLPタスクの基本モデルにおいて,ラベルの平滑化戦略によって提供される対角的ロバスト性について検討する。
実験の結果,ラベルのスムース化は,BERTなどの事前学習モデルにおいて,様々な攻撃に対して,逆方向の堅牢性を大幅に向上させることがわかった。
また,予測信頼度とロバスト性の関係を解析し,ラベルの平滑化が敵の例に対する過度な信頼誤差を減少させることを示した。
論文 参考訳(メタデータ) (2022-12-20T14:06:50Z) - Towards Equal Opportunity Fairness through Adversarial Learning [64.45845091719002]
逆行訓練は、自然言語処理におけるバイアス緩和の一般的なアプローチである。
本稿では、よりリッチな特徴を生み出すために、ターゲットクラスをインプットとして利用する、対位訓練のための拡張判別器を提案する。
論文 参考訳(メタデータ) (2022-03-12T02:22:58Z) - Revisiting Consistency Regularization for Semi-Supervised Learning [80.28461584135967]
そこで我々は,FeatDistLossというシンプルな手法により,一貫性の規則化を改良したフレームワークを提案する。
実験結果から,本モデルは様々なデータセットや設定のための新しい技術状態を定義する。
論文 参考訳(メタデータ) (2021-12-10T20:46:13Z) - Contrastive Learning for Fair Representations [50.95604482330149]
訓練された分類モデルは、意図せずバイアスのある表現や予測につながる可能性がある。
対戦訓練のような既存の分類モデルのデバイアス化手法は、訓練に高価であり、最適化が困難であることが多い。
比較学習を取り入れたバイアス軽減手法を提案し、同じクラスラベルを共有するインスタンスに類似した表現を推奨する。
論文 参考訳(メタデータ) (2021-09-22T10:47:51Z) - Differentially Private Adversarial Robustness Through Randomized
Perturbations [16.187650541902283]
ディープニューラルネットワークは、正しく分類された例に対する小さな摂動に確実に敏感であり、誤った予測につながる。
本稿では,ランダムな摂動による対向ロバスト性について検討する。
提案手法は,ガムベル雑音に基づく新しい密度ベース機構を用いる。
論文 参考訳(メタデータ) (2020-09-27T00:58:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。