論文の概要: Improving Commonsense Bias Classification by Mitigating the Influence of Demographic Terms
- arxiv url: http://arxiv.org/abs/2406.07229v1
- Date: Tue, 11 Jun 2024 13:09:16 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-12 16:03:55.286369
- Title: Improving Commonsense Bias Classification by Mitigating the Influence of Demographic Terms
- Title(参考訳): 図形用語の影響の緩和による常識バイアス分類の改善
- Authors: JinKyu Lee, Jihie Kim,
- Abstract要約: コモンセンス知識における人口統計学用語の存在は、NLPモデルの性能を妥協する潜在的リスクを生じさせる。
人口統計学用語の影響を緩和する3つの方法が提案されている。
実験の結果、第1の手法はベースライン上の精度を2.33%向上し、第2の手法は標準拡張法よりも0.96%向上した。
- 参考スコア(独自算出の注目度): 3.3689796789720696
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Understanding commonsense knowledge is crucial in the field of Natural Language Processing (NLP). However, the presence of demographic terms in commonsense knowledge poses a potential risk of compromising the performance of NLP models. This study aims to investigate and propose methods for enhancing the performance and effectiveness of a commonsense polarization classifier by mitigating the influence of demographic terms. Three methods are introduced in this paper: (1) hierarchical generalization of demographic terms (2) threshold-based augmentation and (3) integration of hierarchical generalization and threshold-based augmentation methods (IHTA). The first method involves replacing demographic terms with more general ones based on a term hierarchy ontology, aiming to mitigate the influence of specific terms. To address the limited bias-related information, the second method measures the polarization of demographic terms by comparing the changes in the model's predictions when these terms are masked versus unmasked. This method augments commonsense sentences containing terms with high polarization values by replacing their predicates with synonyms generated by ChatGPT. The third method combines the two approaches, starting with threshold-based augmentation followed by hierarchical generalization. The experiments show that the first method increases the accuracy over the baseline by 2.33%, and the second one by 0.96% over standard augmentation methods. The IHTA techniques yielded an 8.82% and 9.96% higher accuracy than threshold-based and standard augmentation methods, respectively.
- Abstract(参考訳): 自然言語処理(NLP)の分野では,コモンセンス知識の理解が不可欠である。
しかし、コモンセンス知識における人口統計学用語の存在は、NLPモデルの性能を損なう可能性がある。
本研究は,人口統計学用語の影響を緩和し,コモンセンス分極分類器の性能と有効性を高める手法について検討し,提案することを目的とする。
本稿では,(1)階層的な階層化,(2)しきい値に基づく拡張,(3)階層的な一般化としきい値に基づく拡張(IHTA)という3つの手法を紹介する。
最初の方法は、特定の用語の影響を緩和することを目的とした、用語階層オントロジーに基づく、より一般的な用語に置き換えることである。
限られたバイアス関連情報に対処するため、第2の手法は、これらの条件がマスクされている場合とマスクされていない場合のモデルの予測の変化を比較することにより、人口統計学用語の偏極を測定する。
この方法は、述語をChatGPTで生成された同義語に置き換えることで、高い分極値の項を含むコモンセンス文を強化する。
第3の方法は、しきい値に基づく拡張から始まり、階層的な一般化へと続く2つのアプローチを組み合わせる。
実験の結果、第1の手法はベースライン上の精度を2.33%向上し、第2の手法は標準拡張法よりも0.96%向上した。
IHTAの手法は、しきい値ベースと標準拡張法よりも精度が8.82%、9.96%高かった。
関連論文リスト
- Score Normalization for Demographic Fairness in Face Recognition [16.421833444307232]
有名なサンプル中心スコア正規化技術であるZ-normとT-normは、高セキュリティ動作点の公平性を向上しない。
標準Z/Tノルムを拡張し、正規化における人口統計情報を統合する。
本手法は,5つの最先端の顔認識ネットワークの全体的な公正性を改善する。
論文 参考訳(メタデータ) (2024-07-19T07:51:51Z) - Improving Disease Detection from Social Media Text via Self-Augmentation and Contrastive Learning [5.7329872368416535]
本稿では,この課題に対処するために,コントラスト学習(CL)と言語モデリングを統合した新しい手法を提案する。
提案手法では,モデルに隠された表現を自己表現で拡張する自己拡張手法を提案する。
我々は2進・複数ラベル・複数クラス分類タスクを含む3つのNLPデータセットについて評価を行った。
論文 参考訳(メタデータ) (2024-04-30T15:24:54Z) - Collaborative Heterogeneous Causal Inference Beyond Meta-analysis [68.4474531911361]
異種データを用いた因果推論のための協調的逆確率スコア推定器を提案する。
異質性の増加に伴うメタアナリシスに基づく手法に対して,本手法は有意な改善を示した。
論文 参考訳(メタデータ) (2024-04-24T09:04:36Z) - A Modified Word Saliency-Based Adversarial Attack on Text Classification Models [0.0]
本稿では,テキスト分類モデルを対象とした新たな逆攻撃手法を提案する。
The Modified Word Saliency-based Adversarial At-tack (MWSAA)は、セマンティックコヒーレンスを維持しながら分類モデルを誤解させる。
多様なテキスト分類データセットを用いて実証評価を行い,提案手法の有効性を実証した。
論文 参考訳(メタデータ) (2024-03-17T18:39:14Z) - Leveraging Prototypical Representations for Mitigating Social Bias without Demographic Information [50.29934517930506]
DAFairは、言語モデルにおける社会的バイアスに対処する新しいアプローチである。
偏見を緩和するために、原型的人口統計テキストを活用し、微調整プロセス中に正規化用語を取り入れる。
論文 参考訳(メタデータ) (2024-03-14T15:58:36Z) - Robust Stance Detection: Understanding Public Perceptions in Social Media [15.460495567765362]
スタンス検出は、明確に定義されたトピックに対する正確な位置を特定する。
従来のスタンス検出モデルは、新しいドメインやトピックに適用すると、パフォーマンスが低下することが多い。
本稿では,反実データ拡張と対照的な学習を組み合わせることで,姿勢検出の堅牢性を高める方法を提案する。
論文 参考訳(メタデータ) (2023-09-26T18:19:51Z) - Benchmarking common uncertainty estimation methods with
histopathological images under domain shift and label noise [62.997667081978825]
リスクの高い環境では、深層学習モデルは不確実性を判断し、誤分類の可能性がかなり高い場合に入力を拒否しなければなりません。
我々は,全スライド画像の分類において,最もよく使われている不確実性と頑健さの厳密な評価を行う。
我々は一般的に,手法のアンサンブルが,ドメインシフトやラベルノイズに対するロバスト性の向上とともに,より良い不確実性評価につながることを観察する。
論文 参考訳(メタデータ) (2023-01-03T11:34:36Z) - Interpolation-based Contrastive Learning for Few-Label Semi-Supervised
Learning [43.51182049644767]
半教師付き学習(SSL)は,ラベルが限定された強力なモデルを構築する上で,有効な手法であることが長年証明されてきた。
摂動サンプルを元のものと類似した予測を強制する正規化に基づく手法が注目されている。
本稿では,学習ネットワークの埋め込みを誘導し,サンプル間の線形変化を誘導する新たな対照的な損失を提案する。
論文 参考訳(メタデータ) (2022-02-24T06:00:05Z) - Local Learning Matters: Rethinking Data Heterogeneity in Federated
Learning [61.488646649045215]
フェデレートラーニング(FL)は、クライアントのネットワーク(エッジデバイス)でプライバシ保護、分散ラーニングを行うための有望な戦略である。
論文 参考訳(メタデータ) (2021-11-28T19:03:39Z) - Multivariate feature ranking of gene expression data [62.997667081978825]
ペアワイズ相関とペアワイズ整合性に基づく2つの新しい多変量特徴ランキング手法を提案する。
提案手法は, クラスタリング変動, チ・スクエアド, 相関, 情報ゲイン, ReliefF および Significance の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-11-03T17:19:53Z) - Learning Expectation of Label Distribution for Facial Age and
Attractiveness Estimation [65.5880700862751]
本稿では,2つの最先端手法(Ranking-CNNとDLDL)の本質的な関係を解析し,ランキング法が実際にラベル分布を暗黙的に学習していることを示す。
軽量なネットワークアーキテクチャを提案し、顔属性の分布と回帰属性の値を共同で学習できる統一的なフレームワークを提案する。
提案手法は,36$times$パラメータが小さく,3$times$が顔の年齢/魅力度推定における高速な推論速度を持つ単一モデルを用いて,新しい最先端結果を実現する。
論文 参考訳(メタデータ) (2020-07-03T15:46:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。