論文の概要: Reinforcement Guided Multi-Task Learning Framework for Low-Resource
Stereotype Detection
- arxiv url: http://arxiv.org/abs/2203.14349v1
- Date: Sun, 27 Mar 2022 17:16:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-29 12:17:14.775093
- Title: Reinforcement Guided Multi-Task Learning Framework for Low-Resource
Stereotype Detection
- Title(参考訳): 低リソースステレオタイプ検出のための強化型マルチタスク学習フレームワーク
- Authors: Rajkumar Pujari, Erik Oveson, Priyanka Kulkarni, Elnaz Nouri
- Abstract要約: ステレオタイプ検出」データセットは主に、大規模な事前学習言語モデルに対する診断アプローチを採用している。
信頼できるデータセットに注釈をつけるには、テキストでステレオタイプがどのように現れるかという微妙なニュアンスを正確に理解する必要がある。
我々は「ステレオタイプ検出」における経験的性能を改善するために、データ豊富な隣接タスクの多元性を活用するマルチタスクモデルを提案する。
- 参考スコア(独自算出の注目度): 3.7223111129285096
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As large Pre-trained Language Models (PLMs) trained on large amounts of data
in an unsupervised manner become more ubiquitous, identifying various types of
bias in the text has come into sharp focus. Existing "Stereotype Detection"
datasets mainly adopt a diagnostic approach toward large PLMs. Blodgett et. al
(2021a) show that there are significant reliability issues with the existing
benchmark datasets. Annotating a reliable dataset requires a precise
understanding of the subtle nuances of how stereotypes manifest in text. In
this paper, we annotate a focused evaluation set for "Stereotype Detection"
that addresses those pitfalls by de-constructing various ways in which
stereotypes manifest in text. Further, we present a multi-task model that
leverages the abundance of data-rich neighboring tasks such as hate speech
detection, offensive language detection, misogyny detection, etc., to improve
the empirical performance on "Stereotype Detection". We then propose a
reinforcement-learning agent that guides the multi-task learning model by
learning to identify the training examples from the neighboring tasks that help
the target task the most. We show that the proposed models achieve significant
empirical gains over existing baselines on all the tasks.
- Abstract(参考訳): 大量のデータを教師なしでトレーニングした大規模事前学習言語モデル(plm)がよりユビキタスになるにつれて、テキスト中のさまざまな種類のバイアスの識別が注目されるようになった。
既存の「ステレオタイプ検出」データセットは主に大規模PLMに対する診断手法を採用している。
Blodgettなど。
al (2021a) は、既存のベンチマークデータセットには大きな信頼性の問題があることを示している。
信頼できるデータセットに注釈を付けるには、テキストでステレオタイプがどのように現れるかの微妙なニュアンスを正確に理解する必要がある。
本稿では,テキストにステレオタイプが現れる様々な方法をデコンストラクションすることで,これらの落とし穴に対処する「ステレオタイプ検出」に焦点をあてた評価セットを提案する。
さらに,ヘイトスピーチ検出,攻撃的言語検出,ミソジニー検出など,データ豊富な隣接タスクを多用し,ステレオタイプ検出における経験的性能を向上させるマルチタスクモデルを提案する。
そこで本研究では,マルチタスク学習モデルを指導する強化学習エージェントを提案する。
提案したモデルが,既存のタスクのベースラインよりも有意に向上したことを示す。
関連論文リスト
- Unsupervised Model Diagnosis [49.36194740479798]
本稿では,ユーザガイドを使わずに,意味論的対実的説明を生成するために,Unsupervised Model Diagnosis (UMO)を提案する。
提案手法は意味論における変化を特定し可視化し,その変化を広範囲なテキストソースの属性と照合する。
論文 参考訳(メタデータ) (2024-10-08T17:59:03Z) - Training-Free Deepfake Voice Recognition by Leveraging Large-Scale Pre-Trained Models [52.04189118767758]
一般化は、現在のオーディオディープフェイク検出器の主な問題である。
本稿では,オーディオディープフェイク検出のための大規模事前学習モデルの可能性について検討する。
論文 参考訳(メタデータ) (2024-05-03T15:27:11Z) - Unified Demonstration Retriever for In-Context Learning [56.06473069923567]
Unified Demonstration Retriever (textbfUDR)は、幅広いタスクのデモを検索する単一のモデルである。
我々は,高品質な候補を見つけるための反復的なマイニング戦略を備えたマルチタスクリストワイド・トレーニング・フレームワークを提案する。
13のタスクファミリーと複数のデータドメインにわたる30以上のタスクの実験は、UDRがベースラインを大幅に上回っていることを示している。
論文 参考訳(メタデータ) (2023-05-07T16:07:11Z) - OmDet: Large-scale vision-language multi-dataset pre-training with
multimodal detection network [17.980765138522322]
この研究は、新しい言語対応のオブジェクト検出アーキテクチャであるOmDetを紹介した。
自然言語を普遍的な知識表現として活用することで、OmDetは多様なデータセットから"視覚語彙"を蓄積する。
我々は,OmDetが野生におけるオブジェクト検出,オープンボキャブラリ検出,句接地において,強いベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2022-09-10T14:25:14Z) - Adversarial GLUE: A Multi-Task Benchmark for Robustness Evaluation of
Language Models [86.02610674750345]
AdvGLUE(Adversarial GLUE)は、様々な種類の敵攻撃の下で、現代の大規模言語モデルの脆弱性を調査し評価するための新しいマルチタスクベンチマークである。
GLUEタスクに14の逆攻撃手法を適用してAdvGLUEを構築する。
テストしたすべての言語モデルとロバストなトレーニングメソッドは、AdvGLUEではパフォーマンスが悪く、スコアは明確な精度よりもはるかに遅れています。
論文 参考訳(メタデータ) (2021-11-04T12:59:55Z) - Learning What Makes a Difference from Counterfactual Examples and
Gradient Supervision [57.14468881854616]
ニューラルネットワークの一般化能力を改善するための補助的学習目標を提案する。
我々は、異なるラベルを持つ最小差の例のペア、すなわち反ファクトまたはコントラストの例を使用し、タスクの根底にある因果構造を示す信号を与える。
このテクニックで訓練されたモデルは、配布外テストセットのパフォーマンスを向上させる。
論文 参考訳(メタデータ) (2020-04-20T02:47:49Z) - Stance Detection Benchmark: How Robust Is Your Stance Detection? [65.91772010586605]
Stance Detection (StD) は、あるトピックやクレームに対する著者の姿勢を検出することを目的としている。
マルチデータセット学習環境において、さまざまなドメインの10のStDデータセットから学習するStDベンチマークを導入する。
このベンチマーク設定では、5つのデータセットに新しい最先端結果を表示することができます。
論文 参考訳(メタデータ) (2020-01-06T13:37:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。