論文の概要: NeuTral Rewriter: A Rule-Based and Neural Approach to Automatic
Rewriting into Gender-Neutral Alternatives
- arxiv url: http://arxiv.org/abs/2109.06105v1
- Date: Mon, 13 Sep 2021 16:26:12 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-14 19:19:01.083918
- Title: NeuTral Rewriter: A Rule-Based and Neural Approach to Automatic
Rewriting into Gender-Neutral Alternatives
- Title(参考訳): NeuTral Rewriter: ルールベースおよびニューラルアプローチによるジェンダーニュートラル代替物の自動書き換え
- Authors: Eva Vanmassenhove, Chris Emmery and Dimitar Shterionov
- Abstract要約: 本稿では、英語における性中立性書き換えに対するルールベースおよびニューラルアプローチを提案する。
詳細なマニュアルと自動評価では、ルールベースのアプローチによって生成されたデータに基づいてトレーニングされたNeuTral Rewriterが、0.18%未満のワードエラー率(WER)を取得する方法が強調されている。
- 参考スコア(独自算出の注目度): 2.3204178451683264
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Recent years have seen an increasing need for gender-neutral and inclusive
language. Within the field of NLP, there are various mono- and bilingual use
cases where gender inclusive language is appropriate, if not preferred due to
ambiguity or uncertainty in terms of the gender of referents. In this work, we
present a rule-based and a neural approach to gender-neutral rewriting for
English along with manually curated synthetic data (WinoBias+) and natural data
(OpenSubtitles and Reddit) benchmarks. A detailed manual and automatic
evaluation highlights how our NeuTral Rewriter, trained on data generated by
the rule-based approach, obtains word error rates (WER) below 0.18% on
synthetic, in-domain and out-domain test sets.
- Abstract(参考訳): 近年、性中立や包括的言語の必要性が高まっている。
nlpの分野には、参照者の性別の曖昧さや不確実性のために好ましくないが、性別を包含する言語が適切である様々な単言語とバイリンガルのユースケースがある。
本稿では,音声合成データ(winobias+)と自然データ(opensubtitlesおよびreddit)を手作業で収集し,英語の性中立的書き直しに対するルールベースおよびニューラルアプローチを提案する。
詳細なマニュアルと自動評価では、ルールベースのアプローチによって生成されたデータに基づいてトレーニングされたNeuTral Rewriterが、合成、ドメイン内、ドメイン外のテストセットで0.18%未満のワードエラー率(WER)を取得する方法が強調されている。
関連論文リスト
- Beyond Binary Gender: Evaluating Gender-Inclusive Machine Translation with Ambiguous Attitude Words [85.48043537327258]
既存の機械翻訳の性別バイアス評価は主に男性と女性の性別に焦点を当てている。
本研究では,AmbGIMT (Gender-Inclusive Machine Translation with Ambiguous attitude words) のベンチマークを示す。
本研究では,感情的態度スコア(EAS)に基づく性別バイアス評価手法を提案する。
論文 参考訳(メタデータ) (2024-07-23T08:13:51Z) - Hi Guys or Hi Folks? Benchmarking Gender-Neutral Machine Translation
with the GeNTE Corpus [15.388894407006852]
機械翻訳(MT)は、しばしば男性やステレオタイプ表現にデフォルトを与える。
本研究は、英語からイタリア語へのジェンダーニュートラル翻訳に重点を置くことで、包括的言語への需要が高まっていることに対処する。
論文 参考訳(メタデータ) (2023-10-08T21:44:00Z) - VisoGender: A dataset for benchmarking gender bias in image-text pronoun
resolution [80.57383975987676]
VisoGenderは、視覚言語モデルで性別バイアスをベンチマークするための新しいデータセットである。
We focus to occupation-related biases in a hegemonic system of binary gender, inspired by Winograd and Winogender schemas。
我々は、最先端の視覚言語モデルをいくつかベンチマークし、それらが複雑な場面における二項性解消のバイアスを示すことを発見した。
論文 参考訳(メタデータ) (2023-06-21T17:59:51Z) - "I'm fully who I am": Towards Centering Transgender and Non-Binary
Voices to Measure Biases in Open Language Generation [69.25368160338043]
トランスジェンダーとノンバイナリ(TGNB)の個人は、日常生活から差別や排除を不当に経験している。
オープン・ランゲージ・ジェネレーションにおいて,経験豊富なTGNB人物の疎外化を取り巻く社会的現実がいかに貢献し,持続するかを評価する。
我々はTGNB指向のコミュニティからキュレートされたテンプレートベースの実世界のテキストのデータセットであるTANGOを紹介する。
論文 参考訳(メタデータ) (2023-05-17T04:21:45Z) - Social Biases in Automatic Evaluation Metrics for NLG [53.76118154594404]
本稿では,単語埋め込みアソシエーションテスト(WEAT)と文埋め込みアソシエーションテスト(SEAT)に基づく評価手法を提案する。
我々は、画像キャプションやテキスト要約タスクにおける性別バイアスの影響を調査するために、性別対応メタ評価データセットを構築した。
論文 参考訳(メタデータ) (2022-10-17T08:55:26Z) - User-Centric Gender Rewriting [12.519348416773553]
我々は2人のユーザー(私とあなた)を巻き込んだ文脈におけるジェンダーリライトの課題を定義する。
ルールベースモデルとニューラルリライトモデルの両方の肯定的な側面を組み合わせたマルチステップシステムを開発した。
本研究は、アラビア語のジェンダー書き直しのためのコーパスにおいて、このアプローチの有効性を実証することに成功した。
論文 参考訳(メタデータ) (2022-05-04T17:46:17Z) - Generating Gender Augmented Data for NLP [3.5557219875516655]
ジェンダーバイアスは、NLPベースのアプリケーション、特に性差のある言語で頻繁に発生する。
本稿では,会話文の自動書き直し手法を提案する。
提案するアプローチは、あるジェンダーから別のジェンダーへの"翻訳"を訓練されたニューラルマシン翻訳(NMT)システムに基づいている。
論文 参考訳(メタデータ) (2021-07-13T11:13:21Z) - They, Them, Theirs: Rewriting with Gender-Neutral English [56.14842450974887]
私たちは、英語でジェンダーインクルージョンを促進する一般的な方法である特異点についてケーススタディを行います。
本研究では, 人為的データを持たない1%の単語誤り率で, ジェンダーニュートラルな英語を学習できるモデルについて述べる。
論文 参考訳(メタデータ) (2021-02-12T21:47:48Z) - Neural Machine Translation Doesn't Translate Gender Coreference Right
Unless You Make It [18.148675498274866]
ニューラル・マシン・トランスフォーメーションに明示的な単語レベルのジェンダー・インフレクション・タグを組み込む手法を提案する。
既存の単純なアプローチは、文中の複数のエンティティにジェンダー・フィーチャーを過度に一般化することができる。
また,英語のジェンダーニュートラルな実体の翻訳を,それに対応する言語規則で評価する拡張も提案する。
論文 参考訳(メタデータ) (2020-10-11T20:05:42Z) - Multi-Dimensional Gender Bias Classification [67.65551687580552]
機械学習モデルは、性別に偏ったテキストでトレーニングする際に、社会的に望ましくないパターンを不注意に学習することができる。
本稿では,テキスト中の性バイアスを複数の実用的・意味的な次元に沿って分解する一般的な枠組みを提案する。
このきめ細かいフレームワークを用いて、8つの大規模データセットにジェンダー情報を自動的にアノテートする。
論文 参考訳(メタデータ) (2020-05-01T21:23:20Z) - Reducing Gender Bias in Neural Machine Translation as a Domain
Adaptation Problem [21.44025591721678]
NLPタスクのトレーニングデータは、男性よりも女性に言及する文が少ないという性別バイアスを呈することが多い。
最近のWinoMTチャレンジセットでは、この効果を直接測定することができます。
私たちは、信頼できる性別バランスの例の小さなセットでトランスファーラーニングを使用します。
論文 参考訳(メタデータ) (2020-04-09T11:55:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。