論文の概要: GeNRe: A French Gender-Neutral Rewriting System Using Collective Nouns
- arxiv url: http://arxiv.org/abs/2505.23630v1
- Date: Thu, 29 May 2025 16:36:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-30 18:14:07.996431
- Title: GeNRe: A French Gender-Neutral Rewriting System Using Collective Nouns
- Title(参考訳): GeNRe: 集合名詞を用いたフランスのジェンダーニュートラル書き換えシステム
- Authors: Enzo Doyen, Amalia Todirascu,
- Abstract要約: 本稿では,フランス初のジェンダーニュートラル表記システムであるGeNReについて述べる。
我々は、RBSが生成したデータに基づいて訓練された2つの微調整言語モデルとともに、フランス語に適したルールベースシステム(RBS)を導入する。
また,他のシステムの性能向上のためのインストラクションベースモデルの利用についても検討し,Claude 3 Opusと我々の辞書を組み合わせることでRBSに近い結果が得られることを確認した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: A significant portion of the textual data used in the field of Natural Language Processing (NLP) exhibits gender biases, particularly due to the use of masculine generics (masculine words that are supposed to refer to mixed groups of men and women), which can perpetuate and amplify stereotypes. Gender rewriting, an NLP task that involves automatically detecting and replacing gendered forms with neutral or opposite forms (e.g., from masculine to feminine), can be employed to mitigate these biases. While such systems have been developed in a number of languages (English, Arabic, Portuguese, German, French), automatic use of gender neutralization techniques (as opposed to inclusive or gender-switching techniques) has only been studied for English. This paper presents GeNRe, the very first French gender-neutral rewriting system using collective nouns, which are gender-fixed in French. We introduce a rule-based system (RBS) tailored for the French language alongside two fine-tuned language models trained on data generated by our RBS. We also explore the use of instruct-based models to enhance the performance of our other systems and find that Claude 3 Opus combined with our dictionary achieves results close to our RBS. Through this contribution, we hope to promote the advancement of gender bias mitigation techniques in NLP for French.
- Abstract(参考訳): 自然言語処理(NLP)の分野で使用されるテキストデータの大部分は、特に男性ジェネリック(男性と女性の混成グループを指すと考えられる男性用語)がステレオタイプを永続し増幅することができるため、性別バイアスを示す。
ジェンダーリライティング(ジェンダーリライティング、ジェンダーリライティング、ジェンダーリライティング、ジェンダーリライティング、ジェンダーリライティング、ジェンダーリライティング、ジェンダーリライティング、ジェンダーリライティング、ジェンダーリライティング、ジェンダーリライティング、ジェンダーリライティング、ジェンダーリライティング、ジェンダーリライティング、ジェンダーリライティング、ジェンダーリライティング、ジェンダーリライティング)は、これらのバイアスを軽減するために用いられる。
このようなシステムは、多くの言語(英語、アラビア語、ポルトガル語、ドイツ語、フランス語)で開発されているが、性中立化技術(包括的または性転換技術とは対照的に)の自動使用は英語でのみ研究されている。
本稿では,フランス初のジェンダーニュートラル表記システムであるGeNReについて述べる。
我々は、RBSが生成したデータに基づいて訓練された2つの微調整言語モデルとともに、フランス語に適したルールベースシステム(RBS)を導入する。
また,他のシステムの性能向上のためのインストラクトベースモデルの利用についても検討し,Claude 3 Opusと辞書を組み合わせることで,RBSに近い結果が得られることを確認した。
この貢献を通じて、フランスにおけるNLPにおけるジェンダーバイアス緩和技術の進歩を推進したい。
関連論文リスト
- Beyond Binary Gender: Evaluating Gender-Inclusive Machine Translation with Ambiguous Attitude Words [85.48043537327258]
既存の機械翻訳の性別バイアス評価は主に男性と女性の性別に焦点を当てている。
本研究では,AmbGIMT (Gender-Inclusive Machine Translation with Ambiguous attitude words) のベンチマークを示す。
本研究では,感情的態度スコア(EAS)に基づく性別バイアス評価手法を提案する。
論文 参考訳(メタデータ) (2024-07-23T08:13:51Z) - Leveraging Large Language Models to Measure Gender Representation Bias in Gendered Language Corpora [9.959039325564744]
テキストコーパスにおけるジェンダーバイアスは、社会的不平等の永続性と増幅につながる可能性がある。
テキストコーパスにおけるジェンダー表現バイアスを計測する既存の手法は、主に英語で提案されている。
本稿では,スペインのコーパスにおけるジェンダー表現バイアスを定量的に測定する手法を提案する。
論文 参考訳(メタデータ) (2024-06-19T16:30:58Z) - Building Bridges: A Dataset for Evaluating Gender-Fair Machine Translation into German [17.924716793621627]
英独機械翻訳(MT)におけるジェンダーフェア言語の研究
2つの商用システムと6つのニューラルMTモデルを含む最初のベンチマーク研究を行う。
以上の結果から,ほとんどのシステムでは男性型が主流であり,性別ニュートラル変種は稀である。
論文 参考訳(メタデータ) (2024-06-10T09:39:19Z) - VisoGender: A dataset for benchmarking gender bias in image-text pronoun
resolution [80.57383975987676]
VisoGenderは、視覚言語モデルで性別バイアスをベンチマークするための新しいデータセットである。
We focus to occupation-related biases in a hegemonic system of binary gender, inspired by Winograd and Winogender schemas。
我々は、最先端の視覚言語モデルをいくつかベンチマークし、それらが複雑な場面における二項性解消のバイアスを示すことを発見した。
論文 参考訳(メタデータ) (2023-06-21T17:59:51Z) - "I'm fully who I am": Towards Centering Transgender and Non-Binary
Voices to Measure Biases in Open Language Generation [69.25368160338043]
トランスジェンダーとノンバイナリ(TGNB)の個人は、日常生活から差別や排除を不当に経験している。
オープン・ランゲージ・ジェネレーションにおいて,経験豊富なTGNB人物の疎外化を取り巻く社会的現実がいかに貢献し,持続するかを評価する。
我々はTGNB指向のコミュニティからキュレートされたテンプレートベースの実世界のテキストのデータセットであるTANGOを紹介する。
論文 参考訳(メタデータ) (2023-05-17T04:21:45Z) - Generating Gender Augmented Data for NLP [3.5557219875516655]
ジェンダーバイアスは、NLPベースのアプリケーション、特に性差のある言語で頻繁に発生する。
本稿では,会話文の自動書き直し手法を提案する。
提案するアプローチは、あるジェンダーから別のジェンダーへの"翻訳"を訓練されたニューラルマシン翻訳(NMT)システムに基づいている。
論文 参考訳(メタデータ) (2021-07-13T11:13:21Z) - They, Them, Theirs: Rewriting with Gender-Neutral English [56.14842450974887]
私たちは、英語でジェンダーインクルージョンを促進する一般的な方法である特異点についてケーススタディを行います。
本研究では, 人為的データを持たない1%の単語誤り率で, ジェンダーニュートラルな英語を学習できるモデルについて述べる。
論文 参考訳(メタデータ) (2021-02-12T21:47:48Z) - Neural Machine Translation Doesn't Translate Gender Coreference Right
Unless You Make It [18.148675498274866]
ニューラル・マシン・トランスフォーメーションに明示的な単語レベルのジェンダー・インフレクション・タグを組み込む手法を提案する。
既存の単純なアプローチは、文中の複数のエンティティにジェンダー・フィーチャーを過度に一般化することができる。
また,英語のジェンダーニュートラルな実体の翻訳を,それに対応する言語規則で評価する拡張も提案する。
論文 参考訳(メタデータ) (2020-10-11T20:05:42Z) - Multi-Dimensional Gender Bias Classification [67.65551687580552]
機械学習モデルは、性別に偏ったテキストでトレーニングする際に、社会的に望ましくないパターンを不注意に学習することができる。
本稿では,テキスト中の性バイアスを複数の実用的・意味的な次元に沿って分解する一般的な枠組みを提案する。
このきめ細かいフレームワークを用いて、8つの大規模データセットにジェンダー情報を自動的にアノテートする。
論文 参考訳(メタデータ) (2020-05-01T21:23:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。