論文の概要: From Inclusive Language to Gender-Neutral Machine Translation
- arxiv url: http://arxiv.org/abs/2301.10075v1
- Date: Tue, 24 Jan 2023 15:26:36 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-25 13:16:02.026126
- Title: From Inclusive Language to Gender-Neutral Machine Translation
- Title(参考訳): インクルーシブ言語からジェンダー中立機械翻訳へ
- Authors: Andrea Piergentili, Dennis Fucci, Beatrice Savoldi, Luisa Bentivogli,
Matteo Negri
- Abstract要約: 本稿では,ジェンダー・ニュートラル翻訳(GNT)をジェンダー・ニュートラル翻訳の一形態として論じる。
機械翻訳におけるGNTの実装における主な技術的課題を特定する。
- 参考スコア(独自算出の注目度): 11.37307883423629
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Gender inclusivity in language has become a central topic of debate and
research. Its application in the cross-lingual contexts of human and machine
translation (MT), however, remains largely unexplored. Here, we discuss
Gender-Neutral Translation (GNT) as a form of gender inclusivity in translation
and advocate for its adoption for MT models, which have been found to
perpetuate gender bias and discrimination. To this aim, we review a selection
of relevant institutional guidelines for Gender-Inclusive Language (GIL) to
collect and systematize useful strategies of gender neutralization. Then, we
discuss GNT and its scenarios of use, devising a list of desiderata. Finally,
we identify the main technical challenges to the implementation of GNT in MT.
Throughout these contributions we focus on translation from English into
Italian, as representative of salient linguistic transfer problems, due to the
different rules for gender marking in their grammar.
- Abstract(参考訳): 言語におけるジェンダーの排他性は、議論と研究の中心的話題となっている。
しかし、人間と機械翻訳(mt)の言語横断的文脈におけるその応用は、ほとんど解明されていない。
本稿では、ジェンダー中立翻訳(gnt)を、翻訳におけるジェンダー排他性の形式として議論し、性別バイアスや差別を持続するmtモデルの採用を提唱する。
本稿では,ジェンダー中立化のための有用な戦略を収集・体系化するための施設ガイドライン(gil)の選定について検討する。
次に、GNTとその利用シナリオについて論じ、デシラタのリストを考案する。
最後に, MTにおけるGNT導入における主な技術的課題を明らかにする。これらの貢献を通じて, 文法におけるジェンダーマーキングの異なる規則のため, 日本語からイタリア語への翻訳に焦点をあてる。
関連論文リスト
- CORGI-PM: A Chinese Corpus For Gender Bias Probing and Mitigation [28.38578407487603]
高品質なラベル付き32.9k文を含む中国語cOrpus foR Gender bIas Probing and Mitigation CORGI-PMを提案する。
我々は,テキスト性バイアスを自動的に検出し,分類し,緩和するモデルを必要とする,テキスト性バイアスを緩和する3つの課題に対処する。
CORGI-PMは、性偏見と緩和のための最初の文レベルの中国語コーパスである。
論文 参考訳(メタデータ) (2023-01-01T12:48:12Z) - CLSE: Corpus of Linguistically Significant Entities [73.02611823896432]
専門家が注釈を付けた言語学的に重要なエンティティ(CLSE)のコーパスをリリースする。
CLSEは74種類のセマンティックタイプをカバーし、航空券売機からビデオゲームまで様々なアプリケーションをサポートする。
言語的に代表されるNLG評価ベンチマークを,フランス語,マラティー語,ロシア語の3言語で作成する。
論文 参考訳(メタデータ) (2022-11-04T12:56:12Z) - Analyzing Gender Representation in Multilingual Models [59.21915055702203]
実践的なケーススタディとして,ジェンダーの区別の表現に焦点をあてる。
ジェンダーの概念が、異なる言語で共有された部分空間にエンコードされる範囲について検討する。
論文 参考訳(メタデータ) (2022-04-20T00:13:01Z) - Gender Bias in Text: Labeled Datasets and Lexicons [0.30458514384586394]
性別バイアスの自動検出には、性別バイアスデータセットと語彙の欠如がある。
関連文の収集,注釈付け,拡張によりラベル付きデータセットと網羅的辞書を提供する。
リリースされたデータセットとレキシコンは、Generic He、Generic She、Explicit Marking of Sex、Gendered Neologismsなど、複数のバイアスサブタイプにまたがっている。
論文 参考訳(メタデータ) (2022-01-21T12:44:51Z) - GENder-IT: An Annotated English-Italian Parallel Challenge Set for
Cross-Linguistic Natural Gender Phenomena [2.4366811507669124]
gENder-ITは、自然のジェンダー現象の解決に焦点を当てた、英語とイタリア語の課題セットである。
英語のソース側には単語レベルのジェンダータグ、イタリア語のターゲット側には翻訳が必要な複数のジェンダータグを提供する。
論文 参考訳(メタデータ) (2021-08-05T21:08:45Z) - They, Them, Theirs: Rewriting with Gender-Neutral English [56.14842450974887]
私たちは、英語でジェンダーインクルージョンを促進する一般的な方法である特異点についてケーススタディを行います。
本研究では, 人為的データを持たない1%の単語誤り率で, ジェンダーニュートラルな英語を学習できるモデルについて述べる。
論文 参考訳(メタデータ) (2021-02-12T21:47:48Z) - Decoding and Diversity in Machine Translation [90.33636694717954]
NMTが楽しむBLEUスコアに対して支払う費用の多様性の違いを特徴付ける。
本研究は,ジェンダー代名詞を翻訳する際に,検索が既知バイアスの正解源となることを示唆する。
論文 参考訳(メタデータ) (2020-11-26T21:09:38Z) - Neural Machine Translation Doesn't Translate Gender Coreference Right
Unless You Make It [18.148675498274866]
ニューラル・マシン・トランスフォーメーションに明示的な単語レベルのジェンダー・インフレクション・タグを組み込む手法を提案する。
既存の単純なアプローチは、文中の複数のエンティティにジェンダー・フィーチャーを過度に一般化することができる。
また,英語のジェンダーニュートラルな実体の翻訳を,それに対応する言語規則で評価する拡張も提案する。
論文 参考訳(メタデータ) (2020-10-11T20:05:42Z) - Type B Reflexivization as an Unambiguous Testbed for Multilingual
Multi-Task Gender Bias [5.239305978984572]
我々は,B型回帰型言語の場合,性別バイアスを検出するためにマルチタスクチャレンジデータセットを構築することができることを示した。
これらの言語では「医者がマスクを取り除いた」という直訳は中音読みと不一致読みのあいまいさではない。
4つの言語と4つのNLPタスクにまたがる多言語・マルチタスク課題データセットを提案する。
論文 参考訳(メタデータ) (2020-09-24T23:47:18Z) - Gender Bias in Multilingual Embeddings and Cross-Lingual Transfer [101.58431011820755]
多言語埋め込みにおけるジェンダーバイアスとNLPアプリケーションの伝達学習への影響について検討する。
我々は、バイアス分析のための多言語データセットを作成し、多言語表現におけるバイアスの定量化方法をいくつか提案する。
論文 参考訳(メタデータ) (2020-05-02T04:34:37Z) - Multi-Dimensional Gender Bias Classification [67.65551687580552]
機械学習モデルは、性別に偏ったテキストでトレーニングする際に、社会的に望ましくないパターンを不注意に学習することができる。
本稿では,テキスト中の性バイアスを複数の実用的・意味的な次元に沿って分解する一般的な枠組みを提案する。
このきめ細かいフレームワークを用いて、8つの大規模データセットにジェンダー情報を自動的にアノテートする。
論文 参考訳(メタデータ) (2020-05-01T21:23:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。