Fugu-MT 論文翻訳(概要): Assumed Identities: Quantifying Gender Bias in Machine Translation of Ambiguous Occupational Terms

論文の概要: Assumed Identities: Quantifying Gender Bias in Machine Translation of Ambiguous Occupational Terms

arxiv url: http://arxiv.org/abs/2503.04372v1
Date: Thu, 06 Mar 2025 12:16:14 GMT
ステータス: 翻訳完了
システム内更新日: 2025-03-07 17:59:00.821872
Title: Assumed Identities: Quantifying Gender Bias in Machine Translation of Ambiguous Occupational Terms
Title（参考訳）: 仮定されたアイデンティティ:曖昧な職業用語の機械翻訳における性バイアスの定量化
Authors: Orfeas Menis Mastromichalakis, Giorgos Filandrianos, Maria Symeonaki, Giorgos Stamou,
Abstract要約: 本稿では,集約されたモデル応答による性別バイアスを評価する手法を提案する。具体的には、ソーステキストと翻訳の男女不均衡を検出する手法を提案する。
参考スコア（独自算出の注目度）: 2.5764960393034615
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Machine Translation (MT) systems frequently encounter ambiguous scenarios where they must assign gender to certain occupations when translating without explicit guidance or contextual cues. While individual translations in such cases may not be inherently biased, systematic patterns-such as the repeated association of certain professions with specific genders-can emerge, reflecting and perpetuating societal stereotypes. This ambiguity challenges traditional instance-level single-answer evaluation approaches, as no single gold standard translation exists. To address this, we propose an approach that evaluates gender bias through aggregated model responses. Specifically, we introduce a methodology to detect gender imbalances between source texts and translations, a benchmarking dataset with ambiguous English inputs, and probability-based metrics to quantify a model's divergence from normative standards or reference distributions.
Abstract（参考訳）: 機械翻訳(MT)システムはしばしば曖昧なシナリオに遭遇し、明示的なガイダンスや文脈的な手がかりなしに翻訳する際には、特定の職業に性別を割り当てなければならない。このような場合の個々の翻訳は本質的にバイアスを受けないかもしれないが、特定の職業と特定の性別の関連が繰り返されるような体系的なパターンは、社会的なステレオタイプを反映し、永続する可能性がある。この曖昧さは、単一のゴールド標準翻訳が存在しないため、従来のインスタンスレベルのシングルアンサー評価アプローチに挑戦する。そこで本研究では,モデル応答を集約して性別バイアスを評価する手法を提案する。具体的には、ソーステキストと翻訳の男女不均衡を検出する手法、あいまいな英語入力によるベンチマークデータセット、標準標準や基準分布からのモデルの偏りを定量化するための確率ベースメトリクスを提案する。

関連論文リスト

Uncertainty Quantification for Evaluating Machine Translation Bias [6.559560602099439]
機械翻訳(MT)では、原文が性別が過度にマークされていないレキセムを含む場合、その文脈や外部知識から適切な性別を推測しなければならない。あいまいな例では、高い翻訳精度と性別の精度を持つモデルが必ずしも不明瞭な例では不確実性のレベルを示すとは限らないことが判明した。
論文参考訳（メタデータ） (2025-07-24T12:10:21Z)
Are We Paying Attention to Her? Investigating Gender Disambiguation and Attention in Machine Translation [4.881426374773398]
最小ペア精度(MPA)と呼ばれる新しい評価指標を提案する。 MPAは、モデルが最小ペアで性別に適応するかどうかに焦点を当てている。 MPAは、反ステレオタイプの場合、NMTモデルは男性的な性別の手がかりを考慮に入れやすいことを示している。
論文参考訳（メタデータ） (2025-05-13T13:17:23Z)
GOSt-MT: A Knowledge Graph for Occupation-related Gender Biases in Machine Translation [2.3154290513589784]
機械翻訳(MT)システムにおけるジェンダーバイアスは、しばしば有害なステレオタイプを補強する重大な課題を引き起こす。本稿では,GOSt-MTナレッジグラフの作成を通じて,職業関連性バイアスを研究する新しい手法を提案する。
論文参考訳（メタデータ） (2024-09-17T08:44:20Z)
GenderCARE: A Comprehensive Framework for Assessing and Reducing Gender Bias in Large Language Models [73.23743278545321]
大規模言語モデル(LLM)は、自然言語生成において顕著な能力を示してきたが、社会的バイアスを増大させることも観察されている。 GenderCAREは、革新的な基準、バイアス評価、リダクションテクニック、評価メトリクスを含む包括的なフレームワークである。
論文参考訳（メタデータ） (2024-08-22T15:35:46Z)
Beyond Binary Gender: Evaluating Gender-Inclusive Machine Translation with Ambiguous Attitude Words [85.48043537327258]
既存の機械翻訳の性別バイアス評価は主に男性と女性の性別に焦点を当てている。本研究では,AmbGIMT (Gender-Inclusive Machine Translation with Ambiguous attitude words) のベンチマークを示す。本研究では,感情的態度スコア(EAS)に基づく性別バイアス評価手法を提案する。
論文参考訳（メタデータ） (2024-07-23T08:13:51Z)
GenderBias-\emph{VL}: Benchmarking Gender Bias in Vision Language Models via Counterfactual Probing [72.0343083866144]
本稿では,GenderBias-emphVLベンチマークを用いて,大規模視覚言語モデルにおける職業関連性バイアスの評価を行う。ベンチマークを用いて15のオープンソースLVLMと最先端の商用APIを広範囲に評価した。既存のLVLMでは男女差が広くみられた。
論文参考訳（メタデータ） (2024-06-30T05:55:15Z)
Probing Explicit and Implicit Gender Bias through LLM Conditional Text Generation [64.79319733514266]
大規模言語モデル(LLM)はバイアスと有害な応答を生成する。本研究では,あらかじめ定義されたジェンダーフレーズやステレオタイプを必要としない条件付きテキスト生成機構を提案する。
論文参考訳（メタデータ） (2023-11-01T05:31:46Z)
A Tale of Pronouns: Interpretability Informs Gender Bias Mitigation for Fairer Instruction-Tuned Machine Translation [35.44115368160656]
機械翻訳モデルがジェンダーバイアスを示すか否かについて検討する。 We found that IFT model default to male-inflected translations, evengarding female occupational stereotypes。実装が容易で効果的なバイアス緩和ソリューションを提案する。
論文参考訳（メタデータ） (2023-10-18T17:36:55Z)
VisoGender: A dataset for benchmarking gender bias in image-text pronoun resolution [80.57383975987676]
VisoGenderは、視覚言語モデルで性別バイアスをベンチマークするための新しいデータセットである。 We focus to occupation-related biases in a hegemonic system of binary gender, inspired by Winograd and Winogender schemas。我々は、最先端の視覚言語モデルをいくつかベンチマークし、それらが複雑な場面における二項性解消のバイアスを示すことを発見した。
論文参考訳（メタデータ） (2023-06-21T17:59:51Z)
Target-Agnostic Gender-Aware Contrastive Learning for Mitigating Bias in Multilingual Machine Translation [28.471506840241602]
ジェンダーバイアスは機械翻訳において重要な問題であり、バイアス軽減技術の研究が進行中である。本稿では,新しいアプローチに基づくバイアス緩和手法を提案する。 Gender-Aware Contrastive Learning, GACLは、文脈性情報を非明示性単語の表現にエンコードする。
論文参考訳（メタデータ） (2023-05-23T12:53:39Z)
Counter-GAP: Counterfactual Bias Evaluation through Gendered Ambiguous Pronouns [53.62845317039185]
バイアス測定データセットは、言語モデルのバイアスされた振る舞いを検出する上で重要な役割を果たす。本稿では, 多様な, 自然な, 最小限のテキストペアを, 対物生成によって収集する新しい手法を提案する。事前学習された4つの言語モデルは、各グループ内よりも、異なる性別グループ間でかなり不整合であることを示す。
論文参考訳（メタデータ） (2023-02-11T12:11:03Z)
Evaluating Gender Bias in Hindi-English Machine Translation [0.1503974529275767]
我々は,ヒンディー語の文法的考察に基づいて,TGBI計量の修正版を実装した。我々は、事前学習した埋め込みのための複数のメトリクスと、機械翻訳モデルで学習したメトリクスを比較して比較する。
論文参考訳（メタデータ） (2021-06-16T10:35:51Z)
Investigating Failures of Automatic Translation in the Case of Unambiguous Gender [13.58884863186619]
トランスフォーマーベースのモデルは、ニューラルマシン翻訳(NMT)のための現代の作業馬です。我々は、名詞の性別をマークしない言語から他の名詞に翻訳することに関して、トランスフォーマーモデルによる体系的で初歩的なエラーのクラスを観察する。トランスベースのNMTモデルがジェンダーを正しく翻訳する能力を測定するための評価スキームとデータセットをリリースします。
論文参考訳（メタデータ） (2021-04-16T00:57:36Z)
Decoding and Diversity in Machine Translation [90.33636694717954]
NMTが楽しむBLEUスコアに対して支払う費用の多様性の違いを特徴付ける。本研究は,ジェンダー代名詞を翻訳する際に,検索が既知バイアスの正解源となることを示唆する。
論文参考訳（メタデータ） (2020-11-26T21:09:38Z)
Multi-Dimensional Gender Bias Classification [67.65551687580552]
機械学習モデルは、性別に偏ったテキストでトレーニングする際に、社会的に望ましくないパターンを不注意に学習することができる。本稿では,テキスト中の性バイアスを複数の実用的・意味的な次元に沿って分解する一般的な枠組みを提案する。このきめ細かいフレームワークを用いて、8つの大規模データセットにジェンダー情報を自動的にアノテートする。
論文参考訳（メタデータ） (2020-05-01T21:23:20Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。