論文の概要: Cultural Fidelity in English-to-Hindi Translation: A Preservation-Fluency Frontier for Gender Recoverability
- arxiv url: http://arxiv.org/abs/2605.27654v1
- Date: Tue, 26 May 2026 20:14:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-28 17:38:55.503687
- Title: Cultural Fidelity in English-to-Hindi Translation: A Preservation-Fluency Frontier for Gender Recoverability
- Title(参考訳): 英語・ヒンディー語訳における文化的忠実性:ジェンダー回復のための保存・流動的フロンティア
- Authors: Samyak Savi, Chavi Gupta, Shreyas Gantayet, Tanay Sodha, Dhruv Kumar,
- Abstract要約: 生成的翻訳システムは、文化的に特定の文法体系の中で社会的に意味のある手がかりがどのように表現されるかを決定する。
英語のソースが明示的に性別を符号化する場合、英語からヒンディー語への翻訳は、ソース自体が曖昧でない限り、そのキューの回復可能性を維持するべきである。
まず、ソース・アウェア・リランカ(SAR)は、性別中立化の構文を避ける候補を優先する。
第二に、Phenomenon-Aware Reranker (PAR) は、慣用構文が残っている場合でも、ターゲットの語彙マーキングを通じて性別を保存する。
- 参考スコア(独自算出の注目度): 1.1933419040609936
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generative translation systems are cultural technologies because they decide how socially meaningful cues are rendered within culturally specific grammatical systems. We study one concrete notion of successful cultural translation: when an English source explicitly encodes gender, an English-to-Hindi translation should preserve the recoverability of that cue unless the source itself is ambiguous. We evaluate this criterion on a 37,345-instance benchmark spanning twelve categories and show that five systems frequently erase gender through ergative and honorific constructions. We then introduce two mechanism-aware inference-time interventions. The first, the Source-Aware Reranker (SAR), prefers candidates that avoid gender-neutralizing syntax. The second, the Phenomenon-Aware Reranker (PAR), preserves gender through targeted lexical marking even when ergative syntax remains. Across GPT-4o-mini and Sarvam, PAR improves target-subset accuracy from 11.07% to 54.47% and from 15.99% to 49.66%, respectively. Human evaluation shows that PAR increases gender preservation from 10.3% to 81.3%, but reduces mean fluency from 4.36 to 3.37. These findings place the two interventions on a preservation and fluency frontier rather than supporting a single dominant solution, and show how culturally situated generation can require explicit tradeoffs among fidelity, fluency, and stylistic naturalness.
- Abstract(参考訳): 生成翻訳システムは、文化的に特定の文法体系の中で社会的に意味のある手がかりがどのように表現されるかを決定するため、文化的技術である。
英語のソースが明示的に性別を符号化する場合、英語からヒンディー語への翻訳は、ソース自体が曖昧でない限り、そのキューの回復可能性を維持するべきである。
この基準は,12カテゴリーにまたがる37,345-instanceベンチマークで評価され,エグジュアルな構成と名誉な構成によって5つのシステムがジェンダーを頻繁に消去することを示した。
次に,2つのメカニズムを意識した推論時間介入を導入する。
ひとつはSource-Aware Reranker (SAR) で、性別中立化の構文を避ける候補を好んでいる。
第二に、Phenomenon-Aware Reranker (PAR) は、慣用構文が残っている場合でも、ターゲットの語彙マーキングを通じて性別を保存する。
GPT-4o-mini と Sarvam 全体で、PAR は目標サブセットの精度を 11.07% から 54.47% に改善し、それぞれ 15.99% から 49.66% に改善した。
人間による評価では、PARは性別の保存を10.3%から81.3%に増やすが、平均流速を4.36から3.37に下げる。
これらの知見は、一つの支配的なソリューションを支持するのではなく、保存と流布フロンティアに2つの介入を配置し、文化的に位置する世代が、忠実さ、流布性、スタイリスティックな自然性の明確なトレードオフを必要とすることを示す。
関連論文リスト
- The GaoYao Benchmark: A Comprehensive Framework for Evaluating Multilingual and Multicultural Abilities of Large Language Models [51.61416200800499]
GaoYaoは182.3kサンプル、26言語、51か国/地域からなる総合ベンチマークである。
まず、GaoYao氏は評価タスクを3つの文化階層に分類する統一的なフレームワークを提案する。
第二に、専門家を活用して、主観的なベンチマークを19言語に厳格にローカライズすることで、ネイティブ品質の拡大を実現しています。
第3に,20以上のフラッグシップおよびコンパクトLCMの詳細な診断を行う。
論文 参考訳(メタデータ) (2026-04-22T06:19:46Z) - When AI Writes, Whose Voice Remains? Quantifying Cultural Marker Erasure Across World English Varieties in Large Language Models [6.821769033209393]
文化ゴースト(Cultural Ghosting)とは、テキスト処理において、非ネイティブな英語の品種に特有の言語マーカーを体系的に消去することである。
我々はこの現象を、IER(Identity Erasure Rate)とSPS(Semantic Preservation Score)の2つの新しい指標を用いて定量化する。
本実験は, 明示的な文化的保存により, セマンティック品質を犠牲にすることなく, 消毒を29%削減できることを実証した。
論文 参考訳(メタデータ) (2026-02-25T17:54:42Z) - "Be My Cheese?": Cultural Nuance Benchmarking for Machine Translation in Multilingual LLMs [0.0]
本稿では,機械翻訳における文化的ローカライゼーションを評価するための大規模評価ベンチマークを提案する。
言語毎に5つのネイティブスピーカーレーダを持つ15言語を対象に,多言語大言語モデル (LLM) を7つ評価した。
GPT-5 (2.10/3)、Claude Sonnet 3.7 (1.97/3)、Mistral Medium 3.1 (1.84/3)は破滅的な失敗が少ない最強の層である。
論文 参考訳(メタデータ) (2026-02-04T16:35:48Z) - Extending Beacon to Hindi: Cultural Adaptation Drives Cross-Lingual Sycophancy [0.0]
サイコファシー(英: Sycophancy)とは、言語モデルにおいて、原則的推論よりもユーザの好みとの一致を優先する傾向である。
我々は、制御された3条件設計により、Beacon単ターン強制選択性診断をヒンディー語に拡張する。
すべてのモデルにおいて、英語よりも文化に適応したヒンディー教のプロンプトにおいて、梅毒率は一貫して高い。
論文 参考訳(メタデータ) (2026-01-19T12:03:52Z) - The Lou Dataset -- Exploring the Impact of Gender-Fair Language in German Text Classification [57.06913662622832]
ジェンダーフェア言語は、すべての性別に対処したり、中立形を使用することによって包摂性を促進する。
ジェンダーフェア言語はラベルを反転させ、確実性を減らし、注意パターンを変化させることで予測に大きな影響を及ぼす。
ドイツ語のテキスト分類への影響について最初の知見を提供する一方で、他の言語にもその知見が当てはまる可能性が高い。
論文 参考訳(メタデータ) (2024-09-26T15:08:17Z) - Beyond Binary Gender: Evaluating Gender-Inclusive Machine Translation with Ambiguous Attitude Words [85.48043537327258]
既存の機械翻訳の性別バイアス評価は主に男性と女性の性別に焦点を当てている。
本研究では,AmbGIMT (Gender-Inclusive Machine Translation with Ambiguous attitude words) のベンチマークを示す。
本研究では,感情的態度スコア(EAS)に基づく性別バイアス評価手法を提案する。
論文 参考訳(メタデータ) (2024-07-23T08:13:51Z) - GATE X-E : A Challenge Set for Gender-Fair Translations from
Weakly-Gendered Languages [0.0]
我々は、トルコ語、ハンガリー語、フィンランド語、ペルシア語から英語への翻訳からなるGATEコーパスの拡張であるGATE X-Eを紹介する。
このデータセットは、幅広い文の長さと領域を持つ自然文を特徴とし、様々な言語現象に関する翻訳書き直しに挑戦する。
GPT-4で構築した翻訳性書換えソリューションをGATE X-Eを用いて評価する。
論文 参考訳(メタデータ) (2024-02-22T04:36:14Z) - Evaluating Gender Bias in the Translation of Gender-Neutral Languages
into English [0.0]
我々は、トルコ語、ハンガリー語、フィンランド語、ペルシア語から英語への翻訳からなるGATEコーパスの拡張であるGATE X-Eを紹介する。
このデータセットは、幅広い文の長さと領域を持つ自然文を特徴とし、様々な言語現象に関する翻訳書き直しに挑戦する。
GPT-3.5 Turbo上に構築された英語のジェンダー書き換えソリューションをGATE X-Eを用いて評価する。
論文 参考訳(メタデータ) (2023-11-15T10:25:14Z) - Crossing the Threshold: Idiomatic Machine Translation through Retrieval
Augmentation and Loss Weighting [66.02718577386426]
慣用的な翻訳と関連する問題を簡易に評価する。
我々は,変圧器をベースとした機械翻訳モデルが慣用的な翻訳に対して正しくデフォルトとなる点を明らかにするための合成実験を行った。
自然慣用句の翻訳を改善するために, 単純かつ効果的な2つの手法を導入する。
論文 参考訳(メタデータ) (2023-10-10T23:47:25Z) - Counter-GAP: Counterfactual Bias Evaluation through Gendered Ambiguous
Pronouns [53.62845317039185]
バイアス測定データセットは、言語モデルのバイアスされた振る舞いを検出する上で重要な役割を果たす。
本稿では, 多様な, 自然な, 最小限のテキストペアを, 対物生成によって収集する新しい手法を提案する。
事前学習された4つの言語モデルは、各グループ内よりも、異なる性別グループ間でかなり不整合であることを示す。
論文 参考訳(メタデータ) (2023-02-11T12:11:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。