論文の概要: Semantic Label Drift in Cross-Cultural Translation
- arxiv url: http://arxiv.org/abs/2510.25967v1
- Date: Wed, 29 Oct 2025 21:11:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-31 16:05:09.573921
- Title: Semantic Label Drift in Cross-Cultural Translation
- Title(参考訳): 異文化間翻訳における意味的ラベルドリフト
- Authors: Mohsinul Kabir, Tasnim Ahmed, Md Mezbaur Rahman, Polydoros Giannouris, Sophia Ananiadou,
- Abstract要約: 機械翻訳(MT)は低リソース言語における資源不足に対処するために広く用いられている。
本稿では,文化的な相違によるMT中に意味ラベルが漂流したり変化したりするという仮説を立てる。
以上の結果から,MTの文化的要因はラベルの忠実さを損なうだけでなく,下流の応用において誤解釈や文化的対立を招きかねないことが示唆された。
- 参考スコア(独自算出の注目度): 16.42521939322783
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Machine Translation (MT) is widely employed to address resource scarcity in low-resource languages by generating synthetic data from high-resource counterparts. While sentiment preservation in translation has long been studied, a critical but underexplored factor is the role of cultural alignment between source and target languages. In this paper, we hypothesize that semantic labels are drifted or altered during MT due to cultural divergence. Through a series of experiments across culturally sensitive and neutral domains, we establish three key findings: (1) MT systems, including modern Large Language Models (LLMs), induce label drift during translation, particularly in culturally sensitive domains; (2) unlike earlier statistical MT tools, LLMs encode cultural knowledge, and leveraging this knowledge can amplify label drift; and (3) cultural similarity or dissimilarity between source and target languages is a crucial determinant of label preservation. Our findings highlight that neglecting cultural factors in MT not only undermines label fidelity but also risks misinterpretation and cultural conflict in downstream applications.
- Abstract(参考訳): 機械翻訳(MT)は、高リソース言語から合成データを生成することにより、低リソース言語の資源不足に対処するために広く利用されている。
翻訳における感情保存は長い間研究されてきたが、批判的だが未解明の要因は、ソース言語とターゲット言語の間の文化的アライメントの役割である。
本稿では,文化的な相違によるMT中に意味ラベルが漂流したり変化したりするという仮説を立てる。
文化的にセンシティブで中立な領域にまたがる一連の実験を通じて,(1)現代大言語モデル(LLM)を含むMTシステム,特に文化的センシティブな領域におけるラベルドリフトの誘導,(2)従来の統計的MTツールとは異なり,LSMは文化的知識をエンコードし,この知識を活用することでラベルドリフトの増幅,(3)ソースとターゲット言語間の文化的類似性や相違性はラベル保存の重要な決定要因である。
以上の結果から,MTにおける文化的要因の無視は,ラベルの忠実性を損なうだけでなく,下流のアプリケーションにおける誤解釈や文化の対立を招きかねないことが示唆された。
関連論文リスト
- MMA-ASIA: A Multilingual and Multimodal Alignment Framework for Culturally-Grounded Evaluation [91.22008265721952]
MMA-ASIAは、アジア8か国と10か国を対象とする人為的、多言語的、マルチモーダルなベンチマークに重点を置いている。
これは、テキスト、画像(視覚的質問応答)、音声の3つのモードにまたがる入力レベルで整列された最初のデータセットである。
i) 国間の文化的認識格差、(ii) 言語間の整合性、(iii) 言語間の整合性、(iv) 文化知識の一般化、(v) 基礎的妥当性を評価する5次元評価プロトコルを提案する。
論文 参考訳(メタデータ) (2025-10-07T14:12:12Z) - Culturally-Grounded Chain-of-Thought (CG-CoT):Enhancing LLM Performance on Culturally-Specific Tasks in Low-Resource Languages [0.0]
大規模言語モデル(LLM)は、特に低リソース言語において、文化的に特定の推論タスクに苦しむ。
本稿では,文化的文脈の高密度ベクトル検索と明示的な推論シーケンスを組み合わせた新しいプロンプト戦略であるCG-CoTを紹介する。
論文 参考訳(メタデータ) (2025-06-01T21:57:02Z) - From Word to World: Evaluate and Mitigate Culture Bias in LLMs via Word Association Test [50.51344198689069]
我々は,人中心語関連テスト(WAT)を拡張し,異文化間認知による大規模言語モデルのアライメントを評価する。
文化選好に対処するために,モデルの内部表現空間に直接,文化固有の意味的関連性を直接埋め込む革新的なアプローチであるCultureSteerを提案する。
論文 参考訳(メタデータ) (2025-05-24T07:05:10Z) - Preserving Cultural Identity with Context-Aware Translation Through Multi-Agent AI Systems [0.4218593777811082]
言語は文化的アイデンティティの基盤となっているが、グローバル化と主要言語の優位性により、3000近い言語が絶滅の危機にさらされている。
既存のAI駆動翻訳モデルは効率を優先するが、しばしば文化的ニュアンス、慣用的な表現、歴史的重要性を捉えない。
本稿では,言語コミュニティにおける文化適応型翻訳のための多言語AIフレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-05T06:43:59Z) - The Echoes of Multilinguality: Tracing Cultural Value Shifts during LM Fine-tuning [23.418656688405605]
本研究では, 異なるテスト言語で符号化された文化的価値に言語がどのように影響するかを, 微調整時にどのように修正されるかを検討する。
最後に、トレーニングデータ属性法を用いて、微調整の例やそれらが生み出す言語にパターンを見つける。
論文 参考訳(メタデータ) (2024-05-21T12:55:15Z) - Not All Countries Celebrate Thanksgiving: On the Cultural Dominance in
Large Language Models [89.94270049334479]
本稿では,大規模言語モデル(LLM)における文化的優位性について述べる。
LLMは、ユーザーが非英語で尋ねるときに期待する文化とは無関係な、不適切な英語文化関連の回答を提供することが多い。
論文 参考訳(メタデータ) (2023-10-19T05:38:23Z) - Benchmarking Machine Translation with Cultural Awareness [50.183458829028226]
文化関連コンテンツの翻訳は、効果的な異文化間コミュニケーションに不可欠である。
多くの文化特化項目(CSI)は言語間の翻訳を欠いていることが多い。
この難しさは機械翻訳システムの文化的意識の分析を妨げる。
論文 参考訳(メタデータ) (2023-05-23T17:56:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。