Fugu-MT 論文翻訳(概要): Mitigating Cross-Lingual Cultural Inconsistencies in LLMs via Consensus-Driven Preference Optimisation

論文の概要: Mitigating Cross-Lingual Cultural Inconsistencies in LLMs via Consensus-Driven Preference Optimisation

arxiv url: http://arxiv.org/abs/2605.12515v1
Date: Thu, 02 Apr 2026 14:04:06 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-25 12:34:33.769561
Title: Mitigating Cross-Lingual Cultural Inconsistencies in LLMs via Consensus-Driven Preference Optimisation
Title（参考訳）: 合意型選好最適化によるLLMにおける言語間文化的不整合の緩和
Authors: Lucas Resck, Isabelle Augenstein, Anna Korhonen,
Abstract要約: 本研究では,多言語大言語モデル (MLLM) が,プロンプトの言語変化に伴う不整合性を示すことを示す。コンセンサス駆動型アライメントフレームワークであるC-3POを提案する。 C-3POは、非整合モデルよりも0.10ポイントの$_S$を絶対的に増加させ、強力なプロンプトと表現のステアリングベースラインを上回る。
参考スコア（独自算出の注目度）: 58.01855677487771
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Despite their impressive capabilities, multilingual large language models (MLLMs) frequently exhibit inconsistent behaviour when the prompt's language changes. While such adaptation is generally desirable, it becomes a critical failure when a user's identity is explicitly defined. For instance, given a fixed British persona and an ambiguous everyday knowledge query about literature, the prompt's language frequently overwrites the system persona -- yielding Shakespeare in English but Cervantes in Spanish. To robustly quantify this Cross-lingual Cultural Inconsistency, we introduce Singleton Fleiss's $κ_S$, a metric mathematically resilient to hallucinations. For mitigation, we propose Cross-lingual Cultural Consistent Preference Optimisation (C-3PO), a consensus-driven alignment framework. C-3PO achieves up to a 0.10-point absolute increase in $κ_S$ over unaligned models, outperforming strong prompting and representation steering baselines. Empirical evaluations show this inconsistency disproportionately affects lower-resource languages like Indonesian and Persian. A layer-wise interpretability analysis reveals the underlying mechanism: by early-decoding intermediate layer representations, we find that MLLMs implicitly personalise outputs towards the prompt language's stereotypical culture as forward-pass representations stabilise.
Abstract（参考訳）: その印象的な機能にもかかわらず、多言語大言語モデル(MLLM)は、プロンプトの言語変更時にしばしば矛盾する振る舞いを示す。このような適応は一般的に望ましいが、ユーザのアイデンティティが明示的に定義されると、致命的な失敗となる。例えば、固定されたイギリスのペルソナと文学に関する曖昧な日常的な知識クエリが与えられた場合、プロンプトの言語はしばしばシステムペルソナを上書きする。この言語間の文化的矛盾をしっかりと定量化するために、Singleton Fleissの$κ_S$を紹介します。緩和のために,コンセンサス主導のアライメントフレームワークであるC-3POを提案する。 C-3POは、非整合モデルに対するκ_S$の0.10ポイントの絶対的な増加を達成し、強力なプロンプトと表現ステアリングベースラインを上回っている。実証的な評価は、この矛盾がインドネシア語やペルシア語のような低リソース言語に不一致に影響を及ぼすことを示している。中間層表現を初期復号化することにより、MLLMはプロンプト言語のステレオタイプ文化に向けて、出力を暗黙的にパーソナライズし、フォワードパス表現を安定化させる。

関連論文リスト

Cross-Lingual Consensus: Aligning Multilingual Cultural Knowledge via Multilingual Self-Consistency [1.338174941551702]
大規模言語モデル(LLM)は、言語間での大幅なパフォーマンスの相違を示す。本稿では,この知識ギャップを埋める新たな自己教師型フレームワークを提案する。
論文参考訳（メタデータ） (2026-05-21T08:11:01Z)
Dialect vs Demographics: Quantifying LLM Bias from Implicit Linguistic Signals vs. Explicit User Profiles [0.42970700836450476]
明示的なアイデンティティは、アクティブなセーフティフィルタをアクティベートし、拒否率を高め、ブラックユーザーの参照テキストと比較して意味的類似性を減少させる。対照的に、暗黙の方言の手がかりは強力な方言のジェイルブレイクを引き起こします。現在の安全アライメント技術は、明示的なキーワードに過剰にインデクシングされ、分岐したユーザエクスペリエンスを生み出していることが分かりました。
論文参考訳（メタデータ） (2026-04-22T23:33:18Z)
When Meanings Meet: Investigating the Emergence and Quality of Shared Concept Spaces during Multilingual Language Model Training [57.230355403478995]
本研究では,EuroLLMの事前学習における言語に依存しない概念空間の開発について検討する。共有概念空間は早期に出現し、洗練され続けていますが、それらとの整合性は言語に依存しています。従来の作業とは対照的に、細かな手作業分析により、翻訳品質の顕著な向上は、行動の変化を反映していることが判明した。
論文参考訳（メタデータ） (2026-01-30T11:23:01Z)
CLM-Bench: Benchmarking and Analyzing Cross-lingual Misalignment of LLMs in Knowledge Editing [5.137059606366328]
CLM-Benchは中国固有の手法を用いて構築されたカルチャー対応のベンチマークである。代表的LLMについて広範な実験を行い、言語間の相違を顕著に明らかにした。本研究は,言語間移動における現在の手法の有効性に挑戦し,文化的にネイティブなベンチマークの重要性を浮き彫りにした。
論文参考訳（メタデータ） (2026-01-24T09:55:34Z)
Tears or Cheers? Benchmarking LLMs via Culturally Elicited Distinct Affective Responses [28.3173238194554]
CEDARは、文化的にアンダーラインのscElicited underlinetextscDistinct underlinetextscAffective underlinetextscResponsesをキャプチャするシナリオから構築されたベンチマークである。その結果得られたベンチマークは、7つの言語に10,962のインスタンスと14のきめ細かい感情カテゴリで構成され、各言語には400のマルチモーダルと1,166のテキストのみのサンプルが含まれている。
論文参考訳（メタデータ） (2026-01-19T13:04:26Z)
Code-Switching In-Context Learning for Cross-Lingual Transfer of Large Language Models [64.54005959758733]
我々は,コードスイッチング・イン・コンテキスト・ラーニング(CSICL)を,推論中の翻訳障壁を克服するための原則的かつ堅牢なアプローチとして導入する。 4つのLLM、6つのデータセット、10の言語にわたる広範な実験を行い、知識集約型ドメインと推論指向ドメインの両方にまたがる。その結果、CSICLはX-ICLベースラインを一貫して上回り、ターゲット言語と見当たらない言語の両方で3.1%pと1.9%pを達成した。
論文参考訳（メタデータ） (2025-10-07T08:35:42Z)
Which Cultural Lens Do Models Adopt? On Cultural Positioning Bias and Agentic Mitigation in LLMs [53.07843733899881]
大規模言語モデル(LLM)は、幅広い下流生成アプリケーションをアンロックした。また、米国主流の文化の観点から、文化にまつわる微妙な公平性の問題に対処し、世代を配置するリスクも見いだす。本稿では、これらのバイアスを解決するための2つの推論時間緩和法を提案する。
論文参考訳（メタデータ） (2025-09-25T12:28:25Z)
Can you map it to English? The Role of Cross-Lingual Alignment in Multilingual Performance of LLMs [12.334510055293535]
大きな言語モデル (LLMs) は英語のテキストに基づいて事前訓練されており、驚くべき多言語機能を示している。識別タスクのインスタンスレベルでのアライメントを定量化するために、言語間アライメントメトリクスを導入します。言語間アライメントの指標は言語レベルでのタスク精度と強く相関するが,サンプルレベルのアライメントは誤予測と正しく区別できないことが多い。
論文参考訳（メタデータ） (2025-04-13T00:01:22Z)
Lost in Multilinguality: Dissecting Cross-lingual Factual Inconsistency in Transformer Language Models [49.16690802656554]
複数の言語で意味論的に等価なプロンプトに対して一貫した応答を提供するのに、多言語の事実モデルでは苦労していることがわかった。最終層での計算をバイパスし,予測精度と言語間の整合性を向上する線形ショートカット手法を提案する。
論文参考訳（メタデータ） (2025-04-05T19:43:10Z)
Simple Linguistic Inferences of Large Language Models (LLMs): Blind Spots and Blinds [59.71218039095155]
我々は,ほとんどの人間が自明に感じる単純な推論タスクにおいて,言語理解能力を評価する。我々は, (i) 文法的に特定された含意, (ii) 不確実性のある明らかな副詞を持つ前提, (iii) 単調性含意を目標とする。モデルはこれらの評価セットに対して中程度から低い性能を示す。
論文参考訳（メタデータ） (2023-05-24T06:41:09Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。