論文の概要: Same Lesson, Different Story: Cross-Lingual Reconstruction of Cultural Narratives in Large Language Models
- arxiv url: http://arxiv.org/abs/2606.24610v1
- Date: Tue, 23 Jun 2026 14:10:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-24 22:16:48.996937
- Title: Same Lesson, Different Story: Cross-Lingual Reconstruction of Cultural Narratives in Large Language Models
- Title(参考訳): 同じ教訓と異なる物語:大規模言語モデルにおける文化的物語の言語間再構築
- Authors: Jory Alshaalan, Haya Albaker, Abeer Aldayel, Aljawharah Alabdullatif, Rehab Alahmadi,
- Abstract要約: 本研究では、15言語にまたがる414の証明を言語横断的に収集する多言語評価物語フレームワークを提案する。
この分析は、モデルが言語間で意味を保っているかどうか、言語間条件付けが物語の実現にどのように影響するか、そして異なるモデルファミリーが類似の解釈に収束しているかどうかを評価する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The evaluation of cultural grounding context becomes complex when multiple cultures convey the same moral lesson. This challenge is particularly relevant to large language models (LLMs), which produce narratives across a wide range of languages and cultural contexts. However, it remains uncertain whether these models preserve culturally grounded meaning when equivalent moral lessons are conveyed through distinct cultural forms. This study introduces a multilingual evaluation narrative framework that integrates a cross-linguistic collection of 414 proverbs spanning 15 languages and uses four LLMs to generate 13k narratives. By employing semantically equivalent proverbs as culturally grounded prompts, the analysis assesses whether models preserve meaning across languages, how cross-lingual conditioning influences narrative realization, and whether different model families converge on similar interpretations. Results indicate that cross-lingual prompting largely preserves proverb-level semantic meaning while systematically redistributing agency, social positioning, and narrative structure. Additionally, strong inter-model convergence is observed in both monolingual and cross-lingual settings, suggesting that multilingual LLMs rely on shared semantic abstractions despite architectural and linguistic differences. These findings shed light on the need for more comprehensive evaluations of cultural grounding. Relying exclusively on semantic similarity in multilingual narrative assessments may overestimate cultural preservation by neglecting culturally meaningful variations in narrative expression.
- Abstract(参考訳): 複数の文化が同じ道徳的な教訓を伝えると、文化的根拠の文脈の評価は複雑になる。
この課題は大きな言語モデル(LLM)に特に関係しており、幅広い言語や文化的な文脈で物語を生み出す。
しかし、これらのモデルが文化的に根ざした意味を保ち、それに相当する道徳的教訓が異なる文化形態で伝えられるかどうかは不明である。
本研究では,15言語にまたがる414の証明を言語横断的に収集し,4つのLLMを用いて13kの物語を生成する多言語評価物語フレームワークを提案する。
意味論的に等価な証明を文化的根拠付きプロンプトとして活用することにより、言語間のモデルが意味を保存するかどうか、言語間条件付けが物語の実現にどのように影響するか、異なるモデルファミリーが類似の解釈に収束するかを評価する。
その結果,言語横断的なプロンプトは,組織的再分配,社会的位置づけ,物語構造を保ちながら,証明レベルの意味をほとんど保存していることが明らかとなった。
さらに、単言語と言語間の両方で強いモデル間収束が観察され、アーキテクチャと言語の違いにもかかわらず、多言語LLMは共通の意味的抽象化に依存していることが示唆された。
これらの知見は、文化基盤のより包括的な評価の必要性を浮き彫りにした。
多言語ナラティブ評価における意味的類似性にのみ依存することは、ナラティブ表現における文化的意義のあるバリエーションを無視して、文化的保存を過大評価する可能性がある。
関連論文リスト
- Lessons Without Borders? Evaluating Cultural Alignment of LLMs Using Multilingual Story Moral Generation [3.8458777248623193]
新たな文化的基盤評価課題として多言語物語モラル生成を導入する。
14の言語と文化のペアにまたがって収集された人間による物語のモラルのデータセットを用いて、モデル出力と人間の解釈を比較した。
我々は,フロンティアモデルが人間の反応と意味的に類似し,人間の評価者が好むストーリーモラルを生成することを示す。
論文 参考訳(メタデータ) (2026-04-09T22:13:24Z) - Where Culture Fades: Revealing the Cultural Gap in Text-to-Image Generation [43.352493955825736]
現在のT2Iモデルは、多言語的なプロンプトの下で、文化的に中立な結果や英語に偏った結果をもたらすことが多い。
本稿では,培養感受性シグナルを少数の固定層内の小さなニューロン群に局在させる探索法を提案する。
論文 参考訳(メタデータ) (2025-11-21T14:40:50Z) - MMA-ASIA: A Multilingual and Multimodal Alignment Framework for Culturally-Grounded Evaluation [91.22008265721952]
MMA-ASIAは、アジア8か国と10か国を対象とする人為的、多言語的、マルチモーダルなベンチマークに重点を置いている。
これは、テキスト、画像(視覚的質問応答)、音声の3つのモードにまたがる入力レベルで整列された最初のデータセットである。
i) 国間の文化的認識格差、(ii) 言語間の整合性、(iii) 言語間の整合性、(iv) 文化知識の一般化、(v) 基礎的妥当性を評価する5次元評価プロトコルを提案する。
論文 参考訳(メタデータ) (2025-10-07T14:12:12Z) - Cross-Cultural Transfer of Commonsense Reasoning in LLMs: Evidence from the Arab World [68.19795061447044]
本稿では,アラブ世界におけるコモンセンス推論の異文化間移動について検討する。
アラブ13カ国を対象とした文化基盤のコモンセンス推論データセットを用いて,軽量アライメント手法の評価を行った。
以上の結果から,他国の文化特有例は12例に過ぎず,他国の文化特有例を平均10%向上させることができた。
論文 参考訳(メタデータ) (2025-09-23T17:24:14Z) - MAKIEval: A Multilingual Automatic WiKidata-based Framework for Cultural Awareness Evaluation for LLMs [37.98920430188422]
MAKIEvalは、大規模言語モデルにおける文化的認識を評価するための自動多言語フレームワークである。
モデル出力における文化的実体を自動的に識別し、構造化された知識にリンクする。
オープンソースのシステムとプロプライエタリシステムの両方を対象とする,世界のさまざまな場所で開発された7つのLLMを評価した。
論文 参考訳(メタデータ) (2025-05-27T19:29:40Z) - From Word to World: Evaluate and Mitigate Culture Bias in LLMs via Word Association Test [50.51344198689069]
我々は,人中心語関連テスト(WAT)を拡張し,異文化間認知による大規模言語モデルのアライメントを評価する。
文化選好に対処するために,モデルの内部表現空間に直接,文化固有の意味的関連性を直接埋め込む革新的なアプローチであるCultureSteerを提案する。
論文 参考訳(メタデータ) (2025-05-24T07:05:10Z) - Extrinsic Evaluation of Cultural Competence in Large Language Models [53.626808086522985]
本稿では,2つのテキスト生成タスクにおける文化能力の評価に焦点をあてる。
我々は,文化,特に国籍の明示的なキューが,そのプロンプトに乱入している場合のモデル出力を評価する。
異なる国におけるアウトプットのテキスト類似性とこれらの国の文化的価値との間には弱い相関関係がある。
論文 参考訳(メタデータ) (2024-06-17T14:03:27Z) - Investigating Cultural Alignment of Large Language Models [10.738300803676655]
LLM(Large Language Models)は,異なる文化で採用されている多様な知識を真にカプセル化していることを示す。
社会学的調査をシミュレートし、実際の調査参加者のモデル応答を参考として、文化的アライメントの定量化を行う。
本稿では,人類学的推論を活用し,文化的アライメントを高める新しい手法である人類学的プロンプティングを紹介する。
論文 参考訳(メタデータ) (2024-02-20T18:47:28Z) - Multi-lingual and Multi-cultural Figurative Language Understanding [69.47641938200817]
図形言語は人間のコミュニケーションに浸透するが、NLPでは比較的過小評価されている。
Hindi, Indonesian, Javanese, Kannada, Sundanese, Swahili, Yorubaの7つの多様な言語に関するデータセットを作成しました。
我々のデータセットから,各言語は,同じ領域から派生した言語間で最も高い重なり合いを持つ,図形表現の文化的・地域的概念に依存していることが明らかとなった。
全ての言語は、事前学習データと微調整データの可用性を反映した性能の変化により、英語と比較して大きな欠陥がある。
論文 参考訳(メタデータ) (2023-05-25T15:30:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。