論文の概要: CrossCult-KIBench: A Benchmark for Cross-Cultural Knowledge Insertion in MLLMs
- arxiv url: http://arxiv.org/abs/2605.06115v1
- Date: Thu, 07 May 2026 12:26:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-08 22:27:11.765183
- Title: CrossCult-KIBench: A Benchmark for Cross-Cultural Knowledge Insertion in MLLMs
- Title(参考訳): CrossCult-KIBench:MLLMにおけるクロスカルチャー知識導入のベンチマーク
- Authors: Zhen Zeng, Leijiang Gu, Feng Li, Jing Yu, Zenglin Shi,
- Abstract要約: 異文化間の知識挿入は、他の文化における本来の振る舞いを保ちながら、特定の文化的文脈にモデルを適応させることに焦点を当てる。
ベンチマークには、英語、中国語、アラビア語文化グループにまたがる49の文化的関連視覚シナリオをカバーする、9800のイメージグラウンドケースが含まれている。
MCKI(Memory-Conditioned Knowledge Insertion)は、冷凍MLLM表現を用いて、外部メモリから関連する文化的知識を検索する。
- 参考スコア(独自算出の注目度): 13.267566050457974
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multimodal Large Language Models (MLLMs), trained primarily on English-centric data, frequently generate culturally inappropriate or misaligned responses in cross-cultural settings. To mitigate this, we introduce the task of cross-cultural knowledge insertion, which focuses on adapting models to specific cultural contexts while preserving their original behavior in other cultures. To facilitate research in this area, we introduce CrossCult-KIBench, a comprehensive evaluation benchmark for assessing both the effectiveness of knowledge insertion and its unintended side effects on non-target cultures. The benchmark includes 9,800 image-grounded cases covering 49 culturally relevant visual scenarios across English, Chinese, and Arabic language-culture groups. It supports evaluation in both single-insert and sequential-insert settings. We also propose Memory-Conditioned Knowledge Insertion (MCKI) as a baseline method. MCKI retrieves relevant cultural knowledge from an external memory using frozen MLLM representations, prepending matched entries as conditional prompts when applicable. Extensive experiments on CrossCult-KIBench reveal that current approaches struggle to balance effective cultural adaptation with behavioral preservation, highlighting a key challenge in developing culturally-aware MLLMs. Our work thus underscores an important research direction for developing more culturally adaptive and responsible MLLMs.
- Abstract(参考訳): MLLM(Multimodal Large Language Models)は、主に英語中心のデータに基づいて訓練され、文化的に不適切または不適切な応答を文化横断的に生成する。
これを軽減するために,他文化の本来の振る舞いを保ちながら,特定の文化的文脈にモデルを適用することに焦点を当てた,異文化間知識挿入の課題を導入する。
この領域の研究を容易にするために,知識挿入の有効性と意図しない副作用が非対象文化に与える影響を評価する総合評価ベンチマークであるCrossCult-KIBenchを紹介する。
このベンチマークには、英語、中国語、アラビア語の文化団体で49の文化的に関連のある視覚シナリオをカバーする9,800のイメージグラウンドケースが含まれている。
シングルインサートとシーケンシャルインサートの両方の設定で評価をサポートする。
また,ベースライン手法として,MCKI(Memory-Conditioned Knowledge Insertion)を提案する。
MCKIは、凍結MLLM表現を用いて、関連する文化知識を外部メモリから取得し、適合したエントリを、適用時に条件付きプロンプトとして予測する。
CrossCult-KIBenchの大規模な実験は、現在のアプローチが効果的な文化的適応と行動保存のバランスをとるのに苦労していることを明らかにし、文化的に認識されたMLLMを開発する上で重要な課題を浮き彫りにした。
本研究は、より文化的適応的で責任あるMLLMを開発するための重要な研究の方向性を裏付けるものである。
関連論文リスト
- Steering LLMs for Culturally Localized Generation [29.19138401210989]
文化的に健全な情報をエンコードし、それらを文化埋め込み(CuE)に集約する解釈可能な特徴を同定する。
CuEをベースとしたステアリングは、文化的忠実度を高め、単独で進めるよりも極めて稀で、長い尾の文化概念を引き出す。
これはまた、モデルがより良い導入戦略の恩恵を受けており、必ずしもロングテールな知識表現を欠いているわけではないことを示唆している。
論文 参考訳(メタデータ) (2026-03-24T15:04:01Z) - XCR-Bench: A Multi-Task Benchmark for Evaluating Cultural Reasoning in LLMs [20.548049824884668]
大規模言語モデル(LLM)における異文化間の能力は、CSI(Culture-Specific Items)を識別する能力を必要とする
我々は,Cross(X)-Cultural Reasoning BenchmarkであるXCR-Benchを紹介した。
以上の結果から,現状のLCMは社会的エチケットや文化的参照に関連するCSIを識別・適応する上で,一貫した弱点を示すことが明らかとなった。
論文 参考訳(メタデータ) (2026-01-20T15:21:18Z) - Do Large Language Models Truly Understand Cross-cultural Differences? [53.481048019144644]
我々は,大規模言語モデルの異文化間理解と推論を評価するシナリオベースのベンチマークを開発した。
文化理論を基礎として、異文化の能力を9次元に分類する。
データセットは連続的な拡張をサポートし、実験は他の言語への転送可能性を確認する。
論文 参考訳(メタデータ) (2025-12-08T01:21:58Z) - MMA-ASIA: A Multilingual and Multimodal Alignment Framework for Culturally-Grounded Evaluation [91.22008265721952]
MMA-ASIAは、アジア8か国と10か国を対象とする人為的、多言語的、マルチモーダルなベンチマークに重点を置いている。
これは、テキスト、画像(視覚的質問応答)、音声の3つのモードにまたがる入力レベルで整列された最初のデータセットである。
i) 国間の文化的認識格差、(ii) 言語間の整合性、(iii) 言語間の整合性、(iv) 文化知識の一般化、(v) 基礎的妥当性を評価する5次元評価プロトコルを提案する。
論文 参考訳(メタデータ) (2025-10-07T14:12:12Z) - CultureScope: A Dimensional Lens for Probing Cultural Understanding in LLMs [57.653830744706305]
CultureScopeは、大規模な言語モデルにおける文化的理解を評価するための、これまでで最も包括的な評価フレームワークである。
文化的な氷山理論に触発されて、文化知識分類のための新しい次元スキーマを設計する。
実験結果から,文化的理解を効果的に評価できることが示唆された。
論文 参考訳(メタデータ) (2025-09-19T17:47:48Z) - From Word to World: Evaluate and Mitigate Culture Bias in LLMs via Word Association Test [50.51344198689069]
我々は,人中心語関連テスト(WAT)を拡張し,異文化間認知による大規模言語モデルのアライメントを評価する。
文化選好に対処するために,モデルの内部表現空間に直接,文化固有の意味的関連性を直接埋め込む革新的なアプローチであるCultureSteerを提案する。
論文 参考訳(メタデータ) (2025-05-24T07:05:10Z) - Cultural Learning-Based Culture Adaptation of Language Models [70.1063219524999]
大きな言語モデル(LLM)をさまざまな文化的価値に適用することは難しい課題です。
文化的学習に基づくLLMと文化的価値との整合性を高めるための新しい枠組みであるCLCAについて述べる。
論文 参考訳(メタデータ) (2025-04-03T18:16:26Z) - Translating Across Cultures: LLMs for Intralingual Cultural Adaptation [12.5954253354303]
文化適応の課題を定義し,現代LLMの性能を評価するための評価枠組みを構築した。
我々は、自動適応で起こりうる問題を解析する。
本稿は, LLMの文化的理解と, 異文化のシナリオにおける創造性について, より深い知見を提供していくことを願っている。
論文 参考訳(メタデータ) (2024-06-20T17:06:58Z) - Understanding the Capabilities and Limitations of Large Language Models for Cultural Commonsense [98.09670425244462]
大規模言語モデル(LLM)は、かなりの常識的理解を示している。
本稿では,文化的コモンセンスタスクの文脈におけるいくつかの最先端LCMの能力と限界について検討する。
論文 参考訳(メタデータ) (2024-05-07T20:28:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。