論文の概要: CCD-Bench: Probing Cultural Conflict in Large Language Model Decision-Making
- arxiv url: http://arxiv.org/abs/2510.03553v1
- Date: Fri, 03 Oct 2025 22:55:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-07 16:52:59.109397
- Title: CCD-Bench: Probing Cultural Conflict in Large Language Model Decision-Making
- Title(参考訳): CCD-Bench:大規模言語モデル意思決定における文化的対立
- Authors: Hasibur Rahman, Hanan Salam,
- Abstract要約: 大きな言語モデルは、合法的に異なる文化的価値システム間の明示的な衝突をナビゲートすることができる。
CCD-Benchは、文化的価値の対立の下で意思決定を評価するベンチマークである。
CCD-Benchは、孤立バイアス検出以上の評価を多元的意思決定にシフトする。
- 参考スコア(独自算出の注目度): 0.9310318514564272
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Although large language models (LLMs) are increasingly implicated in interpersonal and societal decision-making, their ability to navigate explicit conflicts between legitimately different cultural value systems remains largely unexamined. Existing benchmarks predominantly target cultural knowledge (CulturalBench), value prediction (WorldValuesBench), or single-axis bias diagnostics (CDEval); none evaluate how LLMs adjudicate when multiple culturally grounded values directly clash. We address this gap with CCD-Bench, a benchmark that assesses LLM decision-making under cross-cultural value conflict. CCD-Bench comprises 2,182 open-ended dilemmas spanning seven domains, each paired with ten anonymized response options corresponding to the ten GLOBE cultural clusters. These dilemmas are presented using a stratified Latin square to mitigate ordering effects. We evaluate 17 non-reasoning LLMs. Models disproportionately prefer Nordic Europe (mean 20.2 percent) and Germanic Europe (12.4 percent), while options for Eastern Europe and the Middle East and North Africa are underrepresented (5.6 to 5.8 percent). Although 87.9 percent of rationales reference multiple GLOBE dimensions, this pluralism is superficial: models recombine Future Orientation and Performance Orientation, and rarely ground choices in Assertiveness or Gender Egalitarianism (both under 3 percent). Ordering effects are negligible (Cramer's V less than 0.10), and symmetrized KL divergence shows clustering by developer lineage rather than geography. These patterns suggest that current alignment pipelines promote a consensus-oriented worldview that underserves scenarios demanding power negotiation, rights-based reasoning, or gender-aware analysis. CCD-Bench shifts evaluation beyond isolated bias detection toward pluralistic decision making and highlights the need for alignment strategies that substantively engage diverse worldviews.
- Abstract(参考訳): 大きな言語モデル(LLM)は、対人的および社会的意思決定にますます関与しているが、合法的に異なる文化的価値システム間の明示的な対立をナビゲートする能力は、ほとんど検討されていない。
既存のベンチマークは、主に文化的知識(CulturalBench)、価値予測(WorldValuesBench)、単一軸バイアス診断(CDEval)をターゲットにしている。
CCD-Benchは、異文化間の価値紛争下でのLCM意思決定を評価するベンチマークである。
CCD-Benchは、7つのドメインにまたがる2,182個のオープンエンドジレンマからなる。
これらのジレンマは、秩序効果を緩和するために成層ラテン正方形を用いて提示される。
我々は17個の非共振LDMを評価した。
モデルは北欧(平均20.2%)とゲルマンヨーロッパ(12.4%)を好んでおり、東ヨーロッパ、中東、北アフリカの選択肢は少ない(5.6%から5.8%)。
理論の87.9%は複数のGLOBE次元を参照しているが、この多元論は表面的であり、モデルが将来のオリエンテーションとパフォーマンスオリエンテーションを再結合し、Assertiveness や Gender Egalitarianism (どちらも3%未満)において基礎的な選択はめったにない。
順序付け効果は無視できる(クラマーのVは0.10未満)。
これらのパターンは、現在のアライメントパイプラインが、パワーネゴシエーション、権利に基づく推論、性別に応じた分析を必要とするシナリオを基盤とするコンセンサス指向の世界観を促進することを示唆している。
CCD-ベンチは、孤立バイアス検出以上の評価を、多元的意思決定にシフトさせ、様々な世界観に実質的に関与するアライメント戦略の必要性を強調している。
関連論文リスト
- Red Lines and Grey Zones in the Fog of War: Benchmarking Legal Risk, Moral Harm, and Regional Bias in Large Language Model Military Decision-Making [0.0]
本研究では,ターゲット行動における法的・道徳的リスクの側面を評価するためのベンチマークフレームワークを開発する。
我々は国際人道法(IHL)と軍事教義に基づく4つの指標を紹介する。
GPT-4o, Gemini-2.5, LLaMA-3.1の3つのフロンティアモデルを90個のマルチエージェント・マルチターン危機シミュレーションにより評価した。
論文 参考訳(メタデータ) (2025-10-03T20:55:04Z) - Which Cultural Lens Do Models Adopt? On Cultural Positioning Bias and Agentic Mitigation in LLMs [53.07843733899881]
大規模言語モデル(LLM)は、幅広い下流生成アプリケーションをアンロックした。
また、米国主流の文化の観点から、文化にまつわる微妙な公平性の問題に対処し、世代を配置するリスクも見いだす。
本稿では、これらのバイアスを解決するための2つの推論時間緩和法を提案する。
論文 参考訳(メタデータ) (2025-09-25T12:28:25Z) - The Cultural Gene of Large Language Models: A Study on the Impact of Cross-Corpus Training on Model Values and Biases [0.0]
大規模言語モデル(LLM)は世界中に展開されているが、その根底にある文化的・倫理的な前提は未解明のままである。
西洋中心モデル (GPT-4) と東洋中心モデル (ERNIE Bot) を比較した。
人間のアノテーションは両次元に有意かつ一貫した相違を示す。
論文 参考訳(メタデータ) (2025-08-17T15:54:14Z) - Do Large Language Models Understand Morality Across Cultures? [0.5356944479760104]
本研究では,大規模言語モデルが道徳的視点における異文化間差異や類似性をどの程度捉えているかを検討する。
以上の結果から,現在のLLMは多文化的モラル変動の完全なスペクトルを再現できないことが示唆された。
これらの知見は, LLMのバイアス軽減と文化的代表性向上に向けた, より堅牢なアプローチの必要性を浮き彫りにしている。
論文 参考訳(メタデータ) (2025-07-28T20:25:36Z) - A Game-Theoretic Negotiation Framework for Cross-Cultural Consensus in LLMs [10.655783463895325]
大型言語モデル (LLMs) は、WEIRD (Western, Educated, Industrialized, Rich, Democratic) の文化的偏見を示す。
この単文化的な観点は、支配的な価値観を強化し、多様な文化的視点を疎外する可能性がある。
公正で堅牢な異文化間の合意を促進するために設計された体系的枠組みを導入する。
論文 参考訳(メタデータ) (2025-06-16T08:42:39Z) - Multiple LLM Agents Debate for Equitable Cultural Alignment [52.01956042197423]
LLMをベースとした2人のエージェントが文化的なシナリオについて議論し、共同で最終決定を下すマルチエージェント議論フレームワークを導入する。
オープンウェイトLLM(および21LLMの組み合わせ)に対するこれらのアプローチを,75カ国の社会的エチケット規範に対するNormAd-ETIベンチマークを用いて評価した。
実験により、単一LLMベースラインよりも総合的精度と文化的グループパリティの両方を改善することが示されている。
論文 参考訳(メタデータ) (2025-05-30T15:01:52Z) - Multimodal Cultural Safety: Evaluation Frameworks and Alignment Strategies [58.88053690412802]
大規模視覚言語モデル(LVLM)は、観光アシスタントのようなグローバルに分散したアプリケーションにますます導入されている。
CROSSは、LVLMの文化的安全性推論能力を評価するために設計されたベンチマークである。
実験モデルと推論モデルを含む21種類のLVLMを評価した。
論文 参考訳(メタデータ) (2025-05-20T23:20:38Z) - WorldView-Bench: A Benchmark for Evaluating Global Cultural Perspectives in Large Language Models [1.094065133109559]
大規模言語モデル(LLM)は、西洋中心の認識論と社会文化的規範を強化する方法で主に訓練され、整列されている。
多様な世界観に対応する能力を分析し,LLMにおけるグローバルカルチャー・インクルーシティ(GCI)を評価するためのベンチマークであるWorldView-Benchを紹介する。
論文 参考訳(メタデータ) (2025-05-14T17:43:40Z) - Global MMLU: Understanding and Addressing Cultural and Linguistic Biases in Multilingual Evaluation [71.59208664920452]
多言語データセットの文化的バイアスは、グローバルベンチマークとしての有効性に重大な課題をもたらす。
MMLUの進歩は西洋中心の概念の学習に大きく依存しており、文化に敏感な知識を必要とする質問の28%がそうである。
改良されたMMLUであるGlobal MMLUをリリースし,42言語を対象に評価を行った。
論文 参考訳(メタデータ) (2024-12-04T13:27:09Z) - The Root Shapes the Fruit: On the Persistence of Gender-Exclusive Harms in Aligned Language Models [91.86718720024825]
我々はトランスジェンダー、ノンバイナリ、その他のジェンダー・ディバースのアイデンティティを中心とし、アライメント手順が既存のジェンダー・ディバースバイアスとどのように相互作用するかを検討する。
以上の結果から,DPO対応モデルは特に教師付き微調整に敏感であることが示唆された。
DPOとより広範なアライメントプラクティスに合わせたレコメンデーションで締めくくります。
論文 参考訳(メタデータ) (2024-11-06T06:50:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。