論文の概要: AlignCultura: Towards Culturally Aligned Large Language Models?
- arxiv url: http://arxiv.org/abs/2604.19016v1
- Date: Tue, 21 Apr 2026 03:06:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-22 22:41:49.588377
- Title: AlignCultura: Towards Culturally Aligned Large Language Models?
- Title(参考訳): AlignCultura: 文化的に規定された大規模言語モデルを目指して?
- Authors: Gautam Siddharth Kashyap, Mark Dras, Usman Naseem,
- Abstract要約: アリン・カルチュラ(Align-Cultura)は、文化的アライメントのための2段階のパイプラインである。
CulTURAXはユネスコの文化分類に基づくHHH- Englishデータセットである。
Stage IIはCULTURAXを、汎用モデル、文化的に微調整されたモデル、オープンウェイトLLMでベンチマークする。
実証的に、文化的に微調整されたモデルは、関節HHHを4%-6%改善し、文化的な失敗を18%削減し、10%-12%の効率向上を実現し、漏れを0.3%に制限した。
- 参考スコア(独自算出の注目度): 19.134202394422285
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Cultural alignment in Large Language Models (LLMs) is essential for producing contextually aware, respectful, and trustworthy outputs. Without it, models risk generating stereotyped, insensitive, or misleading responses that fail to reflect cultural diversity w.r.t Helpful, Harmless, and Honest (HHH) paradigm. Existing benchmarks represent early steps toward cultural alignment; yet, no benchmarks currently enables systematic evaluation of cultural alignment in line with UNESCO's principles of cultural diversity w.r.t HHH paradigm. Therefore, to address this gap, we built Align-Cultura, two-stage pipeline for cultural alignment. Stage I constructs CULTURAX, the HHH-English dataset grounded in the UNESCO cultural taxonomy, through Query Construction, which reclassifies prompts, expands underrepresented domains (or labels), and prevents data leakage with SimHash. Then, Response Generation pairs prompts with culturally grounded responses via two-stage rejection sampling. The final dataset contains 1,500 samples spanning 30 subdomains of tangible and intangible cultural forms. Stage II benchmarks CULTURAX on general-purpose models, culturally fine-tuned models, and open-weight LLMs (Qwen3-8B and DeepSeek-R1-Distill-Qwen-7B). Empirically, culturally fine-tuned models improve joint HHH by 4%-6%, reduce cultural failures by 18%, achieve 10%-12% efficiency gains, and limit leakage to 0.3%.
- Abstract(参考訳): 大規模言語モデル(LLM)における文化的アライメントは、文脈的に認識され、尊敬され、信頼できるアウトプットを生成するために不可欠である。
それなしでは、モデルは文化的多様性を反映しないステレオタイプ、非感受性、または誤解を招く応答を生成するリスクを負う。
既存のベンチマークは、カルチャーアライメントに向けた初期のステップを表しているが、UNESCOの文化的多様性の原則であるHHHパラダイムに従って、現在、カルチャーアライメントを体系的に評価できるベンチマークは存在しない。
そのため、このギャップに対処するため、文化的なアライメントのための2段階パイプラインであるAlign-Culturaを構築しました。
Stage Iは、UNESCO文化分類に基づくHHH- EnglishデータセットであるCULTURAXを構築する。Query Constructionは、プロンプトを再分類し、表現されていないドメイン(またはラベル)を拡張し、SimHashによるデータ漏洩を防ぐ。
次に、レスポンスジェネレーションペアは、2段階の拒絶サンプリングを通じて文化的に根拠付けられた応答をプロンプトする。
最終データセットには、30のサブドメインにまたがる、有形および無形文化の1500のサンプルが含まれている。
Stage IIはCULTURAXを、汎用モデル、文化的に微調整されたモデル、オープンウェイトLLM(Qwen3-8BとDeepSeek-R1-Distill-Qwen-7B)でベンチマークしている。
実証的に、文化的に微調整されたモデルは、関節HHHを4%-6%改善し、文化的な失敗を18%削減し、10%-12%の効率向上を実現し、漏れを0.3%に制限した。
関連論文リスト
- Cultural Authenticity: Comparing LLM Cultural Representations to Native Human Expectations [7.285754268528876]
我々は,大規模言語モデル世代と局所的な期待値との整合性を評価するための,人間中心のフレームワークを提案する。
ヒト由来の文化遺産とモデル由来の文化表現との整合性について検討した結果,西洋中心のキャリブレーションが明らかとなった。
論文 参考訳(メタデータ) (2026-04-03T22:39:15Z) - CultureScope: A Dimensional Lens for Probing Cultural Understanding in LLMs [57.653830744706305]
CultureScopeは、大規模な言語モデルにおける文化的理解を評価するための、これまでで最も包括的な評価フレームワークである。
文化的な氷山理論に触発されて、文化知識分類のための新しい次元スキーマを設計する。
実験結果から,文化的理解を効果的に評価できることが示唆された。
論文 参考訳(メタデータ) (2025-09-19T17:47:48Z) - From Surveys to Narratives: Rethinking Cultural Value Adaptation in LLMs [62.9861554207279]
LLM(Large Language Models)における文化的価値の適応は大きな課題である。
これまでの作業は主に、World Values Survey (WVS)データを使用して、LLMをさまざまな文化的価値と整合させる。
我々は,文化価値適応のためのWVSベースのトレーニングについて検討し,調査データのみに頼って文化規範を実践し,事実知識に干渉することを発見した。
論文 参考訳(メタデータ) (2025-05-22T09:00:01Z) - CAReDiO: Cultural Alignment of LLM via Representativeness and Distinctiveness Guided Data Optimization [50.90288681622152]
大規模言語モデル(LLM)は、より深く様々な地域における人間の生活に統合される。
既存のアプローチは、文化固有のコーパスを微調整することで、文化的に整合したLCMを開発する。
本稿では,新しい文化データ構築フレームワークであるCAReDiOを紹介する。
論文 参考訳(メタデータ) (2025-04-09T13:40:13Z) - Can LLMs Grasp Implicit Cultural Values? Benchmarking LLMs' Cultural Intelligence with CQ-Bench [23.91961633899227]
文化インテリジェンス(文化インテリジェンス、英: Cultural Intelligence、略称:CQ)とは、文化の文脈を理解する能力のこと。
既存の研究は、しばしば明示された文化的規範に焦点を当てるが、日々の会話でよく見られる微妙で暗黙的な価値を捉えることに失敗する。
自然会話の文脈から暗黙的な文化的価値を推測するLLMの能力を評価するために設計されたベンチマークであるCQBenchを紹介する。
論文 参考訳(メタデータ) (2025-04-01T18:54:47Z) - CulturePark: Boosting Cross-cultural Understanding in Large Language Models [63.452948673344395]
本稿では,LLMを利用した文化データ収集のためのマルチエージェント通信フレームワークであるCultureParkを紹介する。
人間の信念、規範、習慣をカプセル化した高品質な異文化対話を生成する。
我々はこれらのモデルを,コンテンツモデレーション,文化的アライメント,文化教育という3つの下流課題にまたがって評価する。
論文 参考訳(メタデータ) (2024-05-24T01:49:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。