論文の概要: Reasoning Shapes Alignment: Investigating Cultural Alignment in Large Reasoning Models with Cultural Norms
- arxiv url: http://arxiv.org/abs/2511.13359v1
- Date: Mon, 17 Nov 2025 13:29:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-18 14:36:25.231518
- Title: Reasoning Shapes Alignment: Investigating Cultural Alignment in Large Reasoning Models with Cultural Norms
- Title(参考訳): 共振形アライメント:文化規範を用いた大規模共振モデルにおける文化的アライメントの検討
- Authors: Yuhang Wang, Yanxu Zhu, Jitao Sang,
- Abstract要約: 本稿では,文化規範と整合する強力な推論能力をモデルに活用する,文化規範に基づく文化的アライメント(CNCA)フレームワークを提案する。
2つのアライメントパラダイムについて検討する: コンテキスト内アライメント法と微調整に基づく手法で、改良されたChain-of-Thoughtトレーニングデータを通じて規範を内部化する。
本研究は、文化的に情報を得たアライメント戦略により、推論モデルが多種多様な人間の価値をよりよく反映する可能性を強調した。
- 参考スコア(独自算出の注目度): 31.988103618954536
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The advanced reasoning capabilities of Large Reasoning Models enable them to thoroughly understand and apply safety policies through deliberate thought processes, thereby improving the models' safety. Beyond safety, these models must also be able to reflect the diverse range of human values across various cultures. This paper presents the Cultural Norm-based Cultural Alignment (CNCA) framework, which enables models to leverage their powerful reasoning ability to align with cultural norms. Specifically, we propose three methods to automatically mine cultural norms from limited survey data and explore ways to effectively utilize these norms for improving cultural alignment. Two alignment paradigms are examined: an in-context alignment method, where cultural norms are explicitly integrated into the user context, and a fine-tuning-based method, which internalizes norms through enhanced Chain-of-Thought training data. Comprehensive experiments demonstrate the effectiveness of these methods, highlighting that models with stronger reasoning capabilities benefit more from cultural norm mining and utilization. Our findings emphasize the potential for reasoning models to better reflect diverse human values through culturally informed alignment strategies.
- Abstract(参考訳): 大規模推論モデルの高度な推論能力により、意図的な思考プロセスを通じて安全ポリシーを徹底的に理解し、適用することが可能になり、それによってモデルの安全性が向上する。
安全性以外にも、これらのモデルはさまざまな文化にまたがるさまざまな人間の価値を反映できなければならない。
本稿では,文化規範と整合する強力な推論能力をモデルに活用する,文化規範に基づく文化的アライメント(CNCA)フレームワークを提案する。
具体的には,限られた調査データから文化規範を自動的に抽出する3つの手法を提案し,これらの基準を効果的に活用して文化的アライメントを改善する方法について検討する。
2つのアライメントパラダイムについて検討し、文化規範をユーザコンテキストに明示的に統合するコンテキスト内アライメント手法と、改良されたChain-of-Thoughtトレーニングデータを通じて規範を内部化する微調整方式について検討した。
総合的な実験は、これらの手法の有効性を実証し、より強力な推論能力を持つモデルは、文化的なノルム採掘と利用の恩恵を受けることを強調した。
本研究は、文化的に情報を得たアライメント戦略により、推論モデルが多種多様な人間の価値をよりよく反映する可能性を強調した。
関連論文リスト
- CURE: Cultural Understanding and Reasoning Evaluation - A Framework for "Thick" Culture Alignment Evaluation in LLMs [24.598338950728234]
大規模言語モデル(LLM)は、文化的に多様な環境にますます展開されている。
既存の方法は、非文脈的正当性や強制選択判断に重点を置いている。
現実的な状況下でモデルを提示するベンチマークのセットを紹介する。
論文 参考訳(メタデータ) (2025-11-15T03:39:13Z) - Identity-Aware Large Language Models require Cultural Reasoning [3.1866496693431934]
我々は文化的な推論を、文化固有の知識価値と社会的規範を認識するためのモデルの能力として定義する。
文化は解釈、感情的共鳴、許容される行動を形成するため、文化的推論はアイデンティティを意識するAIにとって不可欠である。
文化的推論は、事実的正確性や言語的一貫性とともに基礎的な能力として扱われなければならないと我々は主張する。
論文 参考訳(メタデータ) (2025-10-21T10:50:51Z) - Cultural Alien Sampler: Open-ended art generation balancing originality and coherence [77.30507101341111]
本稿では,文化的な典型から構成的適合を分離する概念選択手法である文化異性サンプリング(CAS)を紹介する。
CASは、コヒーレンスが高く、典型性が低い組み合わせをターゲットにしており、学習慣行や組み込み文化の文脈から逸脱しながら内部の一貫性を維持するアイデアを生み出している。
論文 参考訳(メタデータ) (2025-10-21T09:32:46Z) - Hire Your Anthropologist! Rethinking Culture Benchmarks Through an Anthropological Lens [9.000522371422628]
ベンチマークのフレームカルチャーを分類する4つのフレームワークを紹介します。
20の文化指標を質的に検討し,6つの方法論的問題を同定した。
我々の目標は、静的リコールタスクを超える文化ベンチマークの開発をガイドすることです。
論文 参考訳(メタデータ) (2025-10-07T13:42:44Z) - CultureScope: A Dimensional Lens for Probing Cultural Understanding in LLMs [57.653830744706305]
CultureScopeは、大規模な言語モデルにおける文化的理解を評価するための、これまでで最も包括的な評価フレームワークである。
文化的な氷山理論に触発されて、文化知識分類のための新しい次元スキーマを設計する。
実験結果から,文化的理解を効果的に評価できることが示唆された。
論文 参考訳(メタデータ) (2025-09-19T17:47:48Z) - Culture is Everywhere: A Call for Intentionally Cultural Evaluation [36.20861746863831]
文献的文化的評価について論じる: 評価のあらゆる側面に埋め込まれた文化的仮定を体系的に検証するアプローチ。
我々は、現在のベンチマークプラクティスを超えて、意味と今後の方向性について議論する。
論文 参考訳(メタデータ) (2025-09-01T09:39:21Z) - Multimodal Cultural Safety: Evaluation Frameworks and Alignment Strategies [58.88053690412802]
大規模視覚言語モデル(LVLM)は、観光アシスタントのようなグローバルに分散したアプリケーションにますます導入されている。
CROSSは、LVLMの文化的安全性推論能力を評価するために設計されたベンチマークである。
実験モデルと推論モデルを含む21種類のLVLMを評価した。
論文 参考訳(メタデータ) (2025-05-20T23:20:38Z) - CAReDiO: Cultural Alignment of LLM via Representativeness and Distinctiveness Guided Data Optimization [50.90288681622152]
大規模言語モデル(LLM)は、より深く様々な地域における人間の生活に統合される。
既存のアプローチは、文化固有のコーパスを微調整することで、文化的に整合したLCMを開発する。
本稿では,新しい文化データ構築フレームワークであるCAReDiOを紹介する。
論文 参考訳(メタデータ) (2025-04-09T13:40:13Z) - Cultural Learning-Based Culture Adaptation of Language Models [70.1063219524999]
大きな言語モデル(LLM)をさまざまな文化的価値に適用することは難しい課題です。
文化的学習に基づくLLMと文化的価値との整合性を高めるための新しい枠組みであるCLCAについて述べる。
論文 参考訳(メタデータ) (2025-04-03T18:16:26Z) - Sociocultural Norm Similarities and Differences via Situational
Alignment and Explainable Textual Entailment [31.929550141633218]
本研究では,中国文化とアメリカ文化にまたがる社会規範の発見と比較のための新しいアプローチを提案する。
我々は、中国とアメリカの文化の社会状況に合わせて、3,069の社会的規範の高品質なデータセットを構築します。
モデルが文化全体にわたって社会的規範を推論する能力をテストするために,説明可能な社会的規範の包含という課題を導入する。
論文 参考訳(メタデータ) (2023-05-23T19:43:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。