論文の概要: DVMap: Fine-Grained Pluralistic Value Alignment via High-Consensus Demographic-Value Mapping
- arxiv url: http://arxiv.org/abs/2605.14420v1
- Date: Thu, 14 May 2026 06:06:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-15 21:45:34.654316
- Title: DVMap: Fine-Grained Pluralistic Value Alignment via High-Consensus Demographic-Value Mapping
- Title(参考訳): DVMap: 高コンセンサス復号値マッピングによる細粒多元値アライメント
- Authors: Pengyun Zhu, Yuqi Ren, Zhen Wang, Lei Yang, Deyi Xiong,
- Abstract要約: 現在のLarge Language Models (LLMs) は通常、多元的値アライメントのために粗い粒度の国家ラベルに依存している。
この制限を解消するには、国家ラベルから多次元の人口統計制約に移行する必要があると我々は主張する。
DVMap(DVMap)は,微細な多元値アライメントのためのフレームワークである。
- 参考スコア(独自算出の注目度): 49.402442592047855
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Current Large Language Models (LLMs) typically rely on coarse-grained national labels for pluralistic value alignment. However, such macro-level supervision often obscures intra-country value heterogeneity, yielding a loose alignment. We argue that resolving this limitation requires shifting from national labels to multi-dimensional demographic constraints, which can identify groups with predictable, high-consensus value preference. To this end, we propose DVMap (High-Consensus Demographic-Value Mapping), a framework for fine-grained pluralistic value alignment. In this framework, we first present a demographic archetype extraction strategy to construct a high-quality value alignment corpus of 56,152 samples from the World Values Survey (WVS) by strictly retaining respondents with consistent value preferences under identical demographics. Over this corpus, we introduce a Structured Chain-of-Thought (CoT) mechanism that explicitly guides LLMs to reason about demographic-value correlations. Subsequently, we employ Group Relative Policy Optimization (GRPO) to achieve adaptive anchoring of value distributions. To rigorously evaluate generalization, we further establish a triple-generalization benchmark (spanning cross-demographic, cross-country, and cross-value) comprising 21,553 samples. Experimental results demonstrate that DVMap effectively learns the manifold mapping from demographics to values, exhibiting strong generalization and robustness. On cross-demographic tests, Qwen3-8B-DVMap achieves 48.6% accuracy, surpassing the advanced open-source LLM DeepSeek-v3.2 (45.1%). The source code and dataset are available at https://github.com/EnlightenedAI/DVMap.
- Abstract(参考訳): 現在のLarge Language Models (LLMs) は通常、多元的値アライメントのために粗い粒度の国家ラベルに依存している。
しかし、そのようなマクロレベルの監督は、しばしば郡内の値の不均一性を曖昧にし、緩やかなアライメントをもたらす。
この制限を解消するためには、予測可能で高合意の値優先性を持つグループを識別できる、国家ラベルから多次元の人口統計制約へ移行する必要がある、と我々は主張する。
そこで我々はDVMap(High-Consensus Demographic-Value Mapping)を提案する。
本稿では,まず,世界価値調査(WVS)から得られた56,152サンプルの高品質な値アライメントコーパスを構築するための,人口統計学的アーキタイプ抽出戦略を提案する。
このコーパス上では、人口統計値の相関についてLSMを明示的に導く構造的チェーン・オブ・ソート(CoT)機構を導入する。
次に、価値分布の適応的アンカー化を実現するために、グループ相対政策最適化(GRPO)を用いる。
一般化を厳密に評価するために,21,553個のサンプルからなる三次一般化ベンチマーク(クロスデデデモグラフィ,クロスカントリー,クロスバリュー)を構築した。
実験の結果、DVMapは人口統計学から値への多様体マッピングを効果的に学習し、強力な一般化とロバスト性を示した。
クロスデコグラフィーテストでは、Qwen3-8B-DVMapは48.6%の精度を達成し、高度なオープンソースのLLM DeepSeek-v3.2 (45.1%)を上回った。
ソースコードとデータセットはhttps://github.com/EnlightenedAI/DVMapで入手できる。
関連論文リスト
- Can Persona-Prompted LLMs Emulate Subgroup Values? An Empirical Analysis of Generalisability and Fairness in Cultural Alignment [75.88231994139132]
GPT-4.1のような最先端モデルでさえ、モーダル選好を予測する精度は57.4%に過ぎなかった。
モデルでは、若者、男性、中国人、キリスト教のペルソナをよりうまくエミュレートする。
論文 参考訳(メタデータ) (2026-04-14T15:06:13Z) - Distributional Open-Ended Evaluation of LLM Cultural Value Alignment Based on Value Codebook [50.10594064510559]
DOVEは、人文テキストとLLM出力を直接比較する分散評価フレームワークである。
DOVEは, ダウンストリームタスクと31.56%の相関を達成し, 高い信頼性を保ちながら, 文化ごとのサンプル500点程度の信頼性を維持した。
論文 参考訳(メタデータ) (2026-03-16T08:33:10Z) - PANC: Prior-Aware Normalized Cut for Object Segmentation [0.0]
本稿では,最小限の注釈付き視覚トークンを用いた弱教師付きスペクトルセグメンテーションフレームワークを提案する。
均質, 細粒, テクスチャ制限ドメインについて, 強い結果を報告した。
マルチオブジェクトベンチマークでは、明示的でユーザ制御可能なセマンティックセマンティックセグメンテーションが紹介されている。
論文 参考訳(メタデータ) (2026-02-06T18:07:20Z) - Where on Earth? A Vision-Language Benchmark for Probing Model Geolocation Skills Across Scales [61.03549470159347]
視覚言語モデル (VLM) は急速に進歩しているが, オープンワールド環境における画像位置決め能力は, 網羅的に評価されていない。
我々は、視覚認識、ステップバイステップ推論、エビデンス利用を評価するVLM画像位置情報の総合ベンチマークであるEarthWhereを提示する。
論文 参考訳(メタデータ) (2025-10-13T01:12:21Z) - MVPBench: A Benchmark and Fine-Tuning Framework for Aligning Large Language Models with Diverse Human Values [23.048484118383616]
MVPBenchは,75か国にわたる大規模言語モデルの人的価値との整合性を評価する新しいベンチマークである。
MVPBenchを用いて、いくつかの最先端LCMの詳細な分析を行い、地理的および人口統計学的ライン間でのアライメント性能の相違を明らかにした。
本研究は, 文化的適応性, 価値観に敏感なLDMを構築する上で, 人口適応型アライメント評価の必要性を明らかにするものである。
論文 参考訳(メタデータ) (2025-09-09T09:25:08Z) - GEOBench-VLM: Benchmarking Vision-Language Models for Geospatial Tasks [84.86699025256705]
本稿では,地理空間的タスクの視覚言語モデル(VLM)を評価するためのベンチマークであるGEOBench-VLMを提案する。
私たちのベンチマークでは、手動で検証された命令が1万以上あり、さまざまな視覚条件、オブジェクトタイプ、スケールにまたがっています。
地理空間固有の課題における性能を評価するために,いくつかの最先端のVLMを評価した。
論文 参考訳(メタデータ) (2024-11-28T18:59:56Z) - Rethinking Localization Map: Towards Accurate Object Perception with
Self-Enhancement Maps [78.2581910688094]
本研究は, カテゴリーラベルのみを監督として, 正確な対象位置分布マップと対象境界を抽出する, 新たな自己強調手法を提案する。
特に、提案されたセルフエンハンスメントマップは、ILSVRC上で54.88%の最先端のローカライゼーション精度を達成する。
論文 参考訳(メタデータ) (2020-06-09T12:35:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。