論文の概要: The Granularity Axis: A Micro-to-Macro Latent Direction for Social Roles in Language Models
- arxiv url: http://arxiv.org/abs/2605.06196v1
- Date: Thu, 07 May 2026 13:08:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-08 22:27:11.811766
- Title: The Granularity Axis: A Micro-to-Macro Latent Direction for Social Roles in Language Models
- Title(参考訳): 粒度軸:言語モデルにおける社会的役割のためのマイクロ・マクロ・ラテント方向
- Authors: Chonghan Qin, Xiachong Feng, Ziyun Song, Xiaocheng Feng, Jing Xiong, Lingpeng Kong,
- Abstract要約: マイクロレベルの個人経験からマクロレベルの組織,制度的,あるいは国家的推論に至るまで,大きな言語モデルが社会的役割をコードしていることを示す。
以上の結果から,社会的役割の粒度は単にスタイリスティックな表面特徴ではなく,言語モデル行動における構造的,秩序的,因果的に操作可能な潜在方向である可能性が示唆された。
- 参考スコア(独自算出の注目度): 61.32031248060941
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large language models (LLMs) are routinely prompted to take on social roles ranging from individuals to institutions, yet it remains unclear whether their internal representations encode the granularity of such roles, from micro-level individual experience to macro-level organizational, institutional, or national reasoning. We show that they do. We define a contrast-based Granularity Axis as the difference between mean macro- and micro-role hidden states. In Qwen3-8B, this axis aligns with the principal axis (PC1) of the role representation space at cosine 0.972 and accounts for 52.6% of its variance, indicating that granularity is the dominant geometric axis organizing prompted social roles. We construct 75 social roles across five granularity levels and collect 91,200 role-conditioned responses over shared questions and prompt variants, then extract role-level hidden states and project them onto the axis. Role projections increase monotonically across all five levels, remain stable across layers, prompt variants, endpoint definitions, held-out splits, and score-filtered subsets, and transfer to Llama-3.1-8B-Instruct. The axis is also causally relevant: activation steering along it shifts response granularity in the predicted direction, with Llama moving from 2.00 to 3.17 on a five-point macro scale under positive steering on prompts that admit local responses. The two models differ in controllability, suggesting that steering depends on each model's default operating regime. Overall, our findings suggest that social role granularity is not merely a stylistic surface feature, but a structured, ordered, and causally manipulable latent direction in role-conditioned language model behavior.
- Abstract(参考訳): 大規模言語モデル(LLM)は、個人から機関まで、社会的役割を日常的に担うよう促されるが、その内部表現が、マイクロレベルの個人経験からマクロレベルの組織、制度的、あるいは国家的推論に至るまで、それらの役割の粒度をコードしているかどうかは不明である。
私たちは彼らがそうしていることを示します。
コントラストに基づくグラニュラリティ軸を平均マクロとマイクロロールの隠れ状態の差として定義する。
Qwen3-8Bでは、この軸はコサイン0.972における役割表現空間の主軸(PC1)と一致し、その分散の52.6%を占めており、粒度が社会的役割を誘導する支配的な幾何学的軸であることを示している。
我々は5つの粒度レベルにわたって75の社会的役割を構築し、共有された質問に対して91,200のロール条件の応答を収集し、変種を誘導し、役割レベルの隠された状態を抽出し、それらを軸に投影する。
ロールプロジェクションは5つのレベルすべてで単調に増加し、層をまたいで安定し、変種、エンドポイント定義、ホールドアウトスプリット、スコアフィルタサブセット、そしてLlama-3.1-8B-インストラクトに転送される。
アクティベーションステアリングは反応の粒度を予測方向にシフトさせ、Llamaは局所応答を許容するプロンプトで5点マクロスケールで2.00から3.17に移動する。
2つのモデルは制御性が異なるため、ステアリングは各モデルのデフォルトのオペレーティングシステムに依存している。
以上の結果から, 社会的役割の粒度は, 構造的, 秩序的, 因果的に操作可能な言語モデル行動の潜在方向である可能性が示唆された。
関連論文リスト
- When Roles Fail: Epistemic Constraints on Advocate Role Fidelity in LLM-Based Political Statement Analysis [0.0]
本稿では,モデルが割り当てられた役割を確実に維持するという仮定を,初めて体系的に実証した。
RDI(Role Drift Index)、EDD(Drift Distance)、DDI(Directional Drift Index)、ERS(Entropy-based Role stability)の4つの指標を用いて、60の政治声明における役割忠実度を測定した。
エピステミック・フロア・エフェクト(ファクト・チェックの結果は、正当性が維持できない絶対的な下位境界を作る)とロール・プライア・コンフリクト(学習時の知識が、事実的に曖昧な文に対して役割指示を上回る)の2つの障害モードを特定します。
論文 参考訳(メタデータ) (2026-04-29T21:50:28Z) - How role-play shapes relevance judgment in zero-shot LLM rankers [15.11127856890218]
大型言語モデル(LLM)がゼロショットローダとして登場した。
彼らのパフォーマンスは、迅速な定式化に非常に敏感です。
特に、ロールプレイプロンプトでは、モデルが機能的な役割やアイデンティティに割り当てられているため、より堅牢で正確な関連性ランキングが与えられることが多い。
論文 参考訳(メタデータ) (2025-10-20T13:39:48Z) - Evaluating LLM Alignment on Personality Inference from Real-World Interview Data [7.061237517845673]
大規模言語モデル(LLM)は、複雑な心理的理解を必要とする役割にますます配備されている。
このような応用の重要な側面である人間の性格特性を解釈する能力は、まだ解明されていない。
本研究では, 半構造化された面接書と, 検証された5つの特徴スコアを組み合わせた新しいベンチマークを提案する。
論文 参考訳(メタデータ) (2025-09-16T16:54:35Z) - RoleMRC: A Fine-Grained Composite Benchmark for Role-Playing and Instruction-Following [31.80357046048002]
ロールプレイングは、大規模言語モデルにとって、多様な指示に従うことが重要である。
既存のロールプレイングデータセットは、主にロールスタイルと知識境界の制御に寄与する。
本稿では,RoleMRCという詳細なロールプレイングと命令フォローのベンチマークを紹介する。
論文 参考訳(メタデータ) (2025-02-17T03:08:37Z) - When Prompting Fails to Sway: Inertia in Moral and Value Judgments of Large Language Models [4.906478894661688]
大規模言語モデル (LLMs) は非決定論的行動を示し、その出力を所望の方向に向けて操る主要な方法としてプロンプトが登場した。
一般的な戦略の一つは、人間の視点で見られる多様性に似た、より多様で文脈に敏感な反応を誘発するために、特定の「ペルソナ」をモデルに割り当てることである。
我々の実験は、LLMが一貫した値配向を維持することを示した。
特に,特定の道徳的・価値的次元,特に回避と公正さが,さまざまなペルソナ設定にもかかわらず,一方向に明確に歪められたままである,持続的慣性を観察する。
論文 参考訳(メタデータ) (2024-08-16T23:24:10Z) - SocialBench: Sociality Evaluation of Role-Playing Conversational Agents [85.6641890712617]
大規模言語モデル(LLM)は、様々なAI対話エージェントの開発を進めてきた。
SocialBenchは、ロールプレイングの会話エージェントの社会的性を個人レベルとグループレベルで評価するために設計された最初のベンチマークである。
個人レベルで優れたエージェントは,集団レベルでの熟練度を示唆しない。
論文 参考訳(メタデータ) (2024-03-20T15:38:36Z) - RoleLLM: Benchmarking, Eliciting, and Enhancing Role-Playing Abilities of Large Language Models [107.00832724504752]
大規模言語モデル(LLM)におけるロールプレイング能力をベンチマークし、評価し、拡張するフレームワークであるRoleLLMを紹介する。
Context-InstructとRoleGPTによって、168,093サンプルでロールプレイする最初の体系的できめ細かい文字レベルのベンチマークデータセットであるRoleBenchを作成します。
論文 参考訳(メタデータ) (2023-10-01T17:52:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。