論文の概要: Restoring Heterogeneity in LLM-based Social Simulation: An Audience Segmentation Approach
- arxiv url: http://arxiv.org/abs/2604.06663v1
- Date: Wed, 08 Apr 2026 04:29:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-09 17:30:51.333855
- Title: Restoring Heterogeneity in LLM-based Social Simulation: An Audience Segmentation Approach
- Title(参考訳): LLMを用いた社会シミュレーションにおける復元的不均一性:聴取セグメンテーションアプローチ
- Authors: Xiaoyou Qin, Zhihong Li, Xiaoxiao Cheng,
- Abstract要約: 大規模言語モデル(LLM)は、社会的態度や行動のシミュレートにますます利用されている。
現在のシミュレーションの実践は、しばしば多様性を「平均的なペルソナ」に分解し、社会現実の中心となるサブグループの変動をマスキングする。
本研究では,LLMに基づく社会シミュレーションにおける不均一性回復のための体系的アプローチとして,オーディエンスセグメンテーションを導入する。
- 参考スコア(独自算出の注目度): 1.8505047763172107
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Large Language Models (LLMs) are increasingly used to simulate social attitudes and behaviors, offering scalable "silicon samples" that can approximate human data. However, current simulation practice often collapses diversity into an "average persona," masking subgroup variation that is central to social reality. This study introduces audience segmentation as a systematic approach for restoring heterogeneity in LLM-based social simulation. Using U.S. climate-opinion survey data, we compare six segmentation configurations across two open-weight LLMs (Llama 3.1-70B and Mixtral 8x22B), varying segmentation identifier granularity, parsimony, and selection logic (theory-driven, data-driven, and instrument-based). We evaluate simulation performance with a three-dimensional evaluation framework covering distributional, structural, and predictive fidelity. Results show that increasing identifier granularity does not produce consistent improvement: moderate enrichment can improve performance, but further expansion does not reliably help and can worsen structural and predictive fidelity. Across parsimony comparisons, compact configurations often match or outperform more comprehensive alternatives, especially in structural and predictive fidelity, while distributional fidelity remains metric dependent. Identifier selection logic determines which fidelity dimension benefits most: instrument-based selection best preserves distributional shape, whereas data-driven selection best recovers between-group structure and identifier-outcome associations. Overall, no single configuration dominates all dimensions, and performance gains in one dimension can coincide with losses in another. These findings position audience segmentation as a core methodological approach for valid LLM-based social simulation and highlight the need for heterogeneity-aware evaluation and variance-preserving modeling strategies.
- Abstract(参考訳): 大規模言語モデル(LLM)は、人間のデータを近似できるスケーラブルな「シリコンサンプル」を提供することで、社会的態度や行動のシミュレートにますます利用されている。
しかし、現在のシミュレーションの実践は、しばしば多様性を「平均的なペルソナ」に分解し、社会現実の中心となるサブグループの変動を隠蔽する。
本研究では,LLMに基づく社会シミュレーションにおける不均一性回復のための体系的アプローチとして,オーディエンスセグメンテーションを導入する。
米国気候調査データを用いて、2つのオープンウェイトLLM(Llama 3.1-70BとMixtral 8x22B)、様々なセグメンテーション識別子の粒度、パーシモニー、選択論理(理論駆動、データ駆動、機器ベース)の6つのセグメンテーション構成を比較した。
分布的,構造的,予測的忠実度を考慮した3次元評価フレームワークを用いてシミュレーション性能を評価する。
その結果、識別子の粒度の増大が一貫した改善をもたらすことが示され、中程度の富化は性能を向上させるが、さらなる拡張は確実な助けにはならず、構造的および予測的忠実度を悪化させる可能性がある。
パーシモニー比較全体において、コンパクトな構成は、特に構造的および予測的忠実性において、より包括的な代替物、特に分布的忠実性はメートル法に依存している。
Identifier selection logicは、どの忠実度次元が最も利益があるかを判断する: 楽器ベースの選択は、分布の形状を最もよく保存するが、データ駆動の選択は、グループ構造と識別子のアウトカム関連を最もよく回復する。
全体として、1つの構成がすべての次元を支配することはなく、ある次元における性能向上は他の次元における損失と一致する可能性がある。
これらの結果から,LLMに基づく社会シミュレーションの手法として,聴衆のセグメンテーションが重要視され,不均一性を考慮した評価と分散保存モデル戦略の必要性が浮き彫りになった。
関連論文リスト
- Bridging the Semantic Gap for Categorical Data Clustering via Large Language Models [64.58262227709842]
ARISE(Attention-weighted Representation with Integrated Semantic Embeddings)が紹介される。
正確なクラスタリングのためにカテゴリデータのメトリック空間を補完するセマンティックアウェア表現を構築する。
8つのベンチマークデータセットの実験では、7つの代表的なデータセットよりも一貫した改善が示されている。
論文 参考訳(メタデータ) (2026-01-03T11:37:46Z) - No-rank Tensor Decomposition Using Metric Learning [0.0]
本稿では,計量学習に基づく非ランクテンソル分解フレームワークを提案する。
フレームワークの収束に関する理論的保証を提供し、その計量特性の有界性を確立する。
提案手法は, トランスフォーマーに基づく手法と比較して, より少ないトレーニングデータセットで優れた性能を実現する。
論文 参考訳(メタデータ) (2025-11-03T18:21:53Z) - Stratified GRPO: Handling Structural Heterogeneity in Reinforcement Learning of LLM Search Agents [90.45197506653341]
大規模言語モデル(LLM)エージェントは、複雑なマルチステップ問題を解決するために、検索エンジンのような外部ツールに依存している。
サーチエージェントの軌道は構造的に不均一であり、サーチコールの数、配置、結果の変動は、根本的に異なる応答方向と報酬分布をもたらす。
1つのグローバルベースラインを使用する標準方針勾配法は、私たちが認識し、層間バイアスとして定式化するものに苦しむ。
本稿では,SAN (Stratified Advantage Normalization) の中心成分であるStratified GRPOを提案する。
論文 参考訳(メタデータ) (2025-10-07T17:59:13Z) - HEAS: Hierarchical Evolutionary Agent Simulation Framework for Cross-Scale Modeling and Multi-Objective Search [4.807104001943257]
階層シミュレーションエージェント(Hierarchical Simulation Agent, HEAS)は、階層化されたエージェントベースのモデリングを進化的最適化とトーナメント評価で統合するPythonフレームワークである。
HEASは、共有コンテキストを読み書きする決定論的レイヤにスケジュールされた軽量プロセス(ストリーム)の階層としてモデルを表現する。
compact APIとCLIは、シングルオブジェクトとマルチオブジェクトの進化をシミュレートし、最適化し、評価します。
論文 参考訳(メタデータ) (2025-08-21T13:35:46Z) - NDCG-Consistent Softmax Approximation with Accelerated Convergence [67.10365329542365]
本稿では,ランキングの指標と直接一致した新たな損失定式化を提案する。
提案したRG損失を高効率な Alternating Least Squares (ALS) 最適化手法と統合する。
実世界のデータセットに対する実証的な評価は、我々のアプローチが同等または上位のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2025-06-11T06:59:17Z) - Prismatic Synthesis: Gradient-based Data Diversification Boosts Generalization in LLM Reasoning [77.120955854093]
我々は,データ多様性が言語モデルにおける一般化の強力な予測因子であることを示す。
モデル誘起勾配のエントロピーを通して多様性を定量化する計量であるG-Vendiを導入する。
多様な合成データを生成するためのフレームワークであるPrismatic Synthesisを提案する。
論文 参考訳(メタデータ) (2025-05-26T16:05:10Z) - MF-LLM: Simulating Population Decision Dynamics via a Mean-Field Large Language Model Framework [53.82097200295448]
MF-LLM(Mean-Field LLM)は,まず平均場理論を社会シミュレーションに取り入れる。
MF-LLMは反復過程を通じて個人と人口間の双方向相互作用をモデル化する。
IB-Tuneは、Information Bottleneckの原理にインスパイアされた、新しい微調整手法である。
論文 参考訳(メタデータ) (2025-04-30T12:41:51Z) - Testing Generalizability in Causal Inference [3.547529079746247]
機械学習アルゴリズムの一般化性を統計的に評価するための公式な手続きは存在しない。
本研究では,高次元因果推論モデルの一般化可能性を統計的に評価するための体系的枠組みを提案する。
論文 参考訳(メタデータ) (2024-11-05T11:44:00Z) - A distribution-free mixed-integer optimization approach to hierarchical modelling of clustered and longitudinal data [0.0]
我々は,新しいデータポイントに対するクラスタ効果を評価する革新的なアルゴリズムを導入し,このモデルのロバスト性や精度を高める。
このアプローチの推論的および予測的効果は、学生のスコアリングとタンパク質発現に適用することでさらに説明される。
論文 参考訳(メタデータ) (2023-02-06T23:34:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。