論文の概要: SemaPop: Semantic-Persona Conditioned Population Synthesis
- arxiv url: http://arxiv.org/abs/2602.11569v1
- Date: Thu, 12 Feb 2026 04:44:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-13 21:07:25.642171
- Title: SemaPop: Semantic-Persona Conditioned Population Synthesis
- Title(参考訳): SemaPop:Semantic-Persona条件付き集団合成
- Authors: Zhenlin Qin, Yancheng Ling, Leizhen Wang, Francisco Câmara Pereira, Zhenliang Ma,
- Abstract要約: 本研究では,大言語モデル(LLM)と生成的集団モデルを統合する意味統計的集団合成モデルであるSemaPopを提案する。
本研究では、このフレームワークを、SemaPop-GANと呼ばれる勾配ペナルティ(WGAN-GP)のバックボーンを持つWasserstein GANを用いてインスタンス化する。
- 参考スコア(独自算出の注目度): 7.388951238297018
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Population synthesis is a critical component of individual-level socio-economic simulation, yet remains challenging due to the need to jointly represent statistical structure and latent behavioral semantics. Existing population synthesis approaches predominantly rely on structured attributes and statistical constraints, leaving a gap in semantic-conditioned population generation that can capture abstract behavioral patterns implicitly in survey data. This study proposes SemaPop, a semantic-statistical population synthesis model that integrates large language models (LLMs) with generative population modeling. SemaPop derives high-level persona representations from individual survey records and incorporates them as semantic conditioning signals for population generation, while marginal regularization is introduced to enforce alignment with target population marginals. In this study, the framework is instantiated using a Wasserstein GAN with gradient penalty (WGAN-GP) backbone, referred to as SemaPop-GAN. Extensive experiments demonstrate that SemaPop-GAN achieves improved generative performance, yielding closer alignment with target marginal and joint distributions while maintaining sample-level feasibility and diversity under semantic conditioning. Ablation studies further confirm the contribution of semantic persona conditioning and architectural design choices to balancing marginal consistency and structural realism. These results demonstrate that SemaPop-GAN enables controllable and interpretable population synthesis through effective semantic-statistical information fusion. SemaPop-GAN also provides a promising modular foundation for developing generative population projection systems that integrate individual-level behavioral semantics with population-level statistical constraints.
- Abstract(参考訳): 個体群合成は、個人レベルの社会経済シミュレーションにおいて重要な要素であるが、統計構造と潜在行動意味論を共同で表現する必要があるため、依然として困難である。
既存の人口合成アプローチは、主に構造化属性と統計的制約に依存しており、調査データに暗黙的に抽象的な行動パターンをキャプチャできる意味条件付き人口生成のギャップを残している。
本研究では,大言語モデル(LLM)と生成的集団モデルを統合する意味統計的集団合成モデルであるSemaPopを提案する。
SemaPopは、個々の調査記録からハイレベルなペルソナ表現を導き、それらを人口発生のセマンティックコンディショニング信号として組み入れ、一方、ターゲットの人口残高とのアライメントを強制するために、限界正規化を導入している。
本研究では、このフレームワークを、SemaPop-GANと呼ばれる勾配ペナルティ(WGAN-GP)のバックボーンを持つWasserstein GANを用いてインスタンス化する。
SemaPop-GANは, セマンティック条件下での試料レベルの実現可能性と多様性を維持しつつ, 目的の辺縁分布と関節分布との密接な整合性を達成し, 生産性能の向上を実証した。
アブレーション研究は、セマンティックペルソナ条件付けとアーキテクチャ設計の選択が限界整合性と構造的リアリズムのバランスに寄与していることをさらに確認する。
これらの結果から,SemaPop-GANは,効果的な意味統計情報融合を通じて,制御可能かつ解釈可能な集団合成を可能にすることが示された。
SemaPop-GANはまた、個人レベルの行動意味論と人口レベルの統計的制約を統合する世代予測システムを開発するための有望なモジュール基盤を提供する。
関連論文リスト
- Population-Aligned Persona Generation for LLM-based Social Simulation [58.84363795421489]
本稿では,社会シミュレーションのための高品質な集団対応ペルソナ集合を合成するための体系的枠組みを提案する。
我々のアプローチは、長期のソーシャルメディアデータから物語的ペルソナを生成するために、大きな言語モデルを活用することから始まる。
特定のシミュレーションコンテキストのニーズに対処するために,対象のサブポピュレーションに対してグローバルに整合したペルソナを適応させるタスク固有モジュールを提案する。
論文 参考訳(メタデータ) (2025-09-12T10:43:47Z) - Generating Feasible and Diverse Synthetic Populations Using Diffusion Models [5.689443449061003]
集団合成は、人口の人工的かつ現実的な表現を生成することに関わる重要な課題である。
深層生成モデルは、実際の集団に存在するがサンプルデータには存在しない可能性のある属性の組み合わせを合成することができる。
本研究では,新しい拡散モデルに基づく集団合成法を提案し,その基礎となる集団の結合分布を推定する。
論文 参考訳(メタデータ) (2025-08-06T03:11:27Z) - MF-LLM: Simulating Population Decision Dynamics via a Mean-Field Large Language Model Framework [53.82097200295448]
MF-LLM(Mean-Field LLM)は,まず平均場理論を社会シミュレーションに取り入れる。
MF-LLMは反復過程を通じて個人と人口間の双方向相互作用をモデル化する。
IB-Tuneは、Information Bottleneckの原理にインスパイアされた、新しい微調整手法である。
論文 参考訳(メタデータ) (2025-04-30T12:41:51Z) - A multi-objective combinatorial optimisation framework for large scale hierarchical population synthesis [1.2233362977312945]
エージェントベースのシミュレーションでは、エージェントの合成集団は個人の構造、行動、相互作用を表現するために一般的に使用される。
大規模集団合成のための多目的最適化手法を提案する。
提案手法は, 個人と世帯間の複雑な階層構造をサポートし, 大規模に拡張可能であり, 連続表復元誤差の最小化を実現する。
論文 参考訳(メタデータ) (2024-07-03T15:01:12Z) - Synthetic location trajectory generation using categorical diffusion
models [50.809683239937584]
拡散モデル(DPM)は急速に進化し、合成データのシミュレーションにおける主要な生成モデルの一つとなっている。
本稿では,個人が訪れた物理的位置を表す変数列である合成個別位置軌跡(ILT)の生成にDPMを用いることを提案する。
論文 参考訳(メタデータ) (2024-02-19T15:57:39Z) - Copula-based transferable models for synthetic population generation [1.370096215615823]
集団合成は、マイクロエージェントの標的集団の合成的かつ現実的な表現を生成することを含む。
従来の手法は、しばしばターゲットのサンプルに依存し、高いコストと小さなサンプルサイズのために制限に直面している。
本研究では,実験的辺縁分布のみが知られている対象個体群を対象とした合成データを生成するためのコプラに基づく新しい枠組みを提案する。
論文 参考訳(メタデータ) (2023-02-17T23:58:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。