論文の概要: SemaPop: Semantic-Persona Conditioned Population Synthesis
- arxiv url: http://arxiv.org/abs/2602.11569v1
- Date: Thu, 12 Feb 2026 04:44:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-13 21:07:25.642171
- Title: SemaPop: Semantic-Persona Conditioned Population Synthesis
- Title(参考訳): SemaPop:Semantic-Persona条件付き集団合成
- Authors: Zhenlin Qin, Yancheng Ling, Leizhen Wang, Francisco Câmara Pereira, Zhenliang Ma,
- Abstract要約: 本研究では,大言語モデル(LLM)と生成的集団モデルを統合する意味統計的集団合成モデルであるSemaPopを提案する。
本研究では、このフレームワークを、SemaPop-GANと呼ばれる勾配ペナルティ(WGAN-GP)のバックボーンを持つWasserstein GANを用いてインスタンス化する。
- 参考スコア(独自算出の注目度): 7.388951238297018
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Population synthesis is a critical component of individual-level socio-economic simulation, yet remains challenging due to the need to jointly represent statistical structure and latent behavioral semantics. Existing population synthesis approaches predominantly rely on structured attributes and statistical constraints, leaving a gap in semantic-conditioned population generation that can capture abstract behavioral patterns implicitly in survey data. This study proposes SemaPop, a semantic-statistical population synthesis model that integrates large language models (LLMs) with generative population modeling. SemaPop derives high-level persona representations from individual survey records and incorporates them as semantic conditioning signals for population generation, while marginal regularization is introduced to enforce alignment with target population marginals. In this study, the framework is instantiated using a Wasserstein GAN with gradient penalty (WGAN-GP) backbone, referred to as SemaPop-GAN. Extensive experiments demonstrate that SemaPop-GAN achieves improved generative performance, yielding closer alignment with target marginal and joint distributions while maintaining sample-level feasibility and diversity under semantic conditioning. Ablation studies further confirm the contribution of semantic persona conditioning and architectural design choices to balancing marginal consistency and structural realism. These results demonstrate that SemaPop-GAN enables controllable and interpretable population synthesis through effective semantic-statistical information fusion. SemaPop-GAN also provides a promising modular foundation for developing generative population projection systems that integrate individual-level behavioral semantics with population-level statistical constraints.
- Abstract(参考訳): 個体群合成は、個人レベルの社会経済シミュレーションにおいて重要な要素であるが、統計構造と潜在行動意味論を共同で表現する必要があるため、依然として困難である。
既存の人口合成アプローチは、主に構造化属性と統計的制約に依存しており、調査データに暗黙的に抽象的な行動パターンをキャプチャできる意味条件付き人口生成のギャップを残している。
本研究では,大言語モデル(LLM)と生成的集団モデルを統合する意味統計的集団合成モデルであるSemaPopを提案する。
SemaPopは、個々の調査記録からハイレベルなペルソナ表現を導き、それらを人口発生のセマンティックコンディショニング信号として組み入れ、一方、ターゲットの人口残高とのアライメントを強制するために、限界正規化を導入している。
本研究では、このフレームワークを、SemaPop-GANと呼ばれる勾配ペナルティ(WGAN-GP)のバックボーンを持つWasserstein GANを用いてインスタンス化する。
SemaPop-GANは, セマンティック条件下での試料レベルの実現可能性と多様性を維持しつつ, 目的の辺縁分布と関節分布との密接な整合性を達成し, 生産性能の向上を実証した。
アブレーション研究は、セマンティックペルソナ条件付けとアーキテクチャ設計の選択が限界整合性と構造的リアリズムのバランスに寄与していることをさらに確認する。
これらの結果から,SemaPop-GANは,効果的な意味統計情報融合を通じて,制御可能かつ解釈可能な集団合成を可能にすることが示された。
SemaPop-GANはまた、個人レベルの行動意味論と人口レベルの統計的制約を統合する世代予測システムを開発するための有望なモジュール基盤を提供する。
関連論文リスト
- The Statistical Signature of LLMs [1.3135750017147134]
統計的正則性に関する単純なモデルに依存しない尺度は、生成規則を表面テキストと直接区別することを示す。
設定全体にわたって、圧縮は確率的生成の永続的な構造的シグネチャを明らかにする。
本研究は, 生成システムがいかにテキスト生産を再構築するかを定量化するための, シンプルで堅牢なフレームワークを提案する。
論文 参考訳(メタデータ) (2026-02-20T11:33:37Z) - Prompts to Proxies: Emulating Human Preferences via a Compact LLM Ensemble [46.82793004650415]
大規模言語モデル(LLM)は、様々なタスクにまたがる人間のような応答をエミュレートする可能性を実証している。
本研究では,LLMをエージェントプロキシとして扱う新しいアライメントフレームワークを提案する。
我々は、構造化されたプロンプトエンジニアリング、エントロピーに基づくサンプリング、回帰に基づく選択を用いて、LLMエージェントを代表的行動パターンに向けて操るシステムであるP2Pを紹介する。
論文 参考訳(メタデータ) (2025-09-14T15:08:45Z) - Population-Aligned Persona Generation for LLM-based Social Simulation [58.84363795421489]
本稿では,社会シミュレーションのための高品質な集団対応ペルソナ集合を合成するための体系的枠組みを提案する。
我々のアプローチは、長期のソーシャルメディアデータから物語的ペルソナを生成するために、大きな言語モデルを活用することから始まる。
特定のシミュレーションコンテキストのニーズに対処するために,対象のサブポピュレーションに対してグローバルに整合したペルソナを適応させるタスク固有モジュールを提案する。
論文 参考訳(メタデータ) (2025-09-12T10:43:47Z) - Generating Feasible and Diverse Synthetic Populations Using Diffusion Models [5.689443449061003]
集団合成は、人口の人工的かつ現実的な表現を生成することに関わる重要な課題である。
深層生成モデルは、実際の集団に存在するがサンプルデータには存在しない可能性のある属性の組み合わせを合成することができる。
本研究では,新しい拡散モデルに基づく集団合成法を提案し,その基礎となる集団の結合分布を推定する。
論文 参考訳(メタデータ) (2025-08-06T03:11:27Z) - Prismatic Synthesis: Gradient-based Data Diversification Boosts Generalization in LLM Reasoning [77.120955854093]
我々は,データ多様性が言語モデルにおける一般化の強力な予測因子であることを示す。
モデル誘起勾配のエントロピーを通して多様性を定量化する計量であるG-Vendiを導入する。
多様な合成データを生成するためのフレームワークであるPrismatic Synthesisを提案する。
論文 参考訳(メタデータ) (2025-05-26T16:05:10Z) - MF-LLM: Simulating Population Decision Dynamics via a Mean-Field Large Language Model Framework [53.82097200295448]
MF-LLM(Mean-Field LLM)は,まず平均場理論を社会シミュレーションに取り入れる。
MF-LLMは反復過程を通じて個人と人口間の双方向相互作用をモデル化する。
IB-Tuneは、Information Bottleneckの原理にインスパイアされた、新しい微調整手法である。
論文 参考訳(メタデータ) (2025-04-30T12:41:51Z) - A multi-objective combinatorial optimisation framework for large scale hierarchical population synthesis [1.2233362977312945]
エージェントベースのシミュレーションでは、エージェントの合成集団は個人の構造、行動、相互作用を表現するために一般的に使用される。
大規模集団合成のための多目的最適化手法を提案する。
提案手法は, 個人と世帯間の複雑な階層構造をサポートし, 大規模に拡張可能であり, 連続表復元誤差の最小化を実現する。
論文 参考訳(メタデータ) (2024-07-03T15:01:12Z) - A Deep Generative Framework for Joint Households and Individuals Population Synthesis [0.562479170374811]
世帯・個人・個人・個人関係を持つ合成集団を創出するための深い生成枠組みを提案する。
米国デラウェア州での申請の結果は、生成された家庭内レコードのリアリズムを確実にする能力を示している。
論文 参考訳(メタデータ) (2024-06-30T23:01:58Z) - Synthetic location trajectory generation using categorical diffusion
models [50.809683239937584]
拡散モデル(DPM)は急速に進化し、合成データのシミュレーションにおける主要な生成モデルの一つとなっている。
本稿では,個人が訪れた物理的位置を表す変数列である合成個別位置軌跡(ILT)の生成にDPMを用いることを提案する。
論文 参考訳(メタデータ) (2024-02-19T15:57:39Z) - Copula-based transferable models for synthetic population generation [1.370096215615823]
集団合成は、マイクロエージェントの標的集団の合成的かつ現実的な表現を生成することを含む。
従来の手法は、しばしばターゲットのサンプルに依存し、高いコストと小さなサンプルサイズのために制限に直面している。
本研究では,実験的辺縁分布のみが知られている対象個体群を対象とした合成データを生成するためのコプラに基づく新しい枠組みを提案する。
論文 参考訳(メタデータ) (2023-02-17T23:58:14Z) - A comprehensive comparative evaluation and analysis of Distributional
Semantic Models [61.41800660636555]
我々は、静的DSMによって生成されたり、BERTによって生成された文脈化されたベクトルを平均化して得られるような、型分布ベクトルの包括的評価を行う。
その結果、予測ベースモデルの優越性は現実よりも明らかであり、ユビキタスではないことが明らかとなった。
我々は認知神経科学からRepresentational similarity Analysis(RSA)の方法論を借りて、分布モデルによって生成された意味空間を検査する。
論文 参考訳(メタデータ) (2021-05-20T15:18:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。