論文の概要: Persona Generators: Generating Diverse Synthetic Personas at Scale
- arxiv url: http://arxiv.org/abs/2602.03545v1
- Date: Tue, 03 Feb 2026 13:59:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-04 18:37:15.487323
- Title: Persona Generators: Generating Diverse Synthetic Personas at Scale
- Title(参考訳): ペルソナジェネレータ:スケールでの異種合成ペルソナの生成
- Authors: Davide Paglieri, Logan Cross, William A. Cunningham, Joel Z. Leibo, Alexander Sasha Vezhnevets,
- Abstract要約: 人間と対話するAIシステムを評価するには、多様なユーザー集団の振る舞いを理解する必要がある。
生成エージェントベースモデリングにおける最近の研究は、大きな言語モデルが人間のような合成ペルソナを高い忠実度でシミュレートできることを示してきた。
本稿では,任意の状況に合わせて多様な合成集団を生成できるペルソナジェネレータを紹介する。
- 参考スコア(独自算出の注目度): 43.73350076375402
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Evaluating AI systems that interact with humans requires understanding their behavior across diverse user populations, but collecting representative human data is often expensive or infeasible, particularly for novel technologies or hypothetical future scenarios. Recent work in Generative Agent-Based Modeling has shown that large language models can simulate human-like synthetic personas with high fidelity, accurately reproducing the beliefs and behaviors of specific individuals. However, most approaches require detailed data about target populations and often prioritize density matching (replicating what is most probable) rather than support coverage (spanning what is possible), leaving long-tail behaviors underexplored. We introduce Persona Generators, functions that can produce diverse synthetic populations tailored to arbitrary contexts. We apply an iterative improvement loop based on AlphaEvolve, using large language models as mutation operators to refine our Persona Generator code over hundreds of iterations. The optimization process produces lightweight Persona Generators that can automatically expand small descriptions into populations of diverse synthetic personas that maximize coverage of opinions and preferences along relevant diversity axes. We demonstrate that evolved generators substantially outperform existing baselines across six diversity metrics on held-out contexts, producing populations that span rare trait combinations difficult to achieve in standard LLM outputs.
- Abstract(参考訳): 人間と対話するAIシステムを評価するには、多様なユーザー集団にわたる行動を理解する必要があるが、代表的人間のデータ収集は、特に新しい技術や仮説的な将来のシナリオにおいて、しばしば高価または実現不可能である。
近年のジェネレーティブ・エージェント・ベース・モデリングの研究は、大きな言語モデルが人間のような合成ペルソナを高い忠実度でシミュレートし、特定の個人の信念や振る舞いを正確に再現できることを示した。
しかし、ほとんどのアプローチでは、ターゲットの個体数に関する詳細なデータを必要とし、多くの場合、カバー範囲(可能な範囲を拡大する)を支持するよりも、密度マッチング(最も可能性の高いものを複製する)を優先し、長い尾の振る舞いを過小評価する。
本稿では,任意の状況に合わせて多様な合成集団を生成できるペルソナジェネレータを紹介する。
我々はAlphaEvolveに基づく反復改善ループを適用し、大規模な言語モデルを突然変異演算子として使用し、ペルソナジェネレータのコードを数百回にわたって洗練する。
最適化プロセスは軽量のペルソナジェネレータを生産し、小さな記述を多様な合成ペルソナの集団に自動的に拡張し、関連する多様性軸に沿った意見や好みのカバレッジを最大化する。
進化したジェネレータは、6つの多様性指標の保持状況において、既存のベースラインを大幅に上回り、標準LLM出力において達成し難い稀な特性の組み合わせにまたがる人口を生み出すことを実証した。
関連論文リスト
- HumanLLM: Towards Personalized Understanding and Simulation of Human Nature [72.55730315685837]
HumanLLMは個人のパーソナライズされた理解とシミュレーションのために設計された基礎モデルである。
私たちはまず、Reddit、Twitter、Blogger、Amazonといったプラットフォーム上で、現実世界のユーザデータをキュレートした大規模なコーパスであるCognitive Genomeを構築しました。
次に、多様な学習タスクを定式化し、教師付き微調整を行い、モデルの幅広い個人化された人間の行動、思考、経験を予測する。
論文 参考訳(メタデータ) (2026-01-22T09:27:27Z) - CEDex: Cross-Embodiment Dexterous Grasp Generation at Scale from Human-like Contact Representations [53.37721117405022]
クロス・エボディメント・デキスタラス・グリップ合成(Cross-Embodiment dexterous grasp synthesis)とは、様々なロボットハンドのグリップを適応的に生成し、最適化することである。
そこで我々は,CEDexを提案する。
これまでで最大のクロス・エボディメント・グラウンド・データセットを構築し、合計20万のグリップを持つ4つのタイプにまたがる500万のオブジェクトからなる。
論文 参考訳(メタデータ) (2025-09-29T12:08:04Z) - Population-Aligned Persona Generation for LLM-based Social Simulation [58.84363795421489]
本稿では,社会シミュレーションのための高品質な集団対応ペルソナ集合を合成するための体系的枠組みを提案する。
我々のアプローチは、長期のソーシャルメディアデータから物語的ペルソナを生成するために、大きな言語モデルを活用することから始まる。
特定のシミュレーションコンテキストのニーズに対処するために,対象のサブポピュレーションに対してグローバルに整合したペルソナを適応させるタスク固有モジュールを提案する。
論文 参考訳(メタデータ) (2025-09-12T10:43:47Z) - Large language model as user daily behavior data generator: balancing population diversity and individual personality [12.464365435176099]
本稿では,大規模言語モデルを用いて高品質な合成行動データを生成するフレームワークであるBehavimentGenを紹介する。
プロファイルと実際のイベントに基づいてユーザの振る舞いをシミュレートすることで、BehavimentGenは行動予測モデルにおけるデータ拡張と置換をサポートする。
我々は,その性能を,強化,微調整,微調整などのシナリオで評価し,人間の移動性やスマートフォン利用予測の大幅な改善を実現した。
論文 参考訳(メタデータ) (2025-05-23T08:22:09Z) - Gen-C: Populating Virtual Worlds with Generative Crowds [2.1716667622896195]
本稿では,エージェントエージェントとエージェント環境の相互作用をキャプチャするクラウドシナリオを生成する生成フレームワークであるGenerative Crowds (Gen-C)を紹介する。
Gen-Cはデュアル変分グラフオートエンコーダ(VGAE)アーキテクチャを採用しており、接続パターンと、テキスト信号と構造信号で条件付けられたノードの特徴を共同で学習する。
我々は、大学キャンパスや駅など多様な行動のシナリオにおけるGen-Cの有効性を実証する。
論文 参考訳(メタデータ) (2025-04-02T17:33:53Z) - On the steerability of large language models toward data-driven personas [98.9138902560793]
大規模言語モデル(LLM)は、特定のグループや集団の意見が不足している偏りのある応答を生成することが知られている。
本稿では, LLM を用いて特定の視点の制御可能な生成を実現するための新しい手法を提案する。
論文 参考訳(メタデータ) (2023-11-08T19:01:13Z) - What Comes Next? Evaluating Uncertainty in Neural Text Generators
Against Human Production Variability [28.403105682913374]
我々は,4つの自然言語生成(NLG)タスクにおいて,人間の生産が語彙的に,構文的に,意味的に変化する範囲を特徴付ける。
次に、生成系の予測確率分布と復号化アルゴリズムによって形成される出力文字列の空間を調べ、その不確実性を探索する。
我々は、NLGモデルと復号化戦略を分析し、複数のサンプルを持つジェネレータを探索することで、モデルの不確実性表現を理解するのに必要な詳細レベルが提供されることを示した。
論文 参考訳(メタデータ) (2023-05-19T14:41:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。