論文の概要: German General Personas: A Survey-Derived Persona Prompt Collection for Population-Aligned LLM Studies
- arxiv url: http://arxiv.org/abs/2511.21722v1
- Date: Wed, 19 Nov 2025 19:01:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-07 19:06:32.36563
- Title: German General Personas: A Survey-Derived Persona Prompt Collection for Population-Aligned LLM Studies
- Title(参考訳): ドイツ・ジェネラル・ペルソナ : 人口適応型LDM研究のための調査対象ペルソナ・プロンプト・コレクション
- Authors: Jens Rupprecht, Leon Fröhling, Claudia Wagner, Markus Strohmaier,
- Abstract要約: ドイツ総合社会調査(ALLBUS)から構築された総合的かつ代表的なパーソナ・プロンプト・コレクションであるジャーマン・ジェネラル・ペルソナ・コレクション(GGP)を紹介する。
GGPとそのペルソナプロンプトは、全ての種類の大規模言語モデル(LLM)とタスクのプロンプトに簡単に接続できるように設計されており、下層のドイツ人人口に対応する応答を生成するために、モデルを操縦する。
- 参考スコア(独自算出の注目度): 2.416660506672577
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The use of Large Language Models (LLMs) for simulating human perspectives via persona prompting is gaining traction in computational social science. However, well-curated, empirically grounded persona collections remain scarce, limiting the accuracy and representativeness of such simulations. Here we introduce the German General Personas (GGP) collection, a comprehensive and representative persona prompt collection built from the German General Social Survey (ALLBUS). The GGP and its persona prompts are designed to be easily plugged into prompts for all types of LLMs and tasks, steering models to generate responses aligned with the underlying German population. We evaluate GGP by prompting various LLMs to simulate survey response distributions across diverse topics, demonstrating that GGP-guided LLMs outperform state-of-the-art classifiers, particularly under data scarcity. Furthermore, we analyze how the representativity and attribute selection within persona prompts affect alignment with population responses. Our findings suggest that GGP provides a potentially valuable resource for research on LLM-based social simulations that enables more systematic explorations of population-aligned persona prompting in NLP and social science research.
- Abstract(参考訳): 大きな言語モデル(LLMs)を用いて人格を推し進めることで人間の視点をシミュレートし、計算社会科学において注目を集めている。
しかし, よく計算された実証的なペルソナコレクションは乏しいままであり,これらのシミュレーションの精度と代表性は制限されている。
ここでは、ドイツの一般社会調査(ALLBUS)から構築された総合的かつ代表的な人格情報収集である、ドイツの一般人格収集(GGP)について紹介する。
GGPとそのペルソナプロンプトは、全ての種類のLSMとタスクのプロンプトに簡単に接続できるように設計されており、下層のドイツ人人口に対応する応答を生成するためのモデルが操られている。
我々は,各種LPMに対して,各種トピックを対象とした調査応答分布のシミュレートを促すことにより,GGP誘導LDMが最先端の分類器,特にデータ不足下でより優れていることを示す。
さらに,ペルソナにおける表現力と属性選択が,集団の反応にどのように影響するかを分析する。
以上の結果から,GGPは,NLP研究や社会科学研究において,より体系的な集団的ペルソナの探索を可能にする,LDMに基づく社会シミュレーションの研究に有用な資源となる可能性が示唆された。
関連論文リスト
- Prompts to Proxies: Emulating Human Preferences via a Compact LLM Ensemble [46.82793004650415]
大規模言語モデル(LLM)は、様々なタスクにまたがる人間のような応答をエミュレートする可能性を実証している。
本研究では,LLMをエージェントプロキシとして扱う新しいアライメントフレームワークを提案する。
我々は、構造化されたプロンプトエンジニアリング、エントロピーに基づくサンプリング、回帰に基づく選択を用いて、LLMエージェントを代表的行動パターンに向けて操るシステムであるP2Pを紹介する。
論文 参考訳(メタデータ) (2025-09-14T15:08:45Z) - Population-Aligned Persona Generation for LLM-based Social Simulation [58.84363795421489]
本稿では,社会シミュレーションのための高品質な集団対応ペルソナ集合を合成するための体系的枠組みを提案する。
我々のアプローチは、長期のソーシャルメディアデータから物語的ペルソナを生成するために、大きな言語モデルを活用することから始まる。
特定のシミュレーションコンテキストのニーズに対処するために,対象のサブポピュレーションに対してグローバルに整合したペルソナを適応させるタスク固有モジュールを提案する。
論文 参考訳(メタデータ) (2025-09-12T10:43:47Z) - Specializing Large Language Models to Simulate Survey Response Distributions for Global Populations [49.908708778200115]
我々は,調査応答分布をシミュレートする大規模言語モデル (LLM) を最初に開発した。
テストベッドとして、我々は2つの世界文化調査の国レベルの結果を使用します。
予測された応答分布と実際の応答分布のばらつきを最小限に抑えるために, ファースト・ツーケン確率に基づく微調整法を提案する。
論文 参考訳(メタデータ) (2025-02-10T21:59:27Z) - LLM-Mirror: A Generated-Persona Approach for Survey Pre-Testing [0.0]
統計的分布と個別意思決定パターンの両方を再現できるかどうかを検討する。
また,LLMに応答性固有の情報を供給することによって生成されるユーザペルソナであるLLM-Mirrorの概念についても紹介する。
PLS-SEM分析の結果, LLMはヒトの反応に一致し, LLMはヒトの反応を再現し, LLM-Mirror反応はヒトの反応に密接に従っていることがわかった。
論文 参考訳(メタデータ) (2024-12-04T09:39:56Z) - ChatGPT vs Social Surveys: Probing Objective and Subjective Silicon Population [7.281887764378982]
大規模言語モデル(LLM)は、社会調査における人間の反応をシミュレートし、信頼できる予測を生成する可能性を秘めている。
GPTにより生成したシリコン試料の集団パラメータを同定するサンプリング分布を生成するために,繰り返しサンプリングを用いる。
以上の結果から、GPTの人口分布は、性別と平均年齢の点で、2020年の米国人口と一致していることがわかった。
GPTの立位スコアの点推定は極めて矛盾しており、特定のイデオロギーに対する明確な傾きを示していない。
論文 参考訳(メタデータ) (2024-09-04T10:33:37Z) - On the steerability of large language models toward data-driven personas [98.9138902560793]
大規模言語モデル(LLM)は、特定のグループや集団の意見が不足している偏りのある応答を生成することが知られている。
本稿では, LLM を用いて特定の視点の制御可能な生成を実現するための新しい手法を提案する。
論文 参考訳(メタデータ) (2023-11-08T19:01:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。