論文の概要: CrowdLLM: Building LLM-Based Digital Populations Augmented with Generative Models
- arxiv url: http://arxiv.org/abs/2512.07890v1
- Date: Tue, 02 Dec 2025 23:57:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-10 22:28:07.66537
- Title: CrowdLLM: Building LLM-Based Digital Populations Augmented with Generative Models
- Title(参考訳): CrowdLLM: ジェネレーティブモデルによるLLMベースのディジタル人口構築
- Authors: Ryan Feng Lin, Keyu Tian, Hanming Zheng, Congjing Zhang, Li Zeng, Shuai Huang,
- Abstract要約: デジタル人口は、ヒトの被験者を募集するコストを削減し、人間の被験者研究に関連する多くの懸念を軽減することができる。
本稿では,デジタル人口の多様性と忠実度を高めるために,事前学習されたLLMと生成モデルを統合したCrowdLLMを提案する。
- 参考スコア(独自算出の注目度): 9.623349620415203
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The emergence of large language models (LLMs) has sparked much interest in creating LLM-based digital populations that can be applied to many applications such as social simulation, crowdsourcing, marketing, and recommendation systems. A digital population can reduce the cost of recruiting human participants and alleviate many concerns related to human subject study. However, research has found that most of the existing works rely solely on LLMs and could not sufficiently capture the accuracy and diversity of a real human population. To address this limitation, we propose CrowdLLM that integrates pretrained LLMs and generative models to enhance the diversity and fidelity of the digital population. We conduct theoretical analysis of CrowdLLM regarding its great potential in creating cost-effective, sufficiently representative, scalable digital populations that can match the quality of a real crowd. Comprehensive experiments are also conducted across multiple domains (e.g., crowdsourcing, voting, user rating) and simulation studies which demonstrate that CrowdLLM achieves promising performance in both accuracy and distributional fidelity to human data.
- Abstract(参考訳): 大規模言語モデル(LLM)の出現は、社会シミュレーション、クラウドソーシング、マーケティング、レコメンデーションシステムといった多くのアプリケーションに適用可能なLLMベースのデジタル人口の作成に大きな関心を喚起した。
デジタル人口は、ヒトの被験者を募集するコストを削減し、人間の被験者研究に関連する多くの懸念を軽減することができる。
しかし、研究によると、既存の研究のほとんどはLSMにのみ依存しており、実際の人間の正確さと多様性を十分に捉えられなかった。
この制限に対処するため,デジタル人口の多様性と忠実度を高めるために,事前学習されたLLMと生成モデルを統合したCrowdLLMを提案する。
我々は、クラウドLLMの理論的分析を行い、コスト効率が高く、十分に代表的であり、実際の群衆の質に合致するスケーラブルなデジタル人口を創出する大きな可能性について考察する。
また,複数の領域(クラウドソーシング,投票,ユーザ評価など)にわたる総合的な実験やシミュレーションにより,CrowdLLMが人間のデータに対する精度と分布忠実性の両方において有望な性能を達成することを示す。
関連論文リスト
- Population-Aligned Persona Generation for LLM-based Social Simulation [58.84363795421489]
本稿では,社会シミュレーションのための高品質な集団対応ペルソナ集合を合成するための体系的枠組みを提案する。
我々のアプローチは、長期のソーシャルメディアデータから物語的ペルソナを生成するために、大きな言語モデルを活用することから始まる。
特定のシミュレーションコンテキストのニーズに対処するために,対象のサブポピュレーションに対してグローバルに整合したペルソナを適応させるタスク固有モジュールを提案する。
論文 参考訳(メタデータ) (2025-09-12T10:43:47Z) - SocioVerse: A World Model for Social Simulation Powered by LLM Agents and A Pool of 10 Million Real-World Users [70.02370111025617]
本稿では,社会シミュレーションのためのエージェント駆動世界モデルであるSocioVerseを紹介する。
私たちのフレームワークは、4つの強力なアライメントコンポーネントと1000万の実際の個人からなるユーザプールを備えています。
SocioVerseは、多様性、信頼性、代表性を確保しつつ、大規模な人口動態を反映できることを示した。
論文 参考訳(メタデータ) (2025-04-14T12:12:52Z) - LLM Generated Persona is a Promise with a Catch [18.45442859688198]
ペルソナをベースとしたシミュレーションは、人口レベルのフィードバックに依存した変革の規律を約束する。
現実的なペルソナデータを収集する従来の方法は課題に直面します。
プライバシーの制約により、違法に高価で物議を醸している。
論文 参考訳(メタデータ) (2025-03-18T03:11:27Z) - Agentic Society: Merging skeleton from real world and texture from Large Language Model [4.740886789811429]
本稿では,人口統計データと大規模言語モデルを利用して仮想人口を生成する新しい枠組みについて検討する。
本手法は,社会科学実験において,多様な人間の行動のシミュレーションに不可欠な多様性のあるペルソナを生産することを示す。
しかし, 評価結果から, 現在のLSMの能力に限界があるため, 統計的真理性の弱い兆候しか得られないことが示唆された。
論文 参考訳(メタデータ) (2024-09-02T08:28:19Z) - BASES: Large-scale Web Search User Simulation with Large Language Model
based Agents [108.97507653131917]
BASESは、大きな言語モデル(LLM)を持つ新しいユーザーシミュレーションフレームワークである。
シミュレーションフレームワークは,大規模に独自のユーザプロファイルを生成することができ,その結果,多様な検索行動が生まれる。
WARRIORSは、中国語と英語の両方のバージョンを含む、Web検索ユーザ行動を含む、新しい大規模なデータセットである。
論文 参考訳(メタデータ) (2024-02-27T13:44:09Z) - On the steerability of large language models toward data-driven personas [98.9138902560793]
大規模言語モデル(LLM)は、特定のグループや集団の意見が不足している偏りのある応答を生成することが知られている。
本稿では, LLM を用いて特定の視点の制御可能な生成を実現するための新しい手法を提案する。
論文 参考訳(メタデータ) (2023-11-08T19:01:13Z) - Large Language Models as Subpopulation Representative Models: A Review [5.439020425819001]
大言語モデル(LLM)は、サブポピュレーション代表モデル(SRM)を推定するために用いられる。
LLMは、人口統計、地理的、政治的セグメント間の世論を測る代替的あるいは補完的な手段を提供することができる。
論文 参考訳(メタデータ) (2023-10-27T04:31:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。