論文の概要: $\texttt{BluePrint}$: A Social Media User Dataset for LLM Persona Evaluation and Training
- arxiv url: http://arxiv.org/abs/2510.02343v1
- Date: Sat, 27 Sep 2025 06:02:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-06 16:35:52.02088
- Title: $\texttt{BluePrint}$: A Social Media User Dataset for LLM Persona Evaluation and Training
- Title(参考訳): $\texttt{BluePrint}$: LLMペルソナ評価とトレーニングのためのソーシャルメディアユーザデータセット
- Authors: Aurélien Bück-Kaeffer, Je Qin Chooi, Dan Zhao, Maximilian Puelma Touzel, Kellin Pelrine, Jean-François Godbout, Reihaneh Rabbany, Zachary Yang,
- Abstract要約: 大規模言語モデル(LLM)は、大規模なソーシャルメディアのダイナミックスに有望な機能を提供する。
本稿では,エージェントモデルの訓練に適した行動型ソーシャルメディアを構築するためのフレームワークであるSを紹介する。
BluePrintは、政治談話に焦点を当てた公開Blueskyデータから構築された大規模なデータセットです。
- 参考スコア(独自算出の注目度): 8.563967699751684
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Large language models (LLMs) offer promising capabilities for simulating social media dynamics at scale, enabling studies that would be ethically or logistically challenging with human subjects. However, the field lacks standardized data resources for fine-tuning and evaluating LLMs as realistic social media agents. We address this gap by introducing SIMPACT, the SIMulation-oriented Persona and Action Capture Toolkit, a privacy respecting framework for constructing behaviorally-grounded social media datasets suitable for training agent models. We formulate next-action prediction as a task for training and evaluating LLM-based agents and introduce metrics at both the cluster and population levels to assess behavioral fidelity and stylistic realism. As a concrete implementation, we release BluePrint, a large-scale dataset built from public Bluesky data focused on political discourse. BluePrint clusters anonymized users into personas of aggregated behaviours, capturing authentic engagement patterns while safeguarding privacy through pseudonymization and removal of personally identifiable information. The dataset includes a sizable action set of 12 social media interaction types (likes, replies, reposts, etc.), each instance tied to the posting activity preceding it. This supports the development of agents that use context-dependence, not only in the language, but also in the interaction behaviours of social media to model social media users. By standardizing data and evaluation protocols, SIMPACT provides a foundation for advancing rigorous, ethically responsible social media simulations. BluePrint serves as both an evaluation benchmark for political discourse modeling and a template for building domain specific datasets to study challenges such as misinformation and polarization.
- Abstract(参考訳): 大規模言語モデル(LLM)は、ソーシャルメディアのダイナミクスを大規模にシミュレートする有望な能力を提供し、倫理的にも論理的にも人間の対象に挑戦する研究を可能にする。
しかし、LLMをリアルなソーシャルメディアエージェントとして微調整し評価するための標準化されたデータリソースは欠如している。
SIMPACT(Simulation-oriented Persona and Action Capture Toolkit)は、エージェントモデルに適した行動的グラウンドのソーシャルメディアデータセットを構築するためのプライバシーに配慮したフレームワークである。
我々は、LCMをベースとしたエージェントの訓練と評価のタスクとして次の行動予測を定式化し、クラスタレベルと人口レベルの両方でメトリクスを導入し、行動の忠実さとスタイリスティックなリアリズムを評価する。
具体的な実装として、政治談話に焦点を当てたパブリックなBlueskyデータから構築された大規模なデータセットであるBluePrintをリリースする。
BluePrintクラスタは、ユーザを匿名化して、集約された行動のペルソナにし、認証されたエンゲージメントパターンをキャプチャし、匿名化と個人識別可能な情報の削除を通じてプライバシを保護する。
データセットには、12のソーシャルメディアインタラクションタイプ(いいねs, Relay, Repostsなど)からなる、大規模なアクションセットが含まれており、各インスタンスは、その前のポストアクティビティに関連付けられている。
これは、言語だけでなく、ソーシャルメディアユーザーをモデル化するためのソーシャルメディアの相互作用行動においても、文脈依存を使用するエージェントの開発をサポートする。
データと評価プロトコルの標準化により、SIMPACTは厳格で倫理的に責任のあるソーシャルメディアシミュレーションを促進する基盤を提供する。
BluePrintは、政治的談話モデリングの評価ベンチマークと、誤った情報や偏光といった課題を研究するために、ドメイン固有のデータセットを構築するテンプレートの両方を提供する。
関連論文リスト
- Population-Aligned Persona Generation for LLM-based Social Simulation [58.8436379542149]
本稿では,社会シミュレーションのための高品質な集団対応ペルソナ集合を合成するための体系的枠組みを提案する。
我々のアプローチは、長期のソーシャルメディアデータから物語的ペルソナを生成するために、大きな言語モデルを活用することから始まる。
特定のシミュレーションコンテキストのニーズに対処するために,対象のサブポピュレーションに対してグローバルに整合したペルソナを適応させるタスク固有モジュールを提案する。
論文 参考訳(メタデータ) (2025-09-12T10:43:47Z) - PANORAMA: A synthetic PII-laced dataset for studying sensitive data memorization in LLMs [0.0]
機密情報と個人識別情報の記憶は プライバシーのリスクを増大させる
センシティブなPIIデータを記憶し、緩和戦略を開発するための既存の取り組みは、現実的なデータセットの欠如によって妨げられている。
本稿では,自然主義的オンライン表現と属性記憶分析のためのプロファイルベースのアセンブラであるPANORAMAを紹介する。
論文 参考訳(メタデータ) (2025-05-18T05:27:35Z) - SCRAG: Social Computing-Based Retrieval Augmented Generation for Community Response Forecasting in Social Media Environments [8.743208265682014]
SCRAGは、ソーシャルコンピューティングにインスパイアされた予測フレームワークである。
リアルまたは仮説的なソーシャルメディア投稿に対するコミュニティの反応を予測する。
公開関係の専門家が意図しない誤解を避ける方法でメッセージを作成するために使用することができる。
論文 参考訳(メタデータ) (2025-04-18T15:02:31Z) - Agentic Society: Merging skeleton from real world and texture from Large Language Model [4.740886789811429]
本稿では,人口統計データと大規模言語モデルを利用して仮想人口を生成する新しい枠組みについて検討する。
本手法は,社会科学実験において,多様な人間の行動のシミュレーションに不可欠な多様性のあるペルソナを生産することを示す。
しかし, 評価結果から, 現在のLSMの能力に限界があるため, 統計的真理性の弱い兆候しか得られないことが示唆された。
論文 参考訳(メタデータ) (2024-09-02T08:28:19Z) - Modeling Political Orientation of Social Media Posts: An Extended
Analysis [0.0]
オンラインソーシャルメディア上で政治的分極を特徴付ける機械学習モデルを開発することは、大きな課題である。
これらの課題は主に、注釈付きデータの欠如、ソーシャルメディアデータセットにおけるノイズの存在、膨大な量のデータなど、さまざまな要因に起因している。
本稿では、ソーシャルメディア投稿のラベル付けに、メディアバイアスと投稿コンテンツを活用する2つの方法を紹介する。
ソーシャルメディア投稿の政治的指向を予測することで,現在の機械学習モデルの性能向上を実証する。
論文 参考訳(メタデータ) (2023-11-21T03:34:20Z) - Bias and Fairness in Large Language Models: A Survey [73.87651986156006]
本稿では,大規模言語モデル(LLM)のバイアス評価と緩和手法に関する総合的な調査を行う。
まず、自然言語処理における社会的偏見と公平性の概念を統合し、形式化し、拡張する。
次に,3つの直感的な2つのバイアス評価法と1つの緩和法を提案し,文献を統一する。
論文 参考訳(メタデータ) (2023-09-02T00:32:55Z) - Bring Your Own Data! Self-Supervised Evaluation for Large Language
Models [52.15056231665816]
大規模言語モデル(LLM)の自己教師型評価のためのフレームワークを提案する。
閉書知識,毒性,長期文脈依存性を測定するための自己指導型評価戦略を実証する。
自己監督評価と人監督評価との間には強い相関関係が認められた。
論文 参考訳(メタデータ) (2023-06-23T17:59:09Z) - Social Processes: Self-Supervised Forecasting of Nonverbal Cues in
Social Conversations [22.302509912465077]
我々は、社会的人間関係の分野におけるボトムアップな自己監督的アプローチの方向への第一歩を踏み出す。
ソーシャルキュー予測のタスクを定式化し、ラベルなしの低レベル行動キューを多量に活用する。
本稿では,ニューラル・プロセス(NP)ファミリー内における社会的に認識されるシーケンス・ツー・シーケンス(Seq2Seq)モデルを提案する。
論文 参考訳(メタデータ) (2021-07-28T18:01:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。