論文の概要: $\texttt{BluePrint}$: A Social Media User Dataset for LLM Persona Evaluation and Training
- arxiv url: http://arxiv.org/abs/2510.02343v1
- Date: Sat, 27 Sep 2025 06:02:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-06 16:35:52.02088
- Title: $\texttt{BluePrint}$: A Social Media User Dataset for LLM Persona Evaluation and Training
- Title(参考訳): $\texttt{BluePrint}$: LLMペルソナ評価とトレーニングのためのソーシャルメディアユーザデータセット
- Authors: Aurélien Bück-Kaeffer, Je Qin Chooi, Dan Zhao, Maximilian Puelma Touzel, Kellin Pelrine, Jean-François Godbout, Reihaneh Rabbany, Zachary Yang,
- Abstract要約: 大規模言語モデル(LLM)は、大規模なソーシャルメディアのダイナミックスに有望な機能を提供する。
本稿では,エージェントモデルの訓練に適した行動型ソーシャルメディアを構築するためのフレームワークであるSを紹介する。
BluePrintは、政治談話に焦点を当てた公開Blueskyデータから構築された大規模なデータセットです。
- 参考スコア(独自算出の注目度): 8.563967699751684
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Large language models (LLMs) offer promising capabilities for simulating social media dynamics at scale, enabling studies that would be ethically or logistically challenging with human subjects. However, the field lacks standardized data resources for fine-tuning and evaluating LLMs as realistic social media agents. We address this gap by introducing SIMPACT, the SIMulation-oriented Persona and Action Capture Toolkit, a privacy respecting framework for constructing behaviorally-grounded social media datasets suitable for training agent models. We formulate next-action prediction as a task for training and evaluating LLM-based agents and introduce metrics at both the cluster and population levels to assess behavioral fidelity and stylistic realism. As a concrete implementation, we release BluePrint, a large-scale dataset built from public Bluesky data focused on political discourse. BluePrint clusters anonymized users into personas of aggregated behaviours, capturing authentic engagement patterns while safeguarding privacy through pseudonymization and removal of personally identifiable information. The dataset includes a sizable action set of 12 social media interaction types (likes, replies, reposts, etc.), each instance tied to the posting activity preceding it. This supports the development of agents that use context-dependence, not only in the language, but also in the interaction behaviours of social media to model social media users. By standardizing data and evaluation protocols, SIMPACT provides a foundation for advancing rigorous, ethically responsible social media simulations. BluePrint serves as both an evaluation benchmark for political discourse modeling and a template for building domain specific datasets to study challenges such as misinformation and polarization.
- Abstract(参考訳): 大規模言語モデル(LLM)は、ソーシャルメディアのダイナミクスを大規模にシミュレートする有望な能力を提供し、倫理的にも論理的にも人間の対象に挑戦する研究を可能にする。
しかし、LLMをリアルなソーシャルメディアエージェントとして微調整し評価するための標準化されたデータリソースは欠如している。
SIMPACT(Simulation-oriented Persona and Action Capture Toolkit)は、エージェントモデルに適した行動的グラウンドのソーシャルメディアデータセットを構築するためのプライバシーに配慮したフレームワークである。
我々は、LCMをベースとしたエージェントの訓練と評価のタスクとして次の行動予測を定式化し、クラスタレベルと人口レベルの両方でメトリクスを導入し、行動の忠実さとスタイリスティックなリアリズムを評価する。
具体的な実装として、政治談話に焦点を当てたパブリックなBlueskyデータから構築された大規模なデータセットであるBluePrintをリリースする。
BluePrintクラスタは、ユーザを匿名化して、集約された行動のペルソナにし、認証されたエンゲージメントパターンをキャプチャし、匿名化と個人識別可能な情報の削除を通じてプライバシを保護する。
データセットには、12のソーシャルメディアインタラクションタイプ(いいねs, Relay, Repostsなど)からなる、大規模なアクションセットが含まれており、各インスタンスは、その前のポストアクティビティに関連付けられている。
これは、言語だけでなく、ソーシャルメディアユーザーをモデル化するためのソーシャルメディアの相互作用行動においても、文脈依存を使用するエージェントの開発をサポートする。
データと評価プロトコルの標準化により、SIMPACTは厳格で倫理的に責任のあるソーシャルメディアシミュレーションを促進する基盤を提供する。
BluePrintは、政治的談話モデリングの評価ベンチマークと、誤った情報や偏光といった課題を研究するために、ドメイン固有のデータセットを構築するテンプレートの両方を提供する。
関連論文リスト
- Interpretable Debiasing of Vision-Language Models for Social Fairness [55.85977929985967]
本稿では,視覚・言語モデルに社会的属性ニューロンを局在させる,解釈可能なモデルに依存しないバイアス緩和フレームワークDeBiasLensを紹介する。
社会属性ラベルを含まない顔画像やキャプションデータセットでSAEを訓練し、特定の人口動態に高い応答性を持つニューロンを明らかにする。
我々の研究は、未来の監査ツールの基礎を築き、新興の現実世界のAIシステムにおける社会的公正性を優先します。
論文 参考訳(メタデータ) (2026-02-27T13:37:11Z) - HumanLLM: Towards Personalized Understanding and Simulation of Human Nature [72.55730315685837]
HumanLLMは個人のパーソナライズされた理解とシミュレーションのために設計された基礎モデルである。
私たちはまず、Reddit、Twitter、Blogger、Amazonといったプラットフォーム上で、現実世界のユーザデータをキュレートした大規模なコーパスであるCognitive Genomeを構築しました。
次に、多様な学習タスクを定式化し、教師付き微調整を行い、モデルの幅広い個人化された人間の行動、思考、経験を予測する。
論文 参考訳(メタデータ) (2026-01-22T09:27:27Z) - Agent-based simulation of online social networks and disinformation [35.38015952060615]
本稿では、人口動態に基づく性格特性と有限状態行動オートマトンを用いた合成ソーシャルネットワークをモデル化するシミュレーションフレームワークを提案する。
大規模言語モデル(LLM)を利用した生成モジュールは、各エージェントのプロファイルとメモリに整合したコンテキスト対応のソーシャルメディアポストを生成する。
レッドモジュールは、シミュレーションされたオーディエンスをターゲットにした悪意のあるエージェントによって実行されるdisARMにインスパイアされた偽情報キャンペーンを実装している。
論文 参考訳(メタデータ) (2025-12-26T16:56:45Z) - Social-Media Based Personas Challenge: Hybrid Prediction of Common and Rare User Actions on Bluesky [0.7305019142196582]
本稿では,ソーシャルメディア利用者の行動予測のためのハイブリッド手法を提案する。
多様な行動語彙にまたがる頻繁な行動と頻繁な行動の両方に対処する。
われわれのアプローチは、SocialSim: Social-Media Based Personas Challengeで第一位となった。
論文 参考訳(メタデータ) (2025-11-21T13:40:14Z) - Simulating and Experimenting with Social Media Mobilization Using LLM Agents [7.262048441360133]
目覚ましい6100万人のFacebook実験 citepbond201261 に基づいて,エージェントベースのシミュレーションフレームワークを開発した。
我々は、実際の米国国勢調査人口分布、Twitterネットワークトポロジ、および異種大言語モデル(LLM)エージェントを統合し、投票者投票における動員メッセージの効果を検討する。
論文 参考訳(メタデータ) (2025-10-30T13:43:28Z) - Population-Aligned Persona Generation for LLM-based Social Simulation [58.8436379542149]
本稿では,社会シミュレーションのための高品質な集団対応ペルソナ集合を合成するための体系的枠組みを提案する。
我々のアプローチは、長期のソーシャルメディアデータから物語的ペルソナを生成するために、大きな言語モデルを活用することから始まる。
特定のシミュレーションコンテキストのニーズに対処するために,対象のサブポピュレーションに対してグローバルに整合したペルソナを適応させるタスク固有モジュールを提案する。
論文 参考訳(メタデータ) (2025-09-12T10:43:47Z) - PANORAMA: A synthetic PII-laced dataset for studying sensitive data memorization in LLMs [0.0]
機密情報と個人識別情報の記憶は プライバシーのリスクを増大させる
センシティブなPIIデータを記憶し、緩和戦略を開発するための既存の取り組みは、現実的なデータセットの欠如によって妨げられている。
本稿では,自然主義的オンライン表現と属性記憶分析のためのプロファイルベースのアセンブラであるPANORAMAを紹介する。
論文 参考訳(メタデータ) (2025-05-18T05:27:35Z) - SCRAG: Social Computing-Based Retrieval Augmented Generation for Community Response Forecasting in Social Media Environments [8.743208265682014]
SCRAGは、ソーシャルコンピューティングにインスパイアされた予測フレームワークである。
リアルまたは仮説的なソーシャルメディア投稿に対するコミュニティの反応を予測する。
公開関係の専門家が意図しない誤解を避ける方法でメッセージを作成するために使用することができる。
論文 参考訳(メタデータ) (2025-04-18T15:02:31Z) - Agentic Society: Merging skeleton from real world and texture from Large Language Model [4.740886789811429]
本稿では,人口統計データと大規模言語モデルを利用して仮想人口を生成する新しい枠組みについて検討する。
本手法は,社会科学実験において,多様な人間の行動のシミュレーションに不可欠な多様性のあるペルソナを生産することを示す。
しかし, 評価結果から, 現在のLSMの能力に限界があるため, 統計的真理性の弱い兆候しか得られないことが示唆された。
論文 参考訳(メタデータ) (2024-09-02T08:28:19Z) - PersLLM: A Personified Training Approach for Large Language Models [66.16513246245401]
データ構築とモデルチューニングを改善するためのフレームワークPersLLMを提案する。
データ利用が不十分な場合には、Chain-of-Thoughtプロンプトやアンチインダクションといった戦略を取り入れます。
厳密な振舞いパターンを設計し,モデルの性格の特異性とダイナミズムを高めるために自動DPOを導入する。
論文 参考訳(メタデータ) (2024-07-17T08:13:22Z) - Modeling Political Orientation of Social Media Posts: An Extended
Analysis [0.0]
オンラインソーシャルメディア上で政治的分極を特徴付ける機械学習モデルを開発することは、大きな課題である。
これらの課題は主に、注釈付きデータの欠如、ソーシャルメディアデータセットにおけるノイズの存在、膨大な量のデータなど、さまざまな要因に起因している。
本稿では、ソーシャルメディア投稿のラベル付けに、メディアバイアスと投稿コンテンツを活用する2つの方法を紹介する。
ソーシャルメディア投稿の政治的指向を予測することで,現在の機械学習モデルの性能向上を実証する。
論文 参考訳(メタデータ) (2023-11-21T03:34:20Z) - Bias and Fairness in Large Language Models: A Survey [73.87651986156006]
本稿では,大規模言語モデル(LLM)のバイアス評価と緩和手法に関する総合的な調査を行う。
まず、自然言語処理における社会的偏見と公平性の概念を統合し、形式化し、拡張する。
次に,3つの直感的な2つのバイアス評価法と1つの緩和法を提案し,文献を統一する。
論文 参考訳(メタデータ) (2023-09-02T00:32:55Z) - Bring Your Own Data! Self-Supervised Evaluation for Large Language
Models [52.15056231665816]
大規模言語モデル(LLM)の自己教師型評価のためのフレームワークを提案する。
閉書知識,毒性,長期文脈依存性を測定するための自己指導型評価戦略を実証する。
自己監督評価と人監督評価との間には強い相関関係が認められた。
論文 参考訳(メタデータ) (2023-06-23T17:59:09Z) - Social Processes: Self-Supervised Forecasting of Nonverbal Cues in
Social Conversations [22.302509912465077]
我々は、社会的人間関係の分野におけるボトムアップな自己監督的アプローチの方向への第一歩を踏み出す。
ソーシャルキュー予測のタスクを定式化し、ラベルなしの低レベル行動キューを多量に活用する。
本稿では,ニューラル・プロセス(NP)ファミリー内における社会的に認識されるシーケンス・ツー・シーケンス(Seq2Seq)モデルを提案する。
論文 参考訳(メタデータ) (2021-07-28T18:01:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。