論文の概要: SYNTHIA: Synthetic Yet Naturally Tailored Human-Inspired PersonAs
- arxiv url: http://arxiv.org/abs/2507.14922v1
- Date: Sun, 20 Jul 2025 11:37:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-22 20:51:32.128567
- Title: SYNTHIA: Synthetic Yet Naturally Tailored Human-Inspired PersonAs
- Title(参考訳): シンシア:人間にインスパイアされたシンセティックな人間
- Authors: Vahid Rahimzadeh, Erfan Moosavi Monazzah, Mohammad Taher Pilehvar, Yadollah Yaghoobzadeh,
- Abstract要約: 我々は、BlueSkyのオープンプラットフォームから3つのタイムウィンドウに1万のソーシャルメディアユーザーから得られた3万のバックストリーのデータセットであるSynTHIAを紹介した。
以上の結果から,SynTHIAは人口多様性と社会調査アライメントにおいて,最先端の手法と競争力を発揮することが示された。
シンシアは時間次元を取り入れ、基礎となるネットワークから豊富なソーシャルインタラクションメタデータを提供し、計算社会科学とペルソナ駆動言語モデリングの新しい研究方向を可能にする。
- 参考スコア(独自算出の注目度): 19.13643420023103
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Persona-driven LLMs have emerged as powerful tools in computational social science, yet existing approaches fall at opposite extremes, either relying on costly human-curated data or producing synthetic personas that lack consistency and realism. We introduce SYNTHIA, a dataset of 30,000 backstories derived from 10,000 real social media users from BlueSky open platform across three time windows, bridging this spectrum by grounding synthetic generation in authentic user activity. Our evaluation demonstrates that SYNTHIA achieves competitive performance with state-of-the-art methods in demographic diversity and social survey alignment while significantly outperforming them in narrative consistency. Uniquely, SYNTHIA incorporates temporal dimensionality and provides rich social interaction metadata from the underlying network, enabling new research directions in computational social science and persona-driven language modeling.
- Abstract(参考訳): ペルソナ駆動のLSMは計算社会科学の強力なツールとして登場したが、既存のアプローチは、コストのかかる人為的なデータに頼るか、一貫性とリアリズムに欠ける合成ペルソナを生成するかのどちらかという、反対の極端に該当する。
我々は、BlueSkyのオープンなプラットフォームから3つのタイムウインドウに1万のソーシャルメディアユーザーから得られた3万のバックストリーのデータセットであるSynTHIAを紹介する。
評価の結果,SynTHIAは,人口多様性と社会調査アライメントにおける最先端の手法と競合し,物語の一貫性において優れていた。
シンシアは時間次元を取り入れ、基礎となるネットワークから豊富なソーシャルインタラクションメタデータを提供し、計算社会科学とペルソナ駆動言語モデリングの新しい研究方向を可能にする。
関連論文リスト
- Towards an LLM-powered Social Digital Twinning Platform [0.3499870393443268]
ソーシャル・デジタル・ツインナー(Social Digital Twinner)は、複雑な適応型社会システムにおける「何」シナリオのもっともらしい効果を探索するソーシャル・シミュレーション・ツールである。
このアーキテクチャは3つのシームレスに統合された部分で構成されている。
ノルウェーのクラゲロにおける青少年学校退学の重大な問題に対処することで,ツールの対話性を実証する。
論文 参考訳(メタデータ) (2025-05-15T19:58:50Z) - SocioVerse: A World Model for Social Simulation Powered by LLM Agents and A Pool of 10 Million Real-World Users [70.02370111025617]
本稿では,社会シミュレーションのためのエージェント駆動世界モデルであるSocioVerseを紹介する。
私たちのフレームワークは、4つの強力なアライメントコンポーネントと1000万の実際の個人からなるユーザプールを備えています。
SocioVerseは、多様性、信頼性、代表性を確保しつつ、大規模な人口動態を反映できることを示した。
論文 参考訳(メタデータ) (2025-04-14T12:12:52Z) - Scaling Laws of Synthetic Data for Language Models [132.67350443447611]
プレトレーニングコーパスを多種多様な高品質な合成データセットに変換するスケーラブルなフレームワークであるSynthLLMを紹介した。
提案手法は,グラフアルゴリズムを用いて複数の文書にまたがるハイレベルな概念を自動的に抽出し,再結合することで実現している。
論文 参考訳(メタデータ) (2025-03-25T11:07:12Z) - Analyzing the Synthetic-to-Real Domain Gap in 3D Hand Pose Estimation [41.382984217586504]
本稿では,3次元手ポーズ推定における合成と現実のギャップに関する最初の体系的研究について述べる。
分析を容易にするために,高品質なデータを合成するためのデータ合成パイプラインを提案する。
本研究は, 実データと同一の精度で, 同定したコンポーネントを組み込むことで, 実データと同一の精度が得られることを示す。
論文 参考訳(メタデータ) (2025-03-25T03:13:23Z) - Second FRCSyn-onGoing: Winning Solutions and Post-Challenge Analysis to Improve Face Recognition with Synthetic Data [104.30479583607918]
第2回FRCSyn-onGoingチャレンジは、CVPR 2024で開始された第2回顔認識チャレンジ(FRCSyn)に基づいている。
我々は、顔認識における現在の課題を解決するために、個々のデータと実際のデータの組み合わせの両方で合成データの利用を検討することに重点を置いている。
論文 参考訳(メタデータ) (2024-12-02T11:12:01Z) - SynCoTrain: A Dual Classifier PU-learning Framework for Synthesizability Prediction [0.0]
素材の合成可能性を予測するための半教師付き機械学習モデルであるSynCoTrainを提案する。
我々のアプローチでは、明示的な負のデータがないことに対処するために、肯定的および非ラベル付き学習(PU)を用いています。
モデルは堅牢なパフォーマンスを示し、内部および離脱テストセットで高いリコールを達成する。
論文 参考訳(メタデータ) (2024-11-18T19:53:19Z) - SynDy: Synthetic Dynamic Dataset Generation Framework for Misinformation Tasks [11.51618067777228]
ディアスポラのコミュニティは、違法な誤報によって不当に影響され、しばしば主流の事実チェックの努力によって無視される。
我々は、最も大きなフロンティア大言語モデルの能力を活用するための、Synthetic Dynamic dataset GenerationのためのフレームワークであるSynDyを紹介する。
SynDy は LLMs を利用した最初の論文であり、誤情報緩和に直接関連のあるタスクのためのきめ細かい合成ラベルを作成する。
我々は、一般的な誤情報トピックに関する高品質な説明者に対して、新しい誤情報クレームをマッチングするなどのファクトチェックツールをSynDyで実現することを期待している。
論文 参考訳(メタデータ) (2024-05-17T11:14:55Z) - SOTOPIA: Interactive Evaluation for Social Intelligence in Language Agents [107.4138224020773]
人工エージェントと人間との複雑な社会的相互作用をシミュレートするオープンエンド環境であるSOTOPIAを提案する。
エージェントは、複雑な社会的目標を達成するために協調し、協力し、交換し、互いに競い合う。
GPT-4は,人間よりも目標達成率が著しく低く,社会的常識的推論や戦略的コミュニケーション能力の発揮に苦慮していることがわかった。
論文 参考訳(メタデータ) (2023-10-18T02:27:01Z) - PHASE: PHysically-grounded Abstract Social Events for Machine Social
Perception [50.551003004553806]
私たちは、物理的に根拠のある抽象的なソーシャルイベント、フェーズのデータセットを作成します。
フェーズは人間の実験によって検証され、人間は社会出来事において豊かな相互作用を知覚する。
ベースラインモデルとして,最新のフィードフォワードニューラルネットワークよりも優れたベイズ逆計画手法SIMPLEを導入する。
論文 参考訳(メタデータ) (2021-03-02T18:44:57Z) - Generative Adversarial Networks in Human Emotion Synthesis:A Review [0.0]
深層生成モデルは、コンピュータビジョンや信号処理といった様々な研究分野において、新たな話題となっている。
影響コンピューティングは、過去20年間に生成モデルの急速な派生を観察した。
表情合成, 音声感情合成, 音声視覚(クロスモーダル)感情合成を概観する。
論文 参考訳(メタデータ) (2020-10-28T16:45:36Z) - Human Trajectory Forecasting in Crowds: A Deep Learning Perspective [89.4600982169]
本稿では,既存の深層学習に基づくソーシャルインタラクションのモデル化手法について詳細に分析する。
本稿では、これらの社会的相互作用を効果的に捉えるための知識に基づく2つのデータ駆動手法を提案する。
我々は,人間の軌道予測分野において,重要かつ欠落したコンポーネントであるTrajNet++を大規模に開発する。
論文 参考訳(メタデータ) (2020-07-07T17:19:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。