論文の概要: PersonaTrace: Synthesizing Realistic Digital Footprints with LLM Agents
- arxiv url: http://arxiv.org/abs/2603.11955v1
- Date: Thu, 12 Mar 2026 14:02:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-13 14:46:26.130337
- Title: PersonaTrace: Synthesizing Realistic Digital Footprints with LLM Agents
- Title(参考訳): PersonaTrace: LLMエージェントによるリアルなデジタルフットプリントの合成
- Authors: Minjia Wang, Yunfeng Wang, Xiao Ma, Dexin Lv, Qifan Guo, Lynn Zheng, Benliang Wang, Lei Wang, Jiannan Li, Yongwei Xing, David Xu, Zheng Sun,
- Abstract要約: 大規模言語モデル (LLM) エージェントを用いて, リアルなデジタルフットプリントを合成する手法を提案する。
我々のアプローチは多様なユーザイベントのシーケンスを生成し、最終的に電子メール、メッセージ、カレンダーエントリ、リマインダーなどの対応するデジタルアーティファクトを生成します。
- 参考スコア(独自算出の注目度): 9.621693323216917
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Digital footprints (records of individuals' interactions with digital systems) are essential for studying behavior, developing personalized applications, and training machine learning models. However, research in this area is often hindered by the scarcity of diverse and accessible data. To address this limitation, we propose a novel method for synthesizing realistic digital footprints using large language model (LLM) agents. Starting from a structured user profile, our approach generates diverse and plausible sequences of user events, ultimately producing corresponding digital artifacts such as emails, messages, calendar entries, reminders, etc. Intrinsic evaluation results demonstrate that the generated dataset is more diverse and realistic than existing baselines. Moreover, models fine-tuned on our synthetic data outperform those trained on other synthetic datasets when evaluated on real-world out-of-distribution tasks.
- Abstract(参考訳): デジタルフットプリント(個人のデジタルシステムとのインタラクションの記録)は、振る舞いの研究、パーソナライズされたアプリケーションの開発、機械学習モデルのトレーニングに不可欠である。
しかし、この領域の研究は、多種多様なアクセス可能なデータの不足によってしばしば妨げられている。
この制限に対処するために,大規模言語モデル(LLM)エージェントを用いたリアルなデジタルフットプリントの合成手法を提案する。
構造化されたユーザプロファイルから,ユーザイベントの多様かつ妥当なシーケンスを生成し,最終的に電子メール,メッセージ,カレンダーエントリ,リマインダーなどの対応するデジタルアーティファクトを生成する。
内在的な評価結果は、生成されたデータセットが既存のベースラインよりも多様で現実的であることを示している。
さらに、我々の合成データに基づいて微調整されたモデルは、現実世界のアウト・オブ・ディストリビューションタスクで評価された場合、他の合成データセットで訓練されたモデルよりも優れている。
関連論文リスト
- Valid Inference with Imperfect Synthetic Data [39.10587411316875]
モーメントの一般化法に基づく新しい推定器を提案する。
合成データのモーメント残差と実データのモーメント間の相互作用は、対象パラメータの推定を大幅に改善できることがわかった。
論文 参考訳(メタデータ) (2025-08-08T18:32:52Z) - Data-Constrained Synthesis of Training Data for De-Identification [0.0]
臨床領域に適応する大言語モデル(LLM)について検討した。
我々は,個人識別可能な情報にタグを付加した人工的な臨床テキストを生成する。
合成コーパスは合成NERモデルの訓練に使用される。
論文 参考訳(メタデータ) (2025-02-20T16:09:27Z) - Expert Routing with Synthetic Data for Continual Learning [46.01125098473039]
Generate to Discriminate (G2D) は、合成データを利用してドメイン識別器を訓練する連続学習手法である。
我々は、G2Dが視覚と言語の両方におけるタスクにおいて、競争力のあるドメイン・インクリメンタル・ラーニング手法より優れていることを観察する。
論文 参考訳(メタデータ) (2024-12-22T13:16:28Z) - Reimagining Synthetic Tabular Data Generation through Data-Centric AI: A
Comprehensive Benchmark [56.8042116967334]
合成データは、機械学習モデルのトレーニングの代替となる。
合成データが現実世界データの複雑なニュアンスを反映することを保証することは、難しい作業です。
本稿では,データ中心型AI技術の統合による合成データ生成プロセスのガイドの可能性について検討する。
論文 参考訳(メタデータ) (2023-10-25T20:32:02Z) - TRoVE: Transforming Road Scene Datasets into Photorealistic Virtual
Environments [84.6017003787244]
本研究では、シミュレーションデータセットに存在する困難とドメインギャップに対処する合成データ生成パイプラインを提案する。
既存のデータセットからアノテーションや視覚的手がかりを利用すれば、自動マルチモーダルデータ生成が容易になることを示す。
論文 参考訳(メタデータ) (2022-08-16T20:46:08Z) - Unsupervised Domain Adaptive Learning via Synthetic Data for Person
Re-identification [101.1886788396803]
人物再識別(re-ID)は、ビデオ監視に広く応用されているため、ますます注目を集めている。
残念なことに、主流のディープラーニング手法では、モデルをトレーニングするために大量のラベル付きデータが必要です。
本稿では,コンピュータゲーム内で合成されたre-IDサンプルを自動的に生成するデータコレクタを開発し,同時にアノテートするデータラベラを構築した。
論文 参考訳(メタデータ) (2021-09-12T15:51:41Z) - Efficient Realistic Data Generation Framework leveraging Deep
Learning-based Human Digitization [0.0]
提案手法は、実際の背景画像として入力され、さまざまなポーズで人物を投入する。
対応するタスクのベンチマークと評価は、実データに対する補足として、合成データが効果的に使用できることを示している。
論文 参考訳(メタデータ) (2021-06-28T08:07:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。