論文の概要: PersonaLedger: Generating Realistic Financial Transactions with Persona Conditioned LLMs and Rule Grounded Feedback
- arxiv url: http://arxiv.org/abs/2601.03149v1
- Date: Tue, 06 Jan 2026 16:18:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-07 17:02:13.017209
- Title: PersonaLedger: Generating Realistic Financial Transactions with Persona Conditioned LLMs and Rule Grounded Feedback
- Title(参考訳): PersonaLedger:ペルソナ条件付きLLMとルール基底フィードバックによる現実的な金融取引の生成
- Authors: Dehao Yuan, Tyler Farnan, Stefan Tesliuc, Doron L Bergman, Yulun Wu, Xiaoyu Liu, Minghui Liu, James Montgomery, Nam H Nguyen, C. Bayan Bruss, Furong Huang,
- Abstract要約: PersonaLedgerは、リッチユーザペルソナに条件付けされた大きな言語モデルを使用して、多様なトランザクションストリームを生成する生成エンジンである。
23,000人のユーザによる3000万トランザクションのパブリックデータセットと、2つのタスク、不確実性分類とアイデンティティ盗難セグメンテーションを備えたベンチマークスイートを作成します。
- 参考スコア(独自算出の注目度): 45.74717291285649
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Strict privacy regulations limit access to real transaction data, slowing open research in financial AI. Synthetic data can bridge this gap, but existing generators do not jointly achieve behavioral diversity and logical groundedness. Rule-driven simulators rely on hand-crafted workflows and shallow stochasticity, which miss the richness of human behavior. Learning-based generators such as GANs capture correlations yet often violate hard financial constraints and still require training on private data. We introduce PersonaLedger, a generation engine that uses a large language model conditioned on rich user personas to produce diverse transaction streams, coupled with an expert configurable programmatic engine that maintains correctness. The LLM and engine interact in a closed loop: after each event, the engine updates the user state, enforces financial rules, and returns a context aware "nextprompt" that guides the LLM toward feasible next actions. With this engine, we create a public dataset of 30 million transactions from 23,000 users and a benchmark suite with two tasks, illiquidity classification and identity theft segmentation. PersonaLedger offers a realistic, privacy preserving resource that supports rigorous evaluation of forecasting and anomaly detection models. PersonaLedger offers the community a rich, realistic, and privacy preserving resource -- complete with code, rules, and generation logs -- to accelerate innovation in financial AI and enable rigorous, reproducible evaluation.
- Abstract(参考訳): 厳格なプライバシー規制は、実際のトランザクションデータへのアクセスを制限し、金融AIのオープンな研究を遅らせる。
合成データは、このギャップを埋めることができますが、既存のジェネレータは、行動の多様性と論理的な基礎性を共同で達成しません。
ルール駆動シミュレータは手作りのワークフローと浅い確率性に依存しており、人間の振る舞いの豊かさを欠いている。
GANのような学習ベースのジェネレータは相関関係をキャプチャするが、しばしば厳しい財政的制約に違反し、プライベートデータのトレーニングを必要とする。
我々は,多種多様なトランザクションストリームを生成するために,リッチユーザペルソナに条件付けされた大規模言語モデルを使用する生成エンジンであるPersonaLedgerと,正確性を維持する専門家構成可能なプログラムエンジンを紹介する。
LLMとエンジンはクローズドループで相互作用する:各イベントの後、エンジンはユーザー状態を更新し、財務ルールを実行し、LCMが次の実行可能なアクションに向けてガイドするコンテキストを意識した"nextprompt"を返す。
このエンジンでは、23,000人のユーザの3000万トランザクションのパブリックデータセットと、2つのタスク、不平等分類とアイデンティティ盗難セグメンテーションを備えたベンチマークスイートを作成します。
PersonaLedgerは、予測モデルと異常検出モデルの厳格な評価をサポートする、現実的でプライバシー保護のリソースを提供する。
PersonaLedgerは、金融AIのイノベーションを加速し、厳格で再現可能な評価を可能にするために、コミュニティに、リッチで現実的でプライバシ保護リソース – コード、ルール、生成ログを備えた – を提供する。
関連論文リスト
- Learning More with Less: A Generalizable, Self-Supervised Framework for Privacy-Preserving Capacity Estimation with EV Charging Data [84.37348569981307]
自己教師付き事前学習に基づく第一種能力推定モデルを提案する。
我々のモデルは一貫して最先端のベースラインを上回っている。
論文 参考訳(メタデータ) (2025-10-05T08:58:35Z) - LLM Generated Persona is a Promise with a Catch [18.45442859688198]
ペルソナをベースとしたシミュレーションは、人口レベルのフィードバックに依存した変革の規律を約束する。
現実的なペルソナデータを収集する従来の方法は課題に直面します。
プライバシーの制約により、違法に高価で物議を醸している。
論文 参考訳(メタデータ) (2025-03-18T03:11:27Z) - Agentic Society: Merging skeleton from real world and texture from Large Language Model [4.740886789811429]
本稿では,人口統計データと大規模言語モデルを利用して仮想人口を生成する新しい枠組みについて検討する。
本手法は,社会科学実験において,多様な人間の行動のシミュレーションに不可欠な多様性のあるペルソナを生産することを示す。
しかし, 評価結果から, 現在のLSMの能力に限界があるため, 統計的真理性の弱い兆候しか得られないことが示唆された。
論文 参考訳(メタデータ) (2024-09-02T08:28:19Z) - Advancing Anomaly Detection: Non-Semantic Financial Data Encoding with LLMs [49.57641083688934]
本稿では,Large Language Models (LLM) 埋め込みを用いた財務データにおける異常検出の新しい手法を提案する。
実験により,LLMが異常検出に有用な情報をもたらし,モデルがベースラインを上回っていることが確認された。
論文 参考訳(メタデータ) (2024-06-05T20:19:09Z) - Towards a Foundation Purchasing Model: Pretrained Generative
Autoregression on Transaction Sequences [0.0]
本稿では,金融取引の文脈的埋め込みを得るための生成事前学習手法を提案する。
さらに,510億の取引を含む180の発行銀行のデータコーパスを用いて,埋め込みモデルの大規模事前学習を行う。
論文 参考訳(メタデータ) (2024-01-03T09:32:48Z) - On the steerability of large language models toward data-driven personas [98.9138902560793]
大規模言語モデル(LLM)は、特定のグループや集団の意見が不足している偏りのある応答を生成することが知られている。
本稿では, LLM を用いて特定の視点の制御可能な生成を実現するための新しい手法を提案する。
論文 参考訳(メタデータ) (2023-11-08T19:01:13Z) - Confident Adaptive Language Modeling [95.45272377648773]
CALMは、入力と生成時間ごとに異なる量の計算を動的に割り当てるフレームワークである。
ハイパフォーマンスを確実に維持しつつ、計算能力、潜在的スピードアップを最大3ドルまで削減する上で、我々のフレームワークの有効性を実証する。
論文 参考訳(メタデータ) (2022-07-14T17:00:19Z) - Supporting Financial Inclusion with Graph Machine Learning and Super-App
Alternative Data [63.942632088208505]
スーパーアプリは、ユーザーとコマースの相互作用についての考え方を変えました。
本稿では,スーパーアプリ内のユーザ間のインタラクションの違いが,借り手行動を予測する新たな情報源となるかを検討する。
論文 参考訳(メタデータ) (2021-02-19T15:13:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。