論文の概要: TREASURE: A Transformer-Based Foundation Model for High-Volume Transaction Understanding
- arxiv url: http://arxiv.org/abs/2511.19693v2
- Date: Wed, 26 Nov 2025 17:43:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-27 14:46:34.424517
- Title: TREASURE: A Transformer-Based Foundation Model for High-Volume Transaction Understanding
- Title(参考訳): TREASURE: 高速トランザクション理解のためのトランスフォーマーベース基礎モデル
- Authors: Chin-Chia Michael Yeh, Uday Singh Saini, Xin Dai, Xiran Fan, Shubham Jain, Yujie Fan, Jiarui Sun, Junpeng Wang, Menghai Pan, Yingtong Dou, Yuzhong Chen, Vineeth Rakesh, Liang Wang, Yan Zheng, Mahashweta Das,
- Abstract要約: 本稿では,トランザクションデータに特化して設計された多目的トランスフォーマーベース基盤モデルTREASUREを提案する。
このモデルは、消費者の行動と支払いネットワークの信号の両方を同時にキャプチャし、正確なレコメンデーションシステムや異常な行動検出のようなアプリケーションに必要な包括的な情報を提供する。
TREASUREの開発から得られた貴重な知識に着目し、広範囲にわたるアブレーション研究、生産モデルに対するベンチマーク、ケーススタディから重要な知見を提示する。
- 参考スコア(独自算出の注目度): 33.669519944170816
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Payment networks form the backbone of modern commerce, generating high volumes of transaction records from daily activities. Properly modeling this data can enable applications such as abnormal behavior detection and consumer-level insights for hyper-personalized experiences, ultimately improving people's lives. In this paper, we present TREASURE, TRansformer Engine As Scalable Universal transaction Representation Encoder, a multipurpose transformer-based foundation model specifically designed for transaction data. The model simultaneously captures both consumer behavior and payment network signals (such as response codes and system flags), providing comprehensive information necessary for applications like accurate recommendation systems and abnormal behavior detection. Verified with industry-grade datasets, TREASURE features three key capabilities: 1) an input module with dedicated sub-modules for static and dynamic attributes, enabling more efficient training and inference; 2) an efficient and effective training paradigm for predicting high-cardinality categorical attributes; and 3) demonstrated effectiveness as both a standalone model that increases abnormal behavior detection performance by 111% over production systems and an embedding provider that enhances recommendation models by 104%. We present key insights from extensive ablation studies, benchmarks against production models, and case studies, highlighting valuable knowledge gained from developing TREASURE.
- Abstract(参考訳): 支払いネットワークは現代の商業のバックボーンを形成し、日々の活動から大量の取引記録を生成する。
このデータを適切にモデリングすることで、異常な行動検出や、過度に個人化された体験に対する消費者レベルの洞察といった応用が可能になり、最終的には人々の生活を改善することができる。
本稿では,TREASURE, TRansformer Engine As Scalable UniversalTransaction Representation Encoderを提案する。
このモデルは、消費者の行動と支払いネットワークの信号(応答コードやシステムフラグなど)を同時にキャプチャし、正確なレコメンデーションシステムや異常な行動検出のようなアプリケーションに必要な包括的な情報を提供する。
業界グレードのデータセットで検証されたTREASUREには、3つの重要な機能がある。
1) 静的および動的属性のための専用のサブモジュールを備えた入力モジュールで、より効率的なトレーニングと推論を可能にする。
2 高心性カテゴリー属性の予測のための効率的かつ効果的な訓練パラダイム
3) 実運用システム上での異常行動検出性能を111%向上させるスタンドアロンモデルと, 推奨モデルが104%向上する埋め込みプロバイダとしての有効性を示した。
TREASUREの開発から得られた貴重な知識に着目し、広範囲にわたるアブレーション研究、生産モデルに対するベンチマーク、ケーススタディから重要な知見を提示する。
関連論文リスト
- Automating Data-Driven Modeling and Analysis for Engineering Applications using Large Language Model Agents [3.344730946122235]
本稿では,Large Language Model (LLM) エージェントを用いてデータ駆動モデリングと分析を自動化する革新的なパイプラインを提案する。
協調エージェントを特徴とするマルチエージェントシステムと、Reasoning and Acting(ReAct)パラダイムに基づく単一エージェントシステムである。
論文 参考訳(メタデータ) (2025-10-01T19:28:35Z) - Sequential Data Augmentation for Generative Recommendation [54.765568804267645]
生成的レコメンデーションはパーソナライズされたシステムにおいて重要な役割を担い、ユーザの将来のインタラクションを過去の行動シーケンスから予測する。
データ拡張(Data augmentation)は、ユーザインタラクション履歴からトレーニングデータを構築するプロセスである。
我々は、サンプリングプロセスとして拡張をモデル化し、その結果のトレーニング分布の柔軟な制御を可能にする、原則化されたフレームワークであるGenPASを提案する。
ベンチマークと産業データセットを用いた実験により、GenPASは既存の戦略よりも精度、データ効率、パラメータ効率が優れていることが示された。
論文 参考訳(メタデータ) (2025-09-17T02:53:25Z) - EPR-GAIL: An EPR-Enhanced Hierarchical Imitation Learning Framework to Simulate Complex User Consumption Behaviors [13.436303786475348]
本研究では,データ駆動型GAIL(Generative Adversarial Learning)手法の忠実さと信頼性を高めることを提案する。
EPR-GAILフレームワークの中核となる考え方は、ユーザの消費行動を複雑なEPR決定プロセスとしてモデル化することです。
オンラインプラットフォーム上での2つの実世界のユーザ消費行動データセットの実験では、EPR-GAILフレームワークが、データの忠実度において、最高の最先端ベースラインを19%以上上回っていることが示されている。
論文 参考訳(メタデータ) (2025-03-09T01:56:42Z) - Multi-task CNN Behavioral Embedding Model For Transaction Fraud Detection [6.153407718616422]
深層学習法は不正検出に行動系列データを埋め込むのに欠かせないものとなっている。
本稿では,トランザクション不正検出のためのマルチタスクCNN行動埋め込みモデルを提案する。
1)拡張性とドメイン中心の帰納バイアスの観点からLSTMおよびTransformerモデルより優れたマルチレンジカーネルを特徴とするシングルレイヤCNN設計を導入する。
論文 参考訳(メタデータ) (2024-11-29T03:58:11Z) - A Utility-Mining-Driven Active Learning Approach for Analyzing Clickstream Sequences [21.38368444137596]
本研究では、SHAP値(HUSPM-SHAP)モデルを用いた高ユーティリティシーケンスパターンマイニングを提案する。
本研究は,電子商取引データ処理を改良し,より合理化され,コスト効率のよい予測モデルに向けたモデルの有効性を示す。
論文 参考訳(メタデータ) (2024-10-09T10:44:02Z) - Consumer Transactions Simulation through Generative Adversarial Networks [0.07373617024876725]
本稿では,合成小売取引データを生成するためのGAN(Generative Adversarial Networks)の革新的な応用について述べる。
我々は、SKUデータをGANアーキテクチャに統合し、より洗練された埋め込み手法を用いて従来の手法から切り離す。
その結果, 実物と実物を比較することで, シミュレーショントランザクションにおける現実性の向上が示された。
論文 参考訳(メタデータ) (2024-08-07T09:45:24Z) - Data-Juicer Sandbox: A Feedback-Driven Suite for Multimodal Data-Model Co-development [67.55944651679864]
統合データモデル共同開発に適した新しいサンドボックススイートを提案する。
このサンドボックスは、フィードバック駆動の実験プラットフォームを提供し、コスト効率とデータとモデルの両方のガイド付き洗練を可能にする。
論文 参考訳(メタデータ) (2024-07-16T14:40:07Z) - Fantastic Gains and Where to Find Them: On the Existence and Prospect of
General Knowledge Transfer between Any Pretrained Model [74.62272538148245]
事前訓練されたモデルの任意のペアリングに対して、一方のモデルは他方では利用できない重要なデータコンテキストを抽出する。
このような「補的」な知識を,性能劣化を伴わずに,あるモデルから別のモデルへ伝達できるかどうかを検討する。
論文 参考訳(メタデータ) (2023-10-26T17:59:46Z) - Few-Shot Named Entity Recognition: A Comprehensive Study [92.40991050806544]
マルチショット設定のモデル一般化能力を向上させるための3つの手法を検討する。
ラベル付きデータの比率の異なる10の公開nerデータセットについて経験的比較を行う。
マルチショットとトレーニングフリーの両方の設定で最新の結果を作成します。
論文 参考訳(メタデータ) (2020-12-29T23:43:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。