論文の概要: Customer Churn Prediction on Structured Data Using FT-Transformer and Stacking Ensembles
- arxiv url: http://arxiv.org/abs/2606.07582v1
- Date: Tue, 26 May 2026 23:02:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-15 07:09:36.744144
- Title: Customer Churn Prediction on Structured Data Using FT-Transformer and Stacking Ensembles
- Title(参考訳): FT変換器とスタックングアンサンブルを用いた構造化データの顧客チャーン予測
- Authors: Joyjit Roy, Samaresh Kumar Singh, Laxmi Shaw,
- Abstract要約: 本研究では,特徴量変換器(FT-Transformer)をキャリブレーション積み重ねによる勾配木と統合したハイブリッドアーキテクチャを提案する。
提案手法は, 統計的検証, 確率, キャリブレーションの持続的ギャップに対処し, 先行研究で確認された。
パブリックバンクチャーンデータセットでは、ハイブリッドモデル62.10% F1、0.861 AUC-ROC、0.647 PR-AUCがMulti-Layer Perceptron(MLP)ベースラインを3.37 F1ポイント、0.027 AUCを95%の信頼区間で上回っている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Customer churn prediction is essential across data-driven industries such as insurance, digital banking, eCommerce, and subscription platforms, where retaining existing customers is typically more cost-effective than acquiring new ones. Predicting churn on structured datasets remains challenging due to class imbalance, nonlinear feature interactions, and heterogeneous feature types. Tree-based ensemble methods consistently demonstrate strong performance in these contexts, often outperforming conventional neural networks. This study introduces a validated hybrid architecture that integrates feature-tokenized transformers (FT-Transformer) with gradient-boosted trees through calibration-aware stacking. The proposed framework addresses persistent gaps in statistical validation, probability calibration, and reproducibility found in prior research. The FT-Transformer captures higher-order feature interactions using self-attention, while XGBoost captures gradient-boosted decision boundaries with complementary inductive biases. Class imbalance is handled using class-weighted loss functions, thereby avoiding synthetic oversampling and preserving minority-class distributions. The models are ensembled using out-of-fold (OOF) stacking with a logistic regression meta-learner, which recalibrates overconfident base model outputs and learns optimal combination weights. On a public bank churn dataset, the hybrid model achieves 62.10% F1, 0.861 AUC-ROC, and 0.647 PR-AUC, outperforming the Multi-Layer Perceptron (MLP) baseline by 3.37 F1 points and 0.027 AUC under 5x5 cross-validation with 95% confidence intervals reported. Ablation studies demonstrate that both the transformer component and stacking strategy contribute materially to performance. The proposed methodology offers a reproducible and extensible reference architecture for contemporary churn prediction on structured tabular data.
- Abstract(参考訳): 顧客予測は、保険、デジタルバンキング、eコマース、サブスクリプションプラットフォームといったデータ駆動型産業において不可欠である。
構造化データセットのチャーン予測は、クラス不均衡、非線形特徴相互作用、異種特徴型によって依然として困難である。
木に基づくアンサンブル法は、これらの文脈において常に強い性能を示し、しばしば従来のニューラルネットワークよりも優れている。
本研究では,機能トークン変換器 (FT-Transformer) をキャリブレーション・アウェア・スタックリングにより勾配木に結合するハイブリッドアーキテクチャを提案する。
提案フレームワークは, 先行研究における統計的検証, 確率校正, 再現性において, 永続的なギャップに対処する。
FT-Transformerは自己アテンションを用いて高次特徴相互作用をキャプチャする一方、XGBoostは相補的帰納的バイアスで勾配付き決定境界をキャプチャする。
クラス不均衡はクラス重み付き損失関数を用いて処理されるため、合成オーバーサンプリングや少数クラス分布の保存は避けられる。
モデルは、論理的回帰メタリアナーによるアウト・オブ・フォールド(OOF)スタックを使用してアンサンブルされ、過剰に信頼されたベースモデルの出力を再検討し、最適な組み合わせ重み付けを学習する。
パブリックバンクチャーンデータセットでは、ハイブリッドモデルは62.10% F1、0.861 AUC-ROC、0.647 PR-AUCを達成し、Multi-Layer Perceptron(MLP)ベースラインを3.37 F1ポイント、0.027 AUCを5x5クロスバリデーションで上回り、95%信頼区間が報告されている。
アブレーション研究は、変圧器の構成要素と積み重ね戦略の両方が性能に重要な貢献をすることを示した。
提案手法は、構造化表データに対する現代チャーン予測のための再現可能かつ拡張可能な参照アーキテクチャを提供する。
関連論文リスト
- Revisiting Chebyshev Polynomial and Anisotropic RBF Models for Tabular Regression [0.7734726150561086]
チェビシェフ回帰器や放射基底関数(RBF)ネットワークのような滑らかな基底モデルが数値解析においてよく確立されている。
アプリケーションドメインによって編成された55の回帰データセットにまたがって、モデルをベンチマークできるかどうかを問う。
論文 参考訳(メタデータ) (2026-02-25T21:34:52Z) - CTTVAE: Latent Space Structuring for Conditional Tabular Data Generation on Imbalanced Datasets [0.0]
本稿では,2つの相補的機構を備えた条件変換器を用いたタブラル変分自動エンコーダであるCTTVAEを紹介する。
CTTVAE+TBSは、トレーニングを不安定にすることなく、より代表的で実用性に整ったサンプルを一貫して得る。
論文 参考訳(メタデータ) (2026-02-03T15:25:26Z) - Adaptive Dual-Weighting Framework for Federated Learning via Out-of-Distribution Detection [53.45696787935487]
Federated Learning (FL)は、大規模分散サービスノード間の協調的なモデルトレーニングを可能にする。
実世界のサービス指向デプロイメントでは、異種ユーザ、デバイス、アプリケーションシナリオによって生成されたデータは本質的にIIDではない。
FLoodは、オフ・オブ・ディストリビューション(OOD)検出にインスパイアされた新しいFLフレームワークである。
論文 参考訳(メタデータ) (2026-02-01T05:54:59Z) - Consolidation or Adaptation? PRISM: Disentangling SFT and RL Data via Gradient Concentration [56.074760766965085]
PRISMは、モデルの既存の知識との認知的対立度に基づいてデータを調停する動的認識フレームワークを実現する。
この結果から,内部最適化方式に基づくデータ分離が,スケーラブルでロバストなエージェントアライメントに不可欠であることが示唆された。
論文 参考訳(メタデータ) (2026-01-12T05:43:20Z) - Hybrid Interval Type-2 Mamdani-TSK Fuzzy System for Regression Analysis [0.8921166277011344]
ファジィシステムは不確実性と不正確性を扱うための代替のフレームワークを提供する。
本稿では,マンダニシステムの解釈可能性とTSKモデルの精度を組み合わせたファジィ回帰法を提案する。
論文 参考訳(メタデータ) (2025-10-15T11:35:58Z) - Structural Entropy Guided Probabilistic Coding [52.01765333755793]
構造エントロピー誘導型確率的符号化モデルSEPCを提案する。
我々は、構造エントロピー正規化損失を提案することにより、潜在変数間の関係を最適化に組み込む。
分類タスクと回帰タスクの両方を含む12の自然言語理解タスクに対する実験結果は、SEPCの優れた性能を示す。
論文 参考訳(メタデータ) (2024-12-12T00:37:53Z) - Boosting Differentiable Causal Discovery via Adaptive Sample Reweighting [62.23057729112182]
異なるスコアに基づく因果探索法は観測データから有向非巡回グラフを学習する。
本稿では,Reweighted Score関数ReScoreの適応重みを動的に学習することにより因果発見性能を向上させるためのモデルに依存しないフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-06T14:49:59Z) - Explicit Tradeoffs between Adversarial and Natural Distributional
Robustness [48.44639585732391]
実際、モデルは信頼性を確保するために両方のタイプの堅牢さを享受する必要があります。
本研究では, 対角線と自然分布の強靭性の間には, 明らかなトレードオフが存在することを示す。
論文 参考訳(メタデータ) (2022-09-15T19:58:01Z) - Federated Latent Class Regression for Hierarchical Data [5.110894308882439]
フェデレートラーニング(FL)は、多くのエージェントがローカルに保存されたデータを開示することなく、グローバル機械学習モデルのトレーニングに参加することを可能にする。
本稿では,新しい確率モデルである階層潜在クラス回帰(HLCR)を提案し,フェデレートラーニング(FEDHLCR)への拡張を提案する。
我々の推論アルゴリズムはベイズ理論から派生したもので、強い収束保証と過剰適合性を提供する。実験結果から、FEDHLCRは非IIDデータセットにおいても高速収束を提供することが示された。
論文 参考訳(メタデータ) (2022-06-22T00:33:04Z) - Merging Two Cultures: Deep and Statistical Learning [3.15863303008255]
深層学習と統計的学習の2つの文化を組み合わせることで、構造化された高次元データに対する洞察が得られる。
モデルの出力層における確率的手法を用いて予測,最適化,不確実性を実現できることを示す。
論文 参考訳(メタデータ) (2021-10-22T02:57:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。