論文の概要: Validation-Stage Combinatorial Fusion Analysis for Imbalanced Credit-Card Fraud Detection
- arxiv url: http://arxiv.org/abs/2606.10393v1
- Date: Tue, 09 Jun 2026 04:14:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-10 15:40:58.314392
- Title: Validation-Stage Combinatorial Fusion Analysis for Imbalanced Credit-Card Fraud Detection
- Title(参考訳): 不均衡クレジットカード不正検出のための検証段階組合せ核融合解析
- Authors: Xiao Han, Chenyu Wu,
- Abstract要約: 本稿では, Combinatorial Fusion Analysis (CFA) がIEEE-CIS Fraud Detectionベンチマークに価値を付加できるかどうかを検討する。
CFA は AUC-ROC のソフト投票と一致し、AUPRC と F1 を改善し、この設定では勾配の積み重ねを上回ります。
- 参考スコア(独自算出の注目度): 8.713333739961403
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Credit-card fraud detection is difficult because fraudulent transactions are rare, costly, and unevenly distributed. Strong gradient-boosted tree models already perform well on structured transaction data, so the value of another fusion method is not obvious. This paper examines whether Combinatorial Fusion Analysis (CFA), which searches over model subsets and rank-score fusion rules, can still add value on the IEEE-CIS Fraud Detection benchmark. Using a leakage-free 60/20/20 train/validation/test protocol, we evaluate 480 fusion configurations built from seven base classifiers. The best test-set result comes from diversity-weighted score fusion of Random Forest, XGBoost, and LightGBM (DEF WtScore), with AUC-ROC = 0.9405, AUPRC = 0.6699, and F1 = 0.6373. Bootstrap confidence intervals from 1,000 resamples show that the gains over the strongest single model exclude zero for all three metrics. CFA matches soft voting on AUC-ROC, improves AUPRC and F1, and outperforms stacking in this setting. A CTGAN augmentation experiment gives a negative result: synthetic fraud samples degrade both individual models and CFA. Overall, CFA is most useful here not as a way to combine every classifier, but as a validation-stage method for choosing a small, complementary subset and assigning diversity-aware weights.
- Abstract(参考訳): クレジットカードによる不正検出は、不正取引はまれで、コストがかかり、不均一に配布されるため困難である。
強勾配ブーストツリーモデルはすでに構造化トランザクションデータ上でうまく機能しているため、他の融合メソッドの値は明らかではない。
本稿では,モデルサブセットとランクスコアの融合ルールを探索する Combinatorial Fusion Analysis (CFA) が,IEEE-CIS Fraud Detectionベンチマークで価値を付加できるかどうかを検討する。
リークフリーな60/20/20トレイン/バリデーション/テストプロトコルを用いて、7つのベース分類器から構築された480の融合構成を評価する。
最も優れたテストセットは、AUC-ROC = 0.9405、AUPRC = 0.6699、F1 = 0.6373、Random Forest、XGBoost、LightGBM(DEF WtScore)の多彩なスコア融合である。
1,000のリサンプルからのブートストラップの信頼区間は、最強の単一モデルに対する利得が3つの指標すべてでゼロであることを示しています。
CFA は AUC-ROC のソフト投票と一致し、AUPRC と F1 を改善し、この設定での積み重ねを上回ります。
CTGAN増強実験は、個々のモデルとCFAの両方を合成詐欺サンプルが劣化させるという否定的な結果をもたらす。
全体として、CFAはすべての分類器を組み合わせる方法ではなく、小さな補完的な部分集合を選択し、多様性を意識した重みを割り当てる検証段階の方法として最も有用である。
関連論文リスト
- Distributional Energy-Based Models for Uncertainty-Aware Structured LLM Reasoning [40.342912574072024]
大規模言語モデルは、旅行計画やコードソリューションのような構造化されたアウトプットを生成する。
個々の推論ステップは正しく見えるが、アウトプット全体が予算に違反したり、テストケースに失敗したり、あるいは以前の推論に矛盾することがある。
構造化LCM出力の検証のための決定論的解析制約付き学習品質スコアラを提案する。
論文 参考訳(メタデータ) (2026-05-15T17:08:27Z) - Calibrated Confidence Estimation for Tabular Question Answering [0.0]
ECE 0.35-0.64 に対して、テキスト QA では 0.10-0.15 が報告されている)。
摂動二分法に対する一貫した自己評価は、両方のベンチマークと4つの完全にカバーされたモデル間で複製される。
構造を意識した再校正による二次貢献は、標準的なポストホック法よりもAUROCをパーセンテージポイントで改善する。
論文 参考訳(メタデータ) (2026-04-14T09:16:53Z) - Deterministic Fuzzy Triage for Legal Compliance Classification and Evidence Retrieval [0.0]
法律チームはますます、大量の契約上の証拠をトリアージするために機械学習を使用している。
多くのモデルは不透明で非決定論的であり、HIPAAやNERC-CIPのようなフレームワークと整合するのは難しい。
決定論的双対エンコーダと透明なファジィトリアージバンドに基づく簡単な再現可能な代替法について検討する。
論文 参考訳(メタデータ) (2026-03-08T00:31:34Z) - DISCO: Diversifying Sample Condensation for Efficient Model Evaluation [59.01400190971061]
コスト評価は傾向を低下させ、イノベーションのサイクルを遅くし、環境への影響を悪化させる。
モデル応答の多様性を最大化するサンプルを選択することが重要となる。
我々のメソッドである$textbfDiversifying Sample Condensation (DISCO)$は、最も大きなモデル不一致を持つトップkサンプルを選択します。
論文 参考訳(メタデータ) (2025-10-09T08:53:59Z) - Project-Probe-Aggregate: Efficient Fine-Tuning for Group Robustness [61.45587642780908]
画像テキスト基礎モデルのパラメータ効率向上のための3段階のアプローチを提案する。
本手法は, マイノリティ標本同定とロバストトレーニングアルゴリズムの2つの重要な要素を改良する。
我々の理論分析は,PPAが少数群の識別を向上し,バランスの取れたグループエラーを最小限に抑えるためにベイズが最適であることを示している。
論文 参考訳(メタデータ) (2025-03-12T15:46:12Z) - Robust Conformal Prediction with a Single Binary Certificate [58.450154976190795]
コンフォーマル予測(CP)は、任意のモデルの出力を、真のラベルを(調整可能な)高い確率でカバーすることを保証した予測セットに変換する。
我々は,MCサンプルが著しく低い場合でも,より小さな集合を生成する頑健な共形予測を提案する。
論文 参考訳(メタデータ) (2025-03-07T08:41:53Z) - SPLITZ: Certifiable Robustness via Split Lipschitz Randomized Smoothing [8.471466670802817]
SPLITZは、敵の例に証明可能な堅牢性を提供するための実用的で斬新なアプローチである。
SPLITZのモチベーションは、多くの標準ディープネットワークがリプシッツ定数の不均一性を示すという観察から来ている。
SPLITZは、MNIST、CIFAR-10、ImageNetデータセットにおける既存の最先端のアプローチを一貫して改善することを示す。
論文 参考訳(メタデータ) (2024-07-03T05:13:28Z) - Noisy Correspondence Learning with Self-Reinforcing Errors Mitigation [63.180725016463974]
クロスモーダル検索は、実際は精力的な、十分に整合した大規模データセットに依存している。
我々は、新しい雑音対応学習フレームワーク、textbfSelf-textbfReinforcing textbfErrors textbfMitigation(SREM)を導入する。
論文 参考訳(メタデータ) (2023-12-27T09:03:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。