論文の概要: From Complaint Narratives to Monetary Relief: A Hybrid Machine Learning Framework for CFPB Consumer Complaints
- arxiv url: http://arxiv.org/abs/2606.22664v1
- Date: Sun, 21 Jun 2026 20:41:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-25 07:44:07.999064
- Title: From Complaint Narratives to Monetary Relief: A Hybrid Machine Learning Framework for CFPB Consumer Complaints
- Title(参考訳): 苦情から金銭的救済へ:CFPB消費者不満のためのハイブリッド機械学習フレームワーク
- Authors: Zhuoer Wang, Sizhen Zhu, Xiongyu Chen,
- Abstract要約: 本稿では、消費者金融保護局の苦情データを用いて、金融救済効果を予測するためのハイブリッド機械学習フレームワークを提案する。
本研究では,不均衡な二項分類問題としてその課題を定式化し,金銭的救済でクローズドな苦情を補償可能な結果として扱う。
XGBoost分類器は、時間的列車分割を用いて訓練され、モデル開発に使用された初期の苦情と、より最近のサンプル外評価のために予約された苦情がある。
- 参考スコア(独自算出の注目度): 1.3465168113172192
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Consumer financial complaints provide a valuable source of information for identifying service failures, dispute frictions, and operational deficiencies in consumer-facing financial institutions. This paper proposes a hybrid machine learning framework for predicting monetary relief outcomes using Consumer Financial Protection Bureau complaint data. We formulate the task as an imbalanced binary classification problem, where complaints closed with monetary relief are treated as compensable outcomes. The proposed framework integrates multiple sources of predictive information, including complaint narrative text, LDA-based topic representations, interpretable text-engineered features, and structured categorical attributes such as company and state. An XGBoost classifier is trained using a temporal train-test split, with earlier complaints used for model development and more recent complaints reserved for out-of-sample evaluation. Compared with a TF-IDF baseline, the proposed framework substantially improves predictive performance, increasing AUC-ROC from 0.69 to 0.78 and improving PR-AUC under class imbalance. Feature importance analysis shows that textual signals, latent complaint topics, and company identity all contribute meaningful predictive information. In particular, company-level effects reveal systematic variation in complaint resolution patterns across financial institutions. These findings suggest that consumer complaint narratives can serve as alternative data for monitoring consumer harm, identifying firm-level operational weaknesses, and supporting early-stage risk surveillance in consumer finance.
- Abstract(参考訳): 消費者金融苦情は、消費者が直面する金融機関のサービス障害、紛争摩擦、運用上の欠陥を特定するための貴重な情報源を提供する。
本稿では、消費者金融保護局の苦情データを用いて、金融救済効果を予測するためのハイブリッド機械学習フレームワークを提案する。
本研究では,不均衡な二項分類問題としてその課題を定式化し,金銭的救済でクローズドな苦情を補償可能な結果として扱う。
提案フレームワークは,苦情文,LDAに基づく話題表現,解釈可能なテキスト工学的特徴,企業や状態などの構造的分類属性など,複数の予測情報ソースを統合している。
XGBoost分類器は、時間的列車分割を用いて訓練され、モデル開発に使用された初期の苦情と、より最近のサンプル外評価のために予約された苦情がある。
TF-IDFベースラインと比較して、提案フレームワークは予測性能を大幅に向上し、AUC-ROCを0.69から0.78に増加させ、PR-AUCをクラス不均衡下で改善する。
特徴重要度分析は, 有意な予測情報に, テキスト信号, 潜在的苦情, 企業アイデンティティが寄与していることを示している。
特に、企業レベルの影響は、金融機関間での苦情解決パターンの体系的な変化を示している。
これらの結果は、消費者の苦情は、消費者の被害を監視し、企業レベルの運用上の弱点を特定し、消費者金融における早期のリスク監視を支援するための代替データとして役立つことを示唆している。
関連論文リスト
- FERA: Uncertainty-Aware Federated Reasoning for Large Language Models [60.52562148874846]
我々は、サーバがプライベートなデモンストレーションを行う異種クライアントと協調することで、多段階推論を改善するフェデレーション推論について研究する。
重要な課題は、クライアントの信頼性がクエリ依存であるのに対して、サーバはクライアントデータを検査して、どのコントリビューションが信頼できるかを判断できません。
本稿では,サーバクライアントの反復的コリファインメントに基づくトレーニングフリーフレームワークである Uncertainty-Aware Federated Reasoning (FERA) を提案する。
論文 参考訳(メタデータ) (2026-05-11T07:04:51Z) - Fraud Detection System for Banking Transactions [0.0]
本研究では、PaySim合成金融トランザクションデータセットを利用した機械学習による不正検出フレームワークを提案する。
提案するフレームワークは、FinTechトランザクションシステムにおける不正防止機能を強化する、堅牢でスケーラブルなソリューションを提供する。
論文 参考訳(メタデータ) (2026-04-09T08:17:27Z) - Dynamic analysis enhances issue resolution [53.50448142467294]
DAIRA(Dynamic Analysis-enhanced Issue Resolution Agent)は、エージェントの推論サイクルに動的解析を組み込む自動修復フレームワークである。
テストトレース駆動の方法論によって駆動されるDAIRAは、軽量モニタを使用して重要なランタイムデータを抽出する。
Gemini 3 Flash Previewを使用すると、DAIRAは新たな最先端(SOTA)パフォーマンスを確立し、SWE-bench Verifiedデータセットで79.4%の解像度を達成する。
論文 参考訳(メタデータ) (2026-03-23T14:48:54Z) - Financial Fraud Identification and Interpretability Study for Listed Companies Based on Convolutional Neural Network [4.504327589607446]
本稿では、畳み込みニューラルネットワーク(CNN)に基づく中国のAシェア上場企業を対象とした金融不正検出フレームワークを提案する。
実験の結果、CNNはロジスティック回帰とLightGBMの精度、堅牢性、早期警戒性能に優れていた。
環境指標は, 主に高汚染産業において重要であり, 可溶性, 比構造, 統治構造, 内部統制が詐欺の一般的な予測要因であることがわかった。
論文 参考訳(メタデータ) (2025-12-07T04:14:16Z) - Certifiably Byzantine-Robust Federated Conformal Prediction [49.23374238798428]
本稿では,悪意のあるクライアントに対する堅牢な共形予測を行う新しいフレームワークRob-FCPを提案する。
我々は、さまざまなビザンチン攻撃の下で、悪意のあるクライアントの多様な割合に対するRob-FCPの堅牢性を実証的に実証した。
論文 参考訳(メタデータ) (2024-06-04T04:43:30Z) - On the Potential of Network-Based Features for Fraud Detection [3.0846824529023382]
本稿では、パーソナライズされたPageRank(PPR)アルゴリズムを用いて、詐欺の社会的ダイナミクスを捉える。
主な目的は、従来の特徴と不正検出モデルにおけるPPRの追加を比較することである。
その結果,PPRの統合はモデルの予測能力を向上し,ベースラインモデルを上回ることが示唆された。
論文 参考訳(メタデータ) (2024-02-14T13:20:09Z) - Relational Graph Neural Networks for Fraud Detection in a Super-App
environment [53.561797148529664]
スーパーアプリケーションの金融サービスにおける不正行為防止のための関係グラフ畳み込みネットワーク手法の枠組みを提案する。
我々は,グラフニューラルネットワークの解釈可能性アルゴリズムを用いて,ユーザの分類タスクに対する最も重要な関係を判定する。
以上の結果から,Super-Appの代替データと高接続性で得られるインタラクションを利用するモデルには,付加価値があることが示唆された。
論文 参考訳(メタデータ) (2021-07-29T00:02:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。