論文の概要: Time Series Feature Redundancy Paradox: An Empirical Study Based on Mortgage Default Prediction
- arxiv url: http://arxiv.org/abs/2501.00034v1
- Date: Mon, 23 Dec 2024 21:28:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-05 21:12:44.786434
- Title: Time Series Feature Redundancy Paradox: An Empirical Study Based on Mortgage Default Prediction
- Title(参考訳): 時系列特徴冗長パラドックス:モーゲージデフォルト予測に基づく実証的研究
- Authors: Chengyue Huang, Yahe Yang,
- Abstract要約: 従来の知恵は、長いトレーニング期間とより多くの機能変数がモデルのパフォーマンス向上に寄与することを示している。
本稿では、住宅ローンのデフォルト予測に着目し、従来の知識と矛盾する現象を実証的に発見する。
- 参考スコア(独自算出の注目度): 0.5755004576310334
- License:
- Abstract: With the widespread application of machine learning in financial risk management, conventional wisdom suggests that longer training periods and more feature variables contribute to improved model performance. This paper, focusing on mortgage default prediction, empirically discovers a phenomenon that contradicts traditional knowledge: in time series prediction, increased training data timespan and additional non-critical features actually lead to significant deterioration in prediction effectiveness. Using Fannie Mae's mortgage data, the study compares predictive performance across different time window lengths (2012-2022) and feature combinations, revealing that shorter time windows (such as single-year periods) paired with carefully selected key features yield superior prediction results. The experimental results indicate that extended time spans may introduce noise from historical data and outdated market patterns, while excessive non-critical features interfere with the model's learning of core default factors. This research not only challenges the traditional "more is better" approach in data modeling but also provides new insights and practical guidance for feature selection and time window optimization in financial risk prediction.
- Abstract(参考訳): 機械学習が金融リスク管理に広く応用されていることから、従来の知恵は、より長いトレーニング期間とより多くの特徴変数がモデルの性能向上に寄与することを示唆している。
本稿では、住宅ローンのデフォルト予測に焦点をあて、時系列予測、トレーニングデータタイムパンの増加、その他の非クリティカルな特徴など、従来の知識と矛盾する現象を実証的に発見し、予測の有効性を著しく低下させる。
ファニー・メイの住宅ローンデータを用いて、異なる時間窓の長さ(2012-2022)と特徴の組み合わせの予測性能を比較し、より短い時間窓(例えば1年周期)が慎重に選択された重要な特徴と組み合わせることで、より優れた予測結果が得られることを示した。
実験結果から,過去のデータや時代遅れの市場パターンからノイズが生じる可能性がある一方で,過剰な非クリティカルな特徴がモデルのデフォルト要素の学習を妨げている可能性が示唆された。
この研究は、データモデリングにおける従来の「より良い」アプローチに挑戦するだけでなく、金融リスク予測における特徴選択と時間窓最適化のための新しい洞察と実践的なガイダンスを提供する。
関連論文リスト
- Deconfounding Time Series Forecasting [1.5967186772129907]
時系列予測は様々な領域において重要な課題であり、正確な予測は情報的な意思決定を促進する。
従来の予測手法は、しばしば将来の結果を予測するために変数の現在の観測に依存している。
本稿では,過去のデータから得られた潜在的共同設立者の表現を取り入れた予測手法を提案する。
論文 参考訳(メタデータ) (2024-10-27T12:45:42Z) - A Spatio-Temporal Machine Learning Model for Mortgage Credit Risk: Default Probabilities and Loan Portfolios [11.141688859736805]
本稿では,木ブースティングと遅延時間-ガウス過程モデルを組み合わせることで,信用リスクを考慮した機械学習モデルを提案する。
個人ローンポートフォリオ損失分布の予測デフォルト確率は、従来の独立線形ハザードモデルと比較してより正確であることがわかった。
論文 参考訳(メタデータ) (2024-10-03T15:10:55Z) - Learning Graph Structures and Uncertainty for Accurate and Calibrated Time-series Forecasting [65.40983982856056]
本稿では,時系列間の相関を利用して時系列間の構造を学習し,精度の高い正確な予測を行うSTOICを紹介する。
幅広いベンチマークデータセットに対して、STOICは16%の精度とキャリブレーションのよい予測を提供する。
論文 参考訳(メタデータ) (2024-07-02T20:14:32Z) - Rating Multi-Modal Time-Series Forecasting Models (MM-TSFM) for Robustness Through a Causal Lens [10.103561529332184]
ノイズや不正なデータによる不正確さが誤った予測につながるような,マルチモーダルな時系列予測に重点を置いている。
本稿では,マルチモーダル時系列予測モデルのロバスト性を評価するための評価手法を提案する。
論文 参考訳(メタデータ) (2024-06-12T17:39:16Z) - Enhancing Mean-Reverting Time Series Prediction with Gaussian Processes:
Functional and Augmented Data Structures in Financial Forecasting [0.0]
本稿では,ガウス過程(GP)を基礎構造を持つ平均回帰時系列の予測に適用する。
GPは、平均予測だけでなく、将来の軌道上の確率分布全体を予測する可能性を提供する。
これは、不正なボラティリティ評価が資本損失につながる場合、正確な予測だけでは十分でない金融状況において特に有益である。
論文 参考訳(メタデータ) (2024-02-23T06:09:45Z) - Loss Shaping Constraints for Long-Term Time Series Forecasting [79.3533114027664]
本稿では,長期時系列予測のための制約付き学習手法を提案する。
提案手法は, 予測ウィンドウ上でエラーを発生させながら, 時系列ベンチマークにおける競合平均性能を示すことを示すための, 実用的なプリマル・デュアルアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-02-14T18:20:44Z) - Predictive Churn with the Set of Good Models [64.05949860750235]
近似機械学習モデルの集合に対する競合予測の効果について検討する。
ラーショモン集合内のモデル間の係り受けに関する理論的結果を示す。
当社のアプローチは、コンシューマ向けアプリケーションにおいて、より予測し、削減し、混乱を避けるためにどのように使用できるかを示します。
論文 参考訳(メタデータ) (2024-02-12T16:15:25Z) - Performative Time-Series Forecasting [71.18553214204978]
我々は,機械学習の観点から,パフォーマンス時系列予測(PeTS)を定式化する。
本稿では,予測分布シフトに対する遅延応答の概念を活用する新しい手法であるFeature Performative-Shifting(FPS)を提案する。
新型コロナウイルスの複数の時系列モデルと交通予報タスクを用いた総合的な実験を行った。
論文 参考訳(メタデータ) (2023-10-09T18:34:29Z) - DeepVol: Volatility Forecasting from High-Frequency Data with Dilated Causal Convolutions [53.37679435230207]
本稿では,Dilated Causal Convolutionsに基づくDeepVolモデルを提案する。
実験結果から,提案手法は高頻度データからグローバルな特徴を効果的に学習できることが示唆された。
論文 参考訳(メタデータ) (2022-09-23T16:13:47Z) - Uncertainty-Aware Time-to-Event Prediction using Deep Kernel Accelerated
Failure Time Models [11.171712535005357]
本稿では,時間-時間予測タスクのためのDeep Kernel Accelerated Failure Timeモデルを提案する。
我々のモデルは、2つの実世界のデータセットの実験において、繰り返しニューラルネットワークに基づくベースラインよりも良い点推定性能を示す。
論文 参考訳(メタデータ) (2021-07-26T14:55:02Z) - Low-Rank Temporal Attention-Augmented Bilinear Network for financial
time-series forecasting [93.73198973454944]
ディープラーニングモデルは、金融時系列データの予測問題など、さまざまな領域から来る多くの問題において、大幅なパフォーマンス改善をもたらしている。
近年,制限順序書の時系列予測の効率的かつ高性能なモデルとして,時間的注意強化バイリニアネットワークが提案されている。
本稿では,モデルの低ランクテンソル近似を提案し,トレーニング可能なパラメータの数をさらに削減し,その速度を向上する。
論文 参考訳(メタデータ) (2021-07-05T10:15:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。