論文の概要: Mitigating Model Drift in Developing Economies Using Synthetic Data and Outliers
- arxiv url: http://arxiv.org/abs/2510.09294v2
- Date: Mon, 13 Oct 2025 06:30:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 13:29:55.71937
- Title: Mitigating Model Drift in Developing Economies Using Synthetic Data and Outliers
- Title(参考訳): 合成データと出力器を用いた経済発展におけるモデルドリフトの緩和
- Authors: Ilyas Varshavskiy, Bonu Boboeva, Shuhrat Khalilbekov, Azizjon Azimi, Sergey Shulgin, Akhlitdin Nizamitdinov, Haitz Sáez de Ocáriz Borde,
- Abstract要約: 本研究では, 予期せぬ衝撃に対するモデル安定性を向上させるために, ほとんど探索されていないアプローチである合成外圧器の使用について検討する。
実験の結果, 基本モデルと比較して, ごく少量の合成異常値を加えると安定性が向上することがわかった。
- 参考スコア(独自算出の注目度): 3.8521347060019338
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Machine Learning models in finance are highly susceptible to model drift, where predictive performance declines as data distributions shift. This issue is especially acute in developing economies such as those in Central Asia and the Caucasus - including Tajikistan, Uzbekistan, Kazakhstan, and Azerbaijan - where frequent and unpredictable macroeconomics shocks destabilize financial data. To the best of our knowledge, this is among the first studies to examine drift mitigation methods on financial datasets from these regions. We investigate the use of synthetic outliers, a largely unexplored approach, to improve model stability against unforeseen shocks. To evaluate effectiveness, we introduce a two-level framework that measures both the extent of performance degradation and the severity of shocks. Our experiments on macroeconomic tabular datasets show that adding a small proportion of synthetic outliers generally improves stability compared to baseline models, though the optimal amount varies by dataset and model
- Abstract(参考訳): 金融の機械学習モデルは、データ分散がシフトするにつれて予測性能が低下するモデルドリフトに非常に影響を受けやすい。
この問題は、中央アジアやコーカサス(タジキスタン、ウズベキスタン、カザフスタン、アゼルバイジャンなど)などの発展途上国では特に深刻な問題である。
我々の知る限りでは、これらの地域の金融データセットのドリフト緩和手法を最初に研究した研究の一つである。
本研究では, 予期せぬ衝撃に対するモデル安定性を向上させるために, ほとんど探索されていないアプローチである合成外圧器の使用について検討する。
性能劣化の程度と衝撃の深刻度を両立する2段階の枠組みを提案する。
マクロ経済表層データセットを用いた実験により, 合成アウトリーチの比率が小さいと, ベースラインモデルに比べて安定性が向上することがわかったが, 最適量はデータセットやモデルによって異なる。
関連論文リスト
- Generalisation Bounds of Zero-Shot Economic Forecasting using Time Series Foundation Models [1.131401554081614]
本研究では,時系列基礎モデルのマクロ経済指標に対するゼロショット予測能力について検討した。
データスカース条件と構造破壊の下で、最先端の3つのTSFMをバックテストしました。
この結果から, TSFMは微調整がなければ, 安定した経済環境下での古典的モデルに適合し, 超過することができることが示唆された。
論文 参考訳(メタデータ) (2025-05-30T03:10:46Z) - A Theoretical Perspective: How to Prevent Model Collapse in Self-consuming Training Loops [55.07063067759609]
高品質なデータは大規模な生成モデルのトレーニングには不可欠だが、オンラインで利用可能な実際のデータの膨大な蓄積はほとんど枯渇している。
モデルは、さらなるトレーニングのために独自のデータを生成し、自己消費訓練ループ(STL)を形成する。
一部のモデルは劣化または崩壊するが、他のモデルはこれらの失敗をうまく回避し、理論的な理解にかなりのギャップを残している。
論文 参考訳(メタデータ) (2025-02-26T06:18:13Z) - Class-Imbalanced-Aware Adaptive Dataset Distillation for Scalable Pretrained Model on Credit Scoring [10.737033782376905]
金融データセット上での大規模事前学習モデルの適用を拡大するための新しいフレームワークを提案する。
我々は,データセット蒸留における不均衡認識技術を統合することにより,財務データセットの性能が向上した。
論文 参考訳(メタデータ) (2025-01-18T06:59:36Z) - On conditional diffusion models for PDE simulations [53.01911265639582]
スパース観測の予測と同化のためのスコアベース拡散モデルについて検討した。
本稿では,予測性能を大幅に向上させる自動回帰サンプリング手法を提案する。
また,条件付きスコアベースモデルに対する新たなトレーニング戦略を提案する。
論文 参考訳(メタデータ) (2024-10-21T18:31:04Z) - A Novel Framework for Analyzing Structural Transformation in Data-Constrained Economies Using Bayesian Modeling and Machine Learning [0.0]
農業経済からより多様化した産業やサービスベースのシステムへの移行は、経済発展の重要な要因である。
低所得国と中所得国(LMIC)では、データの不足と信頼性の欠如が、このプロセスの正確な評価を妨げる。
本稿では,ベイジアン階層モデリング,機械学習に基づくデータ計算,因子分析を統合することで,これらの課題に対処する新しい統計フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-25T08:39:41Z) - The Risk of Federated Learning to Skew Fine-Tuning Features and
Underperform Out-of-Distribution Robustness [50.52507648690234]
フェデレートされた学習は、微調整された特徴をスキイングし、モデルの堅牢性を損なうリスクがある。
3つのロバスト性指標を導入し、多様なロバストデータセットで実験を行う。
提案手法は,パラメータ効率のよい微調整手法を含む多種多様なシナリオにまたがるロバスト性を著しく向上させる。
論文 参考訳(メタデータ) (2024-01-25T09:18:51Z) - Fast Model Debias with Machine Unlearning [54.32026474971696]
ディープニューラルネットワークは多くの現実世界のシナリオでバイアスのある振る舞いをする。
既存のデバイアス法は、バイアスラベルやモデル再トレーニングのコストが高い。
バイアスを特定し,評価し,除去するための効率的なアプローチを提供する高速モデル脱バイアスフレームワーク(FMD)を提案する。
論文 参考訳(メタデータ) (2023-10-19T08:10:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。