論文の概要: Two-stage Modeling for Prediction with Confidence
- arxiv url: http://arxiv.org/abs/2209.08848v1
- Date: Mon, 19 Sep 2022 08:48:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-20 17:07:28.335020
- Title: Two-stage Modeling for Prediction with Confidence
- Title(参考訳): 信頼を伴う予測のための2段階モデリング
- Authors: Dangxing Chen
- Abstract要約: 分布シフト条件下でニューラルネットワークの性能を一般化することは困難である。
本稿では,分散シフト問題に対する新しい2段階モデルを提案する。
我々のモデルは、ほとんどのデータセットに対して信頼性の高い予測を提供することを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The use of neural networks has been very successful in a wide variety of
applications. However, it has recently been observed that it is difficult to
generalize the performance of neural networks under the condition of
distributional shift. Several efforts have been made to identify potential
out-of-distribution inputs. Although existing literature has made significant
progress with regard to images and textual data, finance has been overlooked.
The aim of this paper is to investigate the distribution shift in the credit
scoring problem, one of the most important applications of finance. For the
potential distribution shift problem, we propose a novel two-stage model. Using
the out-of-distribution detection method, data is first separated into
confident and unconfident sets. As a second step, we utilize the domain
knowledge with a mean-variance optimization in order to provide reliable bounds
for unconfident samples. Using empirical results, we demonstrate that our model
offers reliable predictions for the vast majority of datasets. It is only a
small portion of the dataset that is inherently difficult to judge, and we
leave them to the judgment of human beings. Based on the two-stage model,
highly confident predictions have been made and potential risks associated with
the model have been significantly reduced.
- Abstract(参考訳): ニューラルネットワークの利用は、さまざまなアプリケーションで非常に成功しています。
しかし,近年,分布シフト条件下でニューラルネットワークの性能を一般化することは困難であることが観測されている。
アウト・オブ・ディストリビューションの可能性のある入力を特定するために、いくつかの取り組みがなされている。
既存の文献は画像やテキストデータに関して大きな進歩を遂げているが、財務は見過ごされている。
本研究の目的は、金融の最も重要な応用である信用スコアリング問題の分布変化を調査することである。
ポテンシャル分布シフト問題に対して,新しい二段階モデルを提案する。
out-of-distribution detectionメソッドを使用して、データはまず、自信と自信のないセットに分離される。
第2のステップとして、信頼できないサンプルに対して信頼できる境界を提供するために、平均分散最適化でドメイン知識を利用する。
実験結果を用いて、我々のモデルは、大多数のデータセットに対して信頼できる予測を提供することを示した。
データセットのごく一部に過ぎず、本質的に判断が難しく、人間の判断に委ねられているのです。
2段階モデルに基づいて、高い信頼性の予測が行われ、モデルに関連する潜在的なリスクが大幅に低減された。
関連論文リスト
- Estimating Uncertainty with Implicit Quantile Network [0.0]
不確かさの定量化は多くの性能クリティカルなアプリケーションにおいて重要な部分である。
本稿では,アンサンブル学習やベイズニューラルネットワークなど,既存のアプローチに対する簡単な代替手段を提供する。
論文 参考訳(メタデータ) (2024-08-26T13:33:14Z) - Debiasing Multimodal Models via Causal Information Minimization [65.23982806840182]
我々は、マルチモーダルデータのための因果グラフにおいて、共同創設者から生じるバイアスを研究する。
ロバストな予測機能は、モデルがアウト・オブ・ディストリビューションデータに一般化するのに役立つ多様な情報を含んでいる。
これらの特徴を共同設立者表現として使用し、因果理論によって動機づけられた手法を用いてモデルからバイアスを取り除く。
論文 参考訳(メタデータ) (2023-11-28T16:46:14Z) - Overcoming Overconfidence for Active Learning [1.2776312584227847]
本稿では,アクティブな学習シナリオで発生する過信の問題に対処する2つの新しい手法を提案する。
1つ目はCross-Mix-and-Mix(CMaM)と呼ばれる拡張戦略で、限られたトレーニング分布を拡張してモデルを校正することを目的としている。
2つ目は Ranked Margin Sampling (RankedMS) という選択戦略である。
論文 参考訳(メタデータ) (2023-08-21T09:04:54Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z) - Predicting with Confidence on Unseen Distributions [90.68414180153897]
ドメイン適応と予測不確実性文学を結びつけて、挑戦的な未知分布のモデル精度を予測する。
分類器の予測における信頼度(DoC)の差は,様々な変化に対して,分類器の性能変化を推定することに成功した。
具体的には, 合成分布と自然分布の区別について検討し, その単純さにもかかわらず, DoCは分布差の定量化に優れることを示した。
論文 参考訳(メタデータ) (2021-07-07T15:50:18Z) - Improving Uncertainty Calibration via Prior Augmented Data [56.88185136509654]
ニューラルネットワークは、普遍関数近似器として機能することで、複雑なデータ分布から学習することに成功した。
彼らはしばしば予測に自信過剰であり、不正確で誤った確率的予測に繋がる。
本稿では,モデルが不当に過信である特徴空間の領域を探索し,それらの予測のエントロピーをラベルの以前の分布に対して条件的に高める手法を提案する。
論文 参考訳(メタデータ) (2021-02-22T07:02:37Z) - Unlabelled Data Improves Bayesian Uncertainty Calibration under
Covariate Shift [100.52588638477862]
後続正則化に基づく近似ベイズ推定法を開発した。
前立腺癌の予後モデルを世界規模で導入する上で,本手法の有用性を実証する。
論文 参考訳(メタデータ) (2020-06-26T13:50:19Z) - Diversity inducing Information Bottleneck in Model Ensembles [73.80615604822435]
本稿では,予測の多様性を奨励することで,ニューラルネットワークの効果的なアンサンブルを生成する問題をターゲットにする。
そこで本研究では,潜伏変数の学習における逆損失の多様性を明示的に最適化し,マルチモーダルデータのモデリングに必要な出力予測の多様性を得る。
最も競争力のあるベースラインと比較して、データ分布の変化の下で、分類精度が大幅に向上した。
論文 参考訳(メタデータ) (2020-03-10T03:10:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。