論文の概要: Probabilistic Diagnostic Tests for Degradation Problems in Supervised
Learning
- arxiv url: http://arxiv.org/abs/2004.02988v2
- Date: Wed, 15 Apr 2020 19:12:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-16 05:26:58.884248
- Title: Probabilistic Diagnostic Tests for Degradation Problems in Supervised
Learning
- Title(参考訳): 教師付き学習における劣化問題の確率論的診断
- Authors: Gustavo A. Valencia-Zapata, Carolina Gonzalez-Canas, Michael G.
Zentner, Okan Ersoy, and Gerhard Klimeck
- Abstract要約: 分類アルゴリズムにおけるクラス不均衡、重なり合い、小さな分散、ノイズラベル、スパース限界精度などの問題。
各問題の兆候と症状の同定に基づく確率診断モデルを示す。
いくつかの教師付きアルゴリズムの動作と性能は、トレーニングセットにそのような問題がある場合に研究される。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Several studies point out different causes of performance degradation in
supervised machine learning. Problems such as class imbalance, overlapping,
small-disjuncts, noisy labels, and sparseness limit accuracy in classification
algorithms. Even though a number of approaches either in the form of a
methodology or an algorithm try to minimize performance degradation, they have
been isolated efforts with limited scope. Most of these approaches focus on
remediation of one among many problems, with experimental results coming from
few datasets and classification algorithms, insufficient measures of prediction
power, and lack of statistical validation for testing the real benefit of the
proposed approach. This paper consists of two main parts: In the first part, a
novel probabilistic diagnostic model based on identifying signs and symptoms of
each problem is presented. Thereby, early and correct diagnosis of these
problems is to be achieved in order to select not only the most convenient
remediation treatment but also unbiased performance metrics. Secondly, the
behavior and performance of several supervised algorithms are studied when
training sets have such problems. Therefore, prediction of success for
treatments can be estimated across classifiers.
- Abstract(参考訳): いくつかの研究は、教師あり機械学習における性能劣化の原因を指摘している。
分類アルゴリズムにおけるクラス不均衡、重なり合い、小さな分散、ノイズラベル、スパース限界精度などの問題。
方法論やアルゴリズムという形で多くのアプローチがパフォーマンスの低下を最小限に抑えようと試みているが、それらは限られた範囲で孤立した取り組みであった。
これらのアプローチの多くは、少数のデータセットと分類アルゴリズムによる実験結果、予測能力の不十分な測定結果、提案したアプローチの真のメリットをテストするための統計的検証の欠如など、多くの問題の修正に重点を置いている。
本論文は2つの主要な部分から構成される。まず,各問題の兆候と症状を同定した新しい確率的診断モデルを示す。
これにより、最も便利な修復治療だけでなく、偏りのないパフォーマンス指標を選択するために、これらの問題の早期かつ正確な診断が達成される。
次に,複数の教師付きアルゴリズムの動作と性能について,学習集合がそのような問題を持つ場合に検討する。
したがって、治療の成功予測は分類器間で推定できる。
関連論文リスト
- Predictor-Rejector Multi-Class Abstention: Theoretical Analysis and Algorithms [30.389055604165222]
マルチクラス分類設定において,留意を伴う学習の鍵となる枠組みについて検討する。
この設定では、学習者は事前に定義されたコストで予測をしないことを選択できる。
我々は、強い非漸近的および仮説的整合性を保証するために、いくつかの新しい代理損失の族を導入する。
論文 参考訳(メタデータ) (2023-10-23T10:16:27Z) - A Unified Generalization Analysis of Re-Weighting and Logit-Adjustment
for Imbalanced Learning [129.63326990812234]
そこで本研究では,データ依存型コンダクタンス(Data-dependent contraction)と呼ばれる手法を提案する。
この技術に加えて、不均衡学習のための微粒な一般化境界が確立され、再重み付けとロジット調整の謎を明らかにするのに役立つ。
論文 参考訳(メタデータ) (2023-10-07T09:15:08Z) - Predictive Coding beyond Correlations [59.47245250412873]
このようなアルゴリズムのうちの1つは、予測符号化と呼ばれ、因果推論タスクを実行することができるかを示す。
まず、予測符号化の推論過程における簡単な変化が、因果グラフを再利用したり再定義したりすることなく、介入を計算できることを示す。
論文 参考訳(メタデータ) (2023-06-27T13:57:16Z) - Adaptive Learning for the Resource-Constrained Classification Problem [14.19197444541245]
リソース制約された分類タスクは、病気診断のためのテストの割り当てなど、現実世界のアプリケーションで一般的である。
資源制約と協調学習を反復的に微調整による誤分類コストによって考慮した適応学習手法を設計する。
資源制約のある分類問題に対処する手法のレパートリーとして,適応学習アプローチを重要視する。
論文 参考訳(メタデータ) (2022-07-19T11:00:33Z) - Towards Diverse Evaluation of Class Incremental Learning: A Representation Learning Perspective [67.45111837188685]
クラスインクリメンタル学習(CIL)アルゴリズムは、インクリメンタルに到着したデータから新しいオブジェクトクラスを継続的に学習することを目的としている。
表現学習における様々な評価プロトコルを用いて,CILアルゴリズムによって訓練されたニューラルネットワークモデルを実験的に解析する。
論文 参考訳(メタデータ) (2022-06-16T11:44:11Z) - Learning to Rank Anomalies: Scalar Performance Criteria and Maximization
of Two-Sample Rank Statistics [0.0]
本稿では,観測結果の異常度を反映した特徴空間上で定義されたデータ駆動スコアリング関数を提案する。
このスコアリング関数は、よく設計された二項分類問題を通じて学習される。
本稿では,予備的な数値実験による方法論について解説する。
論文 参考訳(メタデータ) (2021-09-20T14:45:56Z) - Few-shot Action Recognition with Prototype-centered Attentive Learning [88.10852114988829]
2つの新しい構成要素からなるプロトタイプ中心型注意学習(pal)モデル。
まず,従来のクエリ中心学習目標を補完するために,プロトタイプ中心のコントラスト学習損失を導入する。
第二に、PALは注意深いハイブリッド学習機構を統合しており、アウトレーヤの負の影響を最小限に抑えることができる。
論文 参考訳(メタデータ) (2021-01-20T11:48:12Z) - Theoretical Insights Into Multiclass Classification: A High-dimensional
Asymptotic View [82.80085730891126]
線形多クラス分類の最初の現代的精度解析を行う。
分析の結果,分類精度は分布に依存していることがわかった。
得られた洞察は、他の分類アルゴリズムの正確な理解の道を開くかもしれない。
論文 参考訳(メタデータ) (2020-11-16T05:17:29Z) - Cross-validation Confidence Intervals for Test Error [83.67415139421448]
この研究は、クロスバリデーションのための中心極限定理と、学習アルゴリズムの弱い安定性条件下での分散の一貫した推定器を開発する。
結果は、一般的な1対1のクロスバリデーションの選択にとって、初めてのものだ。
論文 参考訳(メタデータ) (2020-07-24T17:40:06Z) - Better Multi-class Probability Estimates for Small Data Sets [0.0]
我々は,データ生成とグループ化のアルゴリズムが多クラス問題の解決に有効であることを示す。
実験により,提案手法を用いてキャリブレーション誤差を低減し,計算コストの増大を許容できることを示した。
論文 参考訳(メタデータ) (2020-01-30T10:21:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。