論文の概要: A Non-Intrusive Correction Algorithm for Classification Problems with
Corrupted Data
- arxiv url: http://arxiv.org/abs/2002.04658v1
- Date: Tue, 11 Feb 2020 20:07:05 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-02 01:09:16.446404
- Title: A Non-Intrusive Correction Algorithm for Classification Problems with
Corrupted Data
- Title(参考訳): 故障データの分類問題に対する非侵入的補正アルゴリズム
- Authors: Jun Hou, Tong Qin, Kailiang Wu, Dongbin Xiu
- Abstract要約: 破損したトレーニングデータを用いた複数クラス分類問題に対して,新しい補正アルゴリズムを提案する。
このアルゴリズムは、モデル予測に補正手順を追加することによって、訓練された分類モデルを後処理するという意味で、邪魔にならない。
- 参考スコア(独自算出の注目度): 3.908426668574935
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A novel correction algorithm is proposed for multi-class classification
problems with corrupted training data. The algorithm is non-intrusive, in the
sense that it post-processes a trained classification model by adding a
correction procedure to the model prediction. The correction procedure can be
coupled with any approximators, such as logistic regression, neural networks of
various architectures, etc. When training dataset is sufficiently large, we
prove that the corrected models deliver correct classification results as if
there is no corruption in the training data. For datasets of finite size, the
corrected models produce significantly better recovery results, compared to the
models without the correction algorithm. All of the theoretical findings in the
paper are verified by our numerical examples.
- Abstract(参考訳): 劣化したトレーニングデータを含む多クラス分類問題に対して,新しい補正アルゴリズムを提案する。
このアルゴリズムは、モデル予測に補正手順を追加することによって、訓練された分類モデルを後処理するという意味で、非インタラクティブである。
補正手順は、ロジスティック回帰、さまざまなアーキテクチャのニューラルネットワークなど、任意の近似子と結合することができる。
トレーニングデータセットが十分に大きい場合、修正されたモデルがトレーニングデータに破損がないかのように正しい分類結果を提供することを示す。
有限サイズのデータセットの場合、補正されたモデルは、補正アルゴリズムのないモデルと比較して、かなり良い回復結果が得られる。
本論文のすべての理論的結果は, 数値的な例によって検証されている。
関連論文リスト
- A Mirror Descent-Based Algorithm for Corruption-Tolerant Distributed Gradient Descent [57.64826450787237]
本研究では, 分散勾配降下アルゴリズムの挙動を, 敵対的腐敗の有無で解析する方法を示す。
汚職耐性の分散最適化アルゴリズムを設計するために、(怠慢な)ミラー降下からアイデアをどう使うかを示す。
MNISTデータセットの線形回帰、サポートベクトル分類、ソフトマックス分類に基づく実験は、我々の理論的知見を裏付けるものである。
論文 参考訳(メタデータ) (2024-07-19T08:29:12Z) - Adaptive Optimization for Prediction with Missing Data [6.800113478497425]
適応線形回帰モデルの中には,命令規則と下流線形回帰モデルを同時に学習するのと等価なものもある。
ランダムにデータの欠落が強くない環境では,本手法はサンプル外精度を2~10%向上させる。
論文 参考訳(メタデータ) (2024-02-02T16:35:51Z) - Continual learning for surface defect segmentation by subnetwork
creation and selection [55.2480439325792]
破滅的な忘れを伴わずにセグメンテーションタスクを実行する,新たな連続的(あるいは寿命の長い)学習アルゴリズムを導入する。
この方法は、2つの異なる表面欠陥分割問題に適用され、漸進的に学習される。
当社のアプローチでは,すべてのトレーニングデータ(すべての欠陥)を同時に見る場合,共同トレーニングと同等の結果が得られます。
論文 参考訳(メタデータ) (2023-12-08T15:28:50Z) - Efficient Grammatical Error Correction Via Multi-Task Training and
Optimized Training Schedule [55.08778142798106]
原文と修正文のアライメントを利用する補助タスクを提案する。
我々は,各タスクをシーケンス・ツー・シーケンス問題として定式化し,マルチタスク・トレーニングを行う。
トレーニングに使用されるデータセットの順序や、データセット内の個々のインスタンスでさえ、最終的なパフォーマンスに重要な影響を与える可能性があることが分かりました。
論文 参考訳(メタデータ) (2023-11-20T14:50:12Z) - Machine Learning Based Missing Values Imputation in Categorical Datasets [2.5611256859404983]
この研究では、分類データセットのギャップを埋めるための機械学習アルゴリズムの使用について検討した。
Error Correction Output Codesフレームワークを使用して構築されたアンサンブルモデルに重点が置かれた。
大量のラベル付きデータの要求を含む、これらの奨励的な結果にもかかわらず、データ計算の欠如に対する深い学習には障害がある。
論文 参考訳(メタデータ) (2023-06-10T03:29:48Z) - Informative regularization for a multi-layer perceptron RR Lyrae
classifier under data shift [3.303002683812084]
本稿では,情報正規化とアドホックなトレーニング手法に基づくスケーラブルで容易に適応可能なアプローチを提案し,シフト問題を緩和する。
提案手法は,特徴量からの知識をニューラルネットワークに組み込むことで,基礎となるデータシフト問題を管理する。
論文 参考訳(メタデータ) (2023-03-12T02:49:19Z) - A novel approach for wafer defect pattern classification based on
topological data analysis [0.0]
半導体製造において、ウェハマップ欠陥パターンは設備維持と収量管理に重要な情報を提供する。
本稿では,欠陥パターンの形状を有限次元ベクトルとして表現する新しい手法を提案する。
論文 参考訳(メタデータ) (2022-09-19T11:54:13Z) - Modular Conformal Calibration [80.33410096908872]
回帰における再校正のためのアルゴリズムを多種多様なクラスで導入する。
このフレームワークは、任意の回帰モデルをキャリブレーションされた確率モデルに変換することを可能にする。
我々は17の回帰データセットに対するMCCの実証的研究を行った。
論文 参考訳(メタデータ) (2022-06-23T03:25:23Z) - Regularized Classification-Aware Quantization [39.04839665081476]
本稿では,バイナリ分類タスクの分散量子化スキームを学習するアルゴリズムのクラスを提案する。
本手法は正規化分類認識量子化と呼ばれる。
論文 参考訳(メタデータ) (2021-07-12T21:27:48Z) - Evaluating State-of-the-Art Classification Models Against Bayes
Optimality [106.50867011164584]
正規化フローを用いて学習した生成モデルのベイズ誤差を正確に計算できることを示す。
われわれの手法を用いて、最先端の分類モデルについて徹底的な調査を行う。
論文 参考訳(メタデータ) (2021-06-07T06:21:20Z) - Good Classifiers are Abundant in the Interpolating Regime [64.72044662855612]
補間分類器間のテストエラーの完全な分布を正確に計算する手法を開発した。
テストエラーは、最悪の補間モデルのテストエラーから大きく逸脱する、小さな典型的な$varepsilon*$に集中する傾向にある。
以上の結果から,統計的学習理論における通常の解析手法は,実際に観測された優れた一般化性能を捉えるのに十分な粒度にはならない可能性が示唆された。
論文 参考訳(メタデータ) (2020-06-22T21:12:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。