論文の概要: Ensemble Learning using Error Correcting Output Codes: New
Classification Error Bounds
- arxiv url: http://arxiv.org/abs/2109.08967v1
- Date: Sat, 18 Sep 2021 16:47:57 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-21 15:59:39.495068
- Title: Ensemble Learning using Error Correcting Output Codes: New
Classification Error Bounds
- Title(参考訳): 誤り訂正出力符号を用いたアンサンブル学習:新しい分類誤り境界
- Authors: Hieu D. Nguyen, Mohammed Sarosh Khan, Nicholas Kaegi, Shen-Shyang Ho,
Jonathan Moore, Logan Borys, Lucas Lavalva
- Abstract要約: 本稿では,機械学習における誤り訂正出力コード (ECOC) の分類誤り率の新たな境界について述べる。
これらの境界は、コードワード長に関して指数関数的な減衰複雑性を持ち、ECOCアプローチの有効性を理論的に検証する。
- 参考スコア(独自算出の注目度): 2.0242396022517752
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: New bounds on classification error rates for the error-correcting output code
(ECOC) approach in machine learning are presented. These bounds have
exponential decay complexity with respect to codeword length and theoretically
validate the effectiveness of the ECOC approach. Bounds are derived for two
different models: the first under the assumption that all base classifiers are
independent and the second under the assumption that all base classifiers are
mutually correlated up to first-order. Moreover, we perform ECOC classification
on six datasets and compare their error rates with our bounds to experimentally
validate our work and show the effect of correlation on classification
accuracy.
- Abstract(参考訳): 機械学習における誤り訂正出力コード(ECOC)の分類誤り率の新たな境界について述べる。
これらの境界はコードワード長に関して指数関数的な減衰複雑性を持ち、ECOCアプローチの有効性を理論的に検証する。
境界は2つの異なるモデルに対して導出される: 第一はすべての基底分類器が独立であると仮定し、第二はすべての基底分類器が一階まで相互に関連付けられるという仮定で導かれる。
さらに,6つのデータセット上でECOC分類を行い,その誤差率と境界値との相関関係を実験的に検証し,相関が分類精度に与える影響を示す。
関連論文リスト
- Adapting Conformal Prediction to Distribution Shifts Without Labels [16.478151550456804]
コンフォーマル予測(CP)により、機械学習モデルは、保証されたカバレッジ率で予測セットを出力できる。
我々の目標は、テストドメインからのラベルなしデータのみを使用して、CP生成予測セットの品質を改善することです。
これは、未ラベルテストデータに対するベースモデルの不確実性に応じてCPのスコア関数を調整する、ECP と EACP と呼ばれる2つの新しい手法によって達成される。
論文 参考訳(メタデータ) (2024-06-03T15:16:02Z) - JointMatch: A Unified Approach for Diverse and Collaborative
Pseudo-Labeling to Semi-Supervised Text Classification [65.268245109828]
半教師付きテキスト分類(SSTC)は、ラベルのないデータを活用する能力によって注目を集めている。
擬似ラベルに基づく既存のアプローチは、擬似ラベルバイアスと誤り蓄積の問題に悩まされる。
我々は、最近の半教師付き学習からアイデアを統一することでこれらの課題に対処する、SSTCの総合的なアプローチであるJointMatchを提案する。
論文 参考訳(メタデータ) (2023-10-23T05:43:35Z) - Fair Canonical Correlation Analysis [14.206538828733507]
正準相関解析(CCA)は2つの変数間の関係を調べるために広く用いられている手法である。
保護属性に関連付けられた相関不一致誤差を最小限に抑えることで不公平を軽減できる枠組みを提案する。
論文 参考訳(メタデータ) (2023-09-27T17:34:13Z) - Deep Negative Correlation Classification [82.45045814842595]
既存のディープアンサンブル手法は、多くの異なるモデルをナビゲートし、予測を集約する。
深部負相関分類(DNCC)を提案する。
DNCCは、個々の推定器が正確かつ負の相関を持つ深い分類アンサンブルを生成する。
論文 参考訳(メタデータ) (2022-12-14T07:35:20Z) - Complementary Labels Learning with Augmented Classes [22.460256396941528]
補完ラベル学習 (Complementary Labels Learning, CLL) は、プライベート質問分類やオンライン学習など、現実世界の多くのタスクに現れる。
CLLAC(Complementary Labels Learning with Augmented Classs)と呼ばれる新しい問題設定を提案する。
ラベルのないデータを用いて,CLLACの分類リスクの偏りのない推定手法を提案する。
論文 参考訳(メタデータ) (2022-11-19T13:55:27Z) - Mutual Information Learned Classifiers: an Information-theoretic
Viewpoint of Training Deep Learning Classification Systems [9.660129425150926]
既存のクロスエントロピー損失最小化問題は,基礎となるデータ分布のラベル条件エントロピーを本質的に学習することを示す。
ラベルと入力の相互情報を学習することで、ディープニューラルネットワーク分類器を訓練する相互情報学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-09-21T01:06:30Z) - Semi-supervised Domain Adaptive Structure Learning [72.01544419893628]
半教師付きドメイン適応 (SSDA) は,1) アノテーションの低いデータに過度に適合する手法と,2) ドメイン間の分散シフトの両方を克服しなければならない課題である。
SSLとDAの協調を正規化するための適応型構造学習手法を提案する。
論文 参考訳(メタデータ) (2021-12-12T06:11:16Z) - Information-Theoretic Generalization Bounds for Iterative
Semi-Supervised Learning [81.1071978288003]
特に,情報理論の原理を用いて,反復型SSLアルゴリズムのエミュレータ一般化誤差の振る舞いを理解することを目的とする。
我々の理論的結果は、クラス条件分散があまり大きくない場合、一般化誤差の上限は反復数とともに単調に減少するが、すぐに飽和することを示している。
論文 参考訳(メタデータ) (2021-10-03T05:38:49Z) - How to Control the Error Rates of Binary Classifiers [0.0]
本稿では,二項分類を統計的テストに変換し,p値の分類を計算し,対象の誤差率を制限する方法を示す。
特に、二項分類器を統計検査に変換し、p-値の分類を計算し、対象の誤差率を制限する方法を示す。
論文 参考訳(メタデータ) (2020-10-21T14:43:14Z) - Learning by Minimizing the Sum of Ranked Range [58.24935359348289]
本稿では,学習目標を定式化するための一般的なアプローチとして,ランキング範囲(SoRR)の和を紹介した。
ランク付き範囲は、実数の集合のソートされた値の連続的なシーケンスである。
我々は,SoRRフレームワークの最小化のための機械学習における2つの応用,すなわち,バイナリ分類のためのAoRR集約損失とマルチラベル/マルチクラス分類のためのTKML個人損失について検討する。
論文 参考訳(メタデータ) (2020-10-05T01:58:32Z) - Good Classifiers are Abundant in the Interpolating Regime [64.72044662855612]
補間分類器間のテストエラーの完全な分布を正確に計算する手法を開発した。
テストエラーは、最悪の補間モデルのテストエラーから大きく逸脱する、小さな典型的な$varepsilon*$に集中する傾向にある。
以上の結果から,統計的学習理論における通常の解析手法は,実際に観測された優れた一般化性能を捉えるのに十分な粒度にはならない可能性が示唆された。
論文 参考訳(メタデータ) (2020-06-22T21:12:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。