論文の概要: Data structure > labels? Unsupervised heuristics for SVM hyperparameter
estimation
- arxiv url: http://arxiv.org/abs/2111.02164v2
- Date: Thu, 22 Feb 2024 08:05:10 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-23 19:28:39.329875
- Title: Data structure > labels? Unsupervised heuristics for SVM hyperparameter
estimation
- Title(参考訳): データ構造>ラベル?
SVMハイパーパラメータ推定のための教師なしヒューリスティックス
- Authors: Micha{\l} Cholewa, Micha{\l} Romaszewski, Przemys{\l}aw G{\l}omb
- Abstract要約: Support Vector Machineは多くの機械学習アプローチのデファクト参照である。
パラメータの選択は通常、時間を要するグリッドサーチクロスバリデーション手順(GSCV)によって達成される
我々は、SVMパラメータ選択の改善を提案し、GSCVと、30以上の標準分類データセット上で、最先端のアーティファクトに対してテストした。
- 参考スコア(独自算出の注目度): 0.9208007322096532
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Classification is one of the main areas of pattern recognition research, and
within it, Support Vector Machine (SVM) is one of the most popular methods
outside of field of deep learning -- and a de-facto reference for many Machine
Learning approaches. Its performance is determined by parameter selection,
which is usually achieved by a time-consuming grid search cross-validation
procedure (GSCV). That method, however relies on the availability and quality
of labelled examples and thus, when those are limited can be hindered. To
address that problem, there exist several unsupervised heuristics that take
advantage of the characteristics of the dataset for selecting parameters
instead of using class label information. While an order of magnitude faster,
they are scarcely used under the assumption that their results are
significantly worse than those of grid search. To challenge that assumption, we
have proposed improved heuristics for SVM parameter selection and tested it
against GSCV and state of the art heuristics on over 30 standard classification
datasets. The results show not only its advantage over state-of-art heuristics
but also that it is statistically no worse than GSCV.
- Abstract(参考訳): 分類はパターン認識研究の主要な分野の1つであり、その内にあるSupport Vector Machine(SVM)は、ディープラーニング以外の分野で最も一般的な手法の1つであり、多くの機械学習アプローチのデファクト参照である。
その性能はパラメータ選択によって決定され、通常は時間を要するグリッドサーチクロスバリデーション(GSCV)によって達成される。
しかし、この方法はラベル付きサンプルの可用性と品質に依存しており、制限された場合にも妨げられる。
この問題を解決するために、クラスラベル情報の代わりにパラメータを選択するデータセットの特性を利用する教師なしヒューリスティックがいくつか存在する。
桁数は桁違いに速いが, グリッド探索に比べて結果が著しく悪いという仮定の下では, ほとんど使われていない。
そこで我々は,SVMパラメータ選択のためのヒューリスティックスの改善を提案し,GSCVと30以上の標準分類データセット上でのアートヒューリスティックスの現状を比較検討した。
その結果、最先端のヒューリスティックスに勝るだけでなく、統計学的にGSCVに劣らないことが示唆された。
関連論文リスト
- Cost-sensitive probabilistic predictions for support vector machines [1.743685428161914]
サポートベクターマシン(SVM)は広く使われており、最もよく検討され使用されている機械学習モデルの一つである。
本稿では,SVMの確率的出力を生成する新しい手法を提案する。
論文 参考訳(メタデータ) (2023-10-09T11:00:17Z) - Dynamic Conceptional Contrastive Learning for Generalized Category
Discovery [76.82327473338734]
Generalized category discovery (GCD) は、部分的にラベル付けされたデータを自動でクラスタリングすることを目的としている。
ラベル付きデータには、ラベル付きデータの既知のカテゴリだけでなく、新しいカテゴリのインスタンスも含まれている。
GCDの効果的な方法の1つは、ラベルなしデータの識別表現を学習するために自己教師付き学習を適用することである。
本稿では,クラスタリングの精度を効果的に向上する動的概念コントラスト学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-30T14:04:39Z) - Parametric Classification for Generalized Category Discovery: A Baseline
Study [70.73212959385387]
Generalized Category Discovery (GCD)は、ラベル付きサンプルから学習した知識を用いて、ラベルなしデータセットで新しいカテゴリを発見することを目的としている。
パラメトリック分類器の故障を調査し,高品質な監視が可能であった場合の過去の設計選択の有効性を検証し,信頼性の低い疑似ラベルを重要課題として同定する。
エントロピー正規化の利点を生かし、複数のGCDベンチマークにおける最先端性能を実現し、未知のクラス数に対して強いロバスト性を示す、単純で効果的なパラメトリック分類法を提案する。
論文 参考訳(メタデータ) (2022-11-21T18:47:11Z) - Primal Estimated Subgradient Solver for SVM for Imbalanced
Classification [0.0]
我々は,PEGASOS SVMが8.6:1から130:1までのマイノリティ比に大きく依存する不均衡データセットに対して,優れた性能を達成できることを実証することを目的とする。
学習曲線を調べて評価する。
PEGASOS Cost-Sensitive SVM's results of Ding's LINEAR SVM DECIDL method。
論文 参考訳(メタデータ) (2022-06-19T02:33:14Z) - On the Eigenvalues of Global Covariance Pooling for Fine-grained Visual
Recognition [65.67315418971688]
グローバル共分散プーリング(GCP)の小さな固有値をトラッピングすることで、よりスムーズな勾配が得られることを示す。
きめ細かいデータセットでは、小さな固有値の切り抜きは、モデルを収束させるのに失敗する。
この観測から着想を得て,小さな固有値の重要性を拡大するネットワーク分岐を提案する。
論文 参考訳(メタデータ) (2022-05-26T11:41:36Z) - CvS: Classification via Segmentation For Small Datasets [52.821178654631254]
本稿では,分類ラベルをセグメントマップの予測から導出する小型データセットのコスト効率の高い分類器であるCvSを提案する。
我々は,CvSが従来の手法よりもはるかに高い分類結果が得られることを示す多種多様な問題に対して,本フレームワークの有効性を評価する。
論文 参考訳(メタデータ) (2021-10-29T18:41:15Z) - Classifications based on response times for detecting early-stage
Alzheimer's disease [0.0]
本稿では,早期アルツハイマー病 (ES-AD) と健常者 (HC) の高精度な検出方法について述べる。
本論文では,手書き作業によるHC/ES-ADの分類に関する技術状況の最良の結果よりも,2~4倍の誤差を生じさせる。
論文 参考訳(メタデータ) (2021-02-01T10:08:08Z) - Average Localised Proximity: a new data descriptor with good default
one-class classification performance [4.894976692426517]
一級分類は機械学習の難しい部分分野である。
データディスクリプタは、そのクラスのポジティブな例のみに基づいて、クラスのメンバシップを予測するために使用される。
論文 参考訳(メタデータ) (2021-01-26T19:14:14Z) - Minimax Active Learning [61.729667575374606]
アクティブラーニングは、人間のアノテーションによってラベル付けされる最も代表的なサンプルをクエリすることによって、ラベル効率の高いアルゴリズムを開発することを目指している。
現在のアクティブラーニング技術は、最も不確実なサンプルを選択するためにモデルの不確実性に頼るか、クラスタリングを使うか、最も多様なラベルのないサンプルを選択するために再構築する。
我々は,不確実性と多様性を両立させる半教師付きミニマックスエントロピーに基づく能動学習アルゴリズムを開発した。
論文 参考訳(メタデータ) (2020-12-18T19:03:40Z) - Solving Long-tailed Recognition with Deep Realistic Taxonomic Classifier [68.38233199030908]
ロングテール認識は、現実世界のシナリオにおける自然な非一様分散データに取り組む。
モダンは人口密度の高いクラスではうまく機能するが、そのパフォーマンスはテールクラスでは著しく低下する。
Deep-RTCは、リアリズムと階層的予測を組み合わせたロングテール問題の新しい解法として提案されている。
論文 参考訳(メタデータ) (2020-07-20T05:57:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。