論文の概要: Heuristical choice of SVM parameters
- arxiv url: http://arxiv.org/abs/2111.02164v1
- Date: Wed, 3 Nov 2021 12:04:03 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-04 13:41:52.927203
- Title: Heuristical choice of SVM parameters
- Title(参考訳): SVMパラメータのヒューリスティックな選択
- Authors: Micha{\l} Cholewa, Micha{\l} Romaszewski, Przemys{\l}aw G{\l}omb
- Abstract要約: Support Vector Machine (SVM)は最も一般的な分類手法の1つであり、多くの機械学習アプローチのデファクト参照である。
その性能はパラメータ選択によって決定され、通常は時間を要するグリッドサーチクロスバリデーションによって達成される。
しかし、クラスラベル情報を使う代わりにパラメータを選択するためにデータセットの特性を利用する教師なしのエージェントがいくつか存在する。
教師なしは、桁違いに高速であるが、グリッドサーチよりも結果が著しく悪いという仮定の下では、ほとんど使われていない。
- 参考スコア(独自算出の注目度): 2.578242050187029
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Support Vector Machine (SVM) is one of the most popular classification
methods, and a de-facto reference for many Machine Learning approaches. Its
performance is determined by parameter selection, which is usually achieved by
a time-consuming grid search cross-validation procedure. There exist, however,
several unsupervised heuristics that take advantage of the characteristics of
the dataset for selecting parameters instead of using class label information.
Unsupervised heuristics, while an order of magnitude faster, are scarcely used
under the assumption that their results are significantly worse than those of
grid search. To challenge that assumption we have conducted a wide study of
various heuristics for SVM parameter selection on over thirty datasets, in both
supervised and semi-supervised scenarios. In most cases, the cross-validation
grid search did not achieve a significant advantage over the heuristics. In
particular, heuristical parameter selection may be preferable for high
dimensional and unbalanced datasets or when a small number of examples is
available. Our results also show that using a heuristic to determine the
starting point of further cross-validation does not yield significantly better
results than the default start.
- Abstract(参考訳): Support Vector Machine (SVM)は最も一般的な分類手法の1つであり、多くの機械学習アプローチのデファクト参照である。
その性能はパラメータ選択によって決定され、通常は時間を要するグリッド探索クロスバリデーションによって達成される。
しかし、クラスラベル情報を使う代わりにパラメータを選択するためにデータセットの特性を利用する教師なしヒューリスティックがいくつか存在する。
教師なしのヒューリスティックは、桁違いに速いが、グリッド検索よりも結果が著しく悪いという仮定の下ではほとんど使われない。
この仮定に挑戦するために、30以上のデータセット上でSVMパラメータ選択のための様々なヒューリスティックを、教師付きシナリオと半教師付きシナリオの両方で幅広く研究した。
ほとんどの場合、クロスバリデーショングリッドサーチはヒューリスティックスに対して大きな優位性は得られなかった。
特に、ヒューリスティックなパラメータの選択は、高次元および不均衡データセットや、少数の例が利用可能である場合に望ましい。
以上の結果から,さらなるクロスバリデーションの開始点を決定するためにヒューリスティックを用いることで,デフォルトの開始点よりもはるかに優れた結果が得られないことが示唆された。
関連論文リスト
- Cost-sensitive probabilistic predictions for support vector machines [1.743685428161914]
サポートベクターマシン(SVM)は広く使われており、最もよく検討され使用されている機械学習モデルの一つである。
本稿では,SVMの確率的出力を生成する新しい手法を提案する。
論文 参考訳(メタデータ) (2023-10-09T11:00:17Z) - Dynamic Conceptional Contrastive Learning for Generalized Category
Discovery [76.82327473338734]
Generalized category discovery (GCD) は、部分的にラベル付けされたデータを自動でクラスタリングすることを目的としている。
ラベル付きデータには、ラベル付きデータの既知のカテゴリだけでなく、新しいカテゴリのインスタンスも含まれている。
GCDの効果的な方法の1つは、ラベルなしデータの識別表現を学習するために自己教師付き学習を適用することである。
本稿では,クラスタリングの精度を効果的に向上する動的概念コントラスト学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-30T14:04:39Z) - Parametric Classification for Generalized Category Discovery: A Baseline
Study [70.73212959385387]
Generalized Category Discovery (GCD)は、ラベル付きサンプルから学習した知識を用いて、ラベルなしデータセットで新しいカテゴリを発見することを目的としている。
パラメトリック分類器の故障を調査し,高品質な監視が可能であった場合の過去の設計選択の有効性を検証し,信頼性の低い疑似ラベルを重要課題として同定する。
エントロピー正規化の利点を生かし、複数のGCDベンチマークにおける最先端性能を実現し、未知のクラス数に対して強いロバスト性を示す、単純で効果的なパラメトリック分類法を提案する。
論文 参考訳(メタデータ) (2022-11-21T18:47:11Z) - Primal Estimated Subgradient Solver for SVM for Imbalanced
Classification [0.0]
我々は,PEGASOS SVMが8.6:1から130:1までのマイノリティ比に大きく依存する不均衡データセットに対して,優れた性能を達成できることを実証することを目的とする。
学習曲線を調べて評価する。
PEGASOS Cost-Sensitive SVM's results of Ding's LINEAR SVM DECIDL method。
論文 参考訳(メタデータ) (2022-06-19T02:33:14Z) - On the Eigenvalues of Global Covariance Pooling for Fine-grained Visual
Recognition [65.67315418971688]
グローバル共分散プーリング(GCP)の小さな固有値をトラッピングすることで、よりスムーズな勾配が得られることを示す。
きめ細かいデータセットでは、小さな固有値の切り抜きは、モデルを収束させるのに失敗する。
この観測から着想を得て,小さな固有値の重要性を拡大するネットワーク分岐を提案する。
論文 参考訳(メタデータ) (2022-05-26T11:41:36Z) - CvS: Classification via Segmentation For Small Datasets [52.821178654631254]
本稿では,分類ラベルをセグメントマップの予測から導出する小型データセットのコスト効率の高い分類器であるCvSを提案する。
我々は,CvSが従来の手法よりもはるかに高い分類結果が得られることを示す多種多様な問題に対して,本フレームワークの有効性を評価する。
論文 参考訳(メタデータ) (2021-10-29T18:41:15Z) - Classifications based on response times for detecting early-stage
Alzheimer's disease [0.0]
本稿では,早期アルツハイマー病 (ES-AD) と健常者 (HC) の高精度な検出方法について述べる。
本論文では,手書き作業によるHC/ES-ADの分類に関する技術状況の最良の結果よりも,2~4倍の誤差を生じさせる。
論文 参考訳(メタデータ) (2021-02-01T10:08:08Z) - Average Localised Proximity: a new data descriptor with good default
one-class classification performance [4.894976692426517]
一級分類は機械学習の難しい部分分野である。
データディスクリプタは、そのクラスのポジティブな例のみに基づいて、クラスのメンバシップを予測するために使用される。
論文 参考訳(メタデータ) (2021-01-26T19:14:14Z) - Minimax Active Learning [61.729667575374606]
アクティブラーニングは、人間のアノテーションによってラベル付けされる最も代表的なサンプルをクエリすることによって、ラベル効率の高いアルゴリズムを開発することを目指している。
現在のアクティブラーニング技術は、最も不確実なサンプルを選択するためにモデルの不確実性に頼るか、クラスタリングを使うか、最も多様なラベルのないサンプルを選択するために再構築する。
我々は,不確実性と多様性を両立させる半教師付きミニマックスエントロピーに基づく能動学習アルゴリズムを開発した。
論文 参考訳(メタデータ) (2020-12-18T19:03:40Z) - Solving Long-tailed Recognition with Deep Realistic Taxonomic Classifier [68.38233199030908]
ロングテール認識は、現実世界のシナリオにおける自然な非一様分散データに取り組む。
モダンは人口密度の高いクラスではうまく機能するが、そのパフォーマンスはテールクラスでは著しく低下する。
Deep-RTCは、リアリズムと階層的予測を組み合わせたロングテール問題の新しい解法として提案されている。
論文 参考訳(メタデータ) (2020-07-20T05:57:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。