論文の概要: Similarity Based Stratified Splitting: an approach to train better
classifiers
- arxiv url: http://arxiv.org/abs/2010.06099v1
- Date: Tue, 13 Oct 2020 01:07:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-07 22:28:51.204410
- Title: Similarity Based Stratified Splitting: an approach to train better
classifiers
- Title(参考訳): 類似性に基づくStratified Splitting: より良い分類器を訓練するためのアプローチ
- Authors: Felipe Farias, Teresa Ludermir, Carmelo Bastos-Filho
- Abstract要約: 出力空間情報と入力空間情報の両方を用いてデータを分割する類似性に基づく階層分割手法を提案する。
提案手法を,マルチ層パーセプトロン,サポートベクトルマシン,ランダムフォレスト,K-Nearest Neighborsなどの分類器を用いたベンチマークデータセットで評価した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a Similarity-Based Stratified Splitting (SBSS) technique, which
uses both the output and input space information to split the data. The splits
are generated using similarity functions among samples to place similar samples
in different splits. This approach allows for a better representation of the
data in the training phase. This strategy leads to a more realistic performance
estimation when used in real-world applications. We evaluate our proposal in
twenty-two benchmark datasets with classifiers such as Multi-Layer Perceptron,
Support Vector Machine, Random Forest and K-Nearest Neighbors, and five
similarity functions Cityblock, Chebyshev, Cosine, Correlation, and Euclidean.
According to the Wilcoxon Sign-Rank test, our approach consistently
outperformed ordinary stratified 10-fold cross-validation in 75\% of the
assessed scenarios.
- Abstract(参考訳): 本稿では,データ分割のための出力空間情報と入力空間情報の両方を用いた類似性に基づく階層分割(sbss)手法を提案する。
分割はサンプル間の類似関数を用いて生成され、類似したサンプルを異なる分割に配置する。
このアプローチは、トレーニングフェーズにおけるデータのより良い表現を可能にします。
この戦略は、現実世界のアプリケーションで使用する場合、より現実的なパフォーマンス推定につながる。
提案手法は,多層パーセプトロン,サポートベクターマシン,ランダムフォレスト,k-ネアレスト近傍などの分類器と,cityblock,chebyshev,cosine,correlation,euclideanの5つの類似関数を用いて,22のベンチマークデータセットで評価した。
Wilcoxon Sign-Rank testによると、評価されたシナリオの75%で通常の10倍のクロスバリデーションを一貫して上回りました。
関連論文リスト
- Measuring similarity between embedding spaces using induced neighborhood graphs [10.056989400384772]
本稿では,ペアの項目表現の類似性を評価するための指標を提案する。
この結果から,類似度とゼロショット分類タスクの精度が類似度と相関していることが示唆された。
論文 参考訳(メタデータ) (2024-11-13T15:22:33Z) - Cluster-Aware Similarity Diffusion for Instance Retrieval [64.40171728912702]
拡散に基づく再ランク付け(diffusion-based re-level)は、隣り合うグラフで類似性の伝播を実行することで、インスタンスを検索する一般的な方法である。
本稿では,新しいクラスタ・アウェア類似性(CAS)拡散モデルを提案する。
論文 参考訳(メタデータ) (2024-06-04T14:19:50Z) - Convolutional autoencoder-based multimodal one-class classification [80.52334952912808]
1クラス分類は、単一のクラスからのデータを用いた学習のアプローチを指す。
マルチモーダルデータに適した深層学習一クラス分類法を提案する。
論文 参考訳(メタデータ) (2023-09-25T12:31:18Z) - Retrieval-Augmented Classification with Decoupled Representation [31.662843145399044]
そこで本研究では,KNN(Kk$-nearest-neighbor)に基づく拡張分類検索手法を提案する。
分類と検索の共有表現がパフォーマンスを損なうことや,トレーニングの不安定化につながることが判明した。
本手法は,幅広い分類データセットを用いて評価する。
論文 参考訳(メタデータ) (2023-03-23T06:33:06Z) - Is it all a cluster game? -- Exploring Out-of-Distribution Detection
based on Clustering in the Embedding Space [7.856998585396422]
新しい入力がトレーニング分布と大きく異なるタイミングを決定するためには、ディープニューラルネットワークの安全性クリティカルな応用が不可欠である。
埋め込み空間におけるクラスタの構造と分離について検討し、教師付きコントラスト学習が十分に分離されたクラスタに繋がることを示す。
異なるトレーニング方法、クラスタリング戦略、距離メトリクス、しきい値設定アプローチの分析において、明確な勝者は存在しない。
論文 参考訳(メタデータ) (2022-03-16T11:22:23Z) - Adaptive Sampling for Heterogeneous Rank Aggregation from Noisy Pairwise
Comparisons [85.5955376526419]
ランキングアグリゲーション問題では、各項目を比較する際に、様々な精度レベルが示される。
本稿では,ノイズのあるペアワイズ比較によってアイテムのランクを推定する,除去に基づくアクティブサンプリング戦略を提案する。
提案アルゴリズムは,商品の真のランキングを高い確率で返却できることを示す。
論文 参考訳(メタデータ) (2021-10-08T13:51:55Z) - Visualizing Classifier Adjacency Relations: A Case Study in Speaker
Verification and Voice Anti-Spoofing [72.4445825335561]
任意のバイナリ分類器によって生成される検出スコアから2次元表現を導出する簡単な方法を提案する。
ランク相関に基づいて,任意のスコアを用いた分類器の視覚的比較を容易にする。
提案手法は完全に汎用的であり,任意の検出タスクに適用可能だが,自動話者検証と音声アンチスプーフィングシステムによるスコアを用いた手法を実証する。
論文 参考訳(メタデータ) (2021-06-11T13:03:33Z) - Semi-supervised Contrastive Learning with Similarity Co-calibration [72.38187308270135]
SsCL(Semi-supervised Contrastive Learning)と呼ばれる新しいトレーニング戦略を提案する。
ssclは、自己教師付き学習におけるよく知られたコントラスト損失と、半教師付き学習におけるクロスエントロピー損失を組み合わせる。
SsCLはより差別的な表現を生じさせ,ショット学習に有益であることを示す。
論文 参考訳(メタデータ) (2021-05-16T09:13:56Z) - LSD-C: Linearly Separable Deep Clusters [145.89790963544314]
ラベルなしデータセットのクラスタを識別する新しい手法であるLSD-Cを提案する。
本手法は,最近の半教師付き学習の実践からインスピレーションを得て,クラスタリングアルゴリズムと自己教師付き事前学習と強力なデータ拡張を組み合わせることを提案する。
CIFAR 10/100, STL 10, MNIST, および文書分類データセットReuters 10Kなど, 一般的な公開画像ベンチマークにおいて, 当社のアプローチが競合より大幅に優れていたことを示す。
論文 参考訳(メタデータ) (2020-06-17T17:58:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。