論文の概要: On high-dimensional modifications of the nearest neighbor classifier
- arxiv url: http://arxiv.org/abs/2407.05145v3
- Date: Thu, 24 Oct 2024 15:47:36 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-08 23:35:45.140241
- Title: On high-dimensional modifications of the nearest neighbor classifier
- Title(参考訳): 近接類型化器の高次元的修正について
- Authors: Annesha Ghosh, Deep Ghoshal, Bilol Banerjee, Anil K. Ghosh,
- Abstract要約: 本稿では,これらの既存手法について考察し,新しい手法を提案する。
提案手法の実証的性能と既存手法との比較を行うため,いくつかのシミュレーションおよびベンチマークデータセットを分析した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Nearest neighbor classifier is arguably the most simple and popular nonparametric classifier available in the literature. However, due to the concentration of pairwise distances and the violation of the neighborhood structure, this classifier often suffers in high-dimension, low-sample size (HDLSS) situations, especially when the scale difference between the competing classes dominates their location difference. Several attempts have been made in the literature to take care of this problem. In this article, we discuss some of these existing methods and propose some new ones. We carry out some theoretical investigations in this regard and analyze several simulated and benchmark datasets to compare the empirical performances of proposed methods with some of the existing ones.
- Abstract(参考訳): 最も近い隣の分類器は間違いなく最も単純で一般的な非パラメトリック分類器である。
しかし、対距離の集中と近傍構造の違反により、この分類器は高次元、低サンプルサイズ(HDLSS)の状況に悩まされることが多い。
この問題に対処するため、文献でいくつかの試みがなされている。
本稿では,これらの既存手法について考察し,新しい手法を提案する。
この点について理論的研究を行い、いくつかのシミュレーションおよびベンチマークデータセットを分析し、提案手法の実証的な性能と既存手法との比較を行う。
関連論文リスト
- Space Decomposition for Sentence Embedding [12.538707746802853]
本稿では,MixSPと呼ばれる新しい埋め込み空間分解法を提案する。
上位と下位のサンプルを正確に識別・ランク付けするように設計されている。
実験の結果,MixSPは上位クラスと下位クラスの重複表現を著しく低減した。
論文 参考訳(メタデータ) (2024-06-05T10:20:10Z) - Classification Using Global and Local Mahalanobis Distances [1.7811840395202345]
競合クラスからの観測のマハラノビス距離に基づく新しい半パラメトリック分類器を提案する。
我々のツールは、これらの距離を異なるクラスの後部確率を推定する特徴として利用するロジスティックリンク関数を持つ一般化加法モデルである。
論文 参考訳(メタデータ) (2024-02-13T08:22:42Z) - Intra-class Adaptive Augmentation with Neighbor Correction for Deep
Metric Learning [99.14132861655223]
深層学習のためのクラス内適応拡張(IAA)フレームワークを提案する。
クラスごとのクラス内変動を合理的に推定し, 適応型合成試料を生成し, 硬質試料の採掘を支援する。
本手法は,検索性能の最先端手法を3%~6%向上させる。
論文 参考訳(メタデータ) (2022-11-29T14:52:38Z) - Parametric Classification for Generalized Category Discovery: A Baseline
Study [70.73212959385387]
Generalized Category Discovery (GCD)は、ラベル付きサンプルから学習した知識を用いて、ラベルなしデータセットで新しいカテゴリを発見することを目的としている。
パラメトリック分類器の故障を調査し,高品質な監視が可能であった場合の過去の設計選択の有効性を検証し,信頼性の低い疑似ラベルを重要課題として同定する。
エントロピー正規化の利点を生かし、複数のGCDベンチマークにおける最先端性能を実現し、未知のクラス数に対して強いロバスト性を示す、単純で効果的なパラメトリック分類法を提案する。
論文 参考訳(メタデータ) (2022-11-21T18:47:11Z) - Centrality and Consistency: Two-Stage Clean Samples Identification for
Learning with Instance-Dependent Noisy Labels [87.48541631675889]
本稿では,2段階のクリーンサンプル識別手法を提案する。
まず,クリーンサンプルの早期同定にクラスレベルの特徴クラスタリング手法を用いる。
次に, 基底真理クラス境界に近い残余のクリーンサンプルについて, 一貫性に基づく新しい分類法を提案する。
論文 参考訳(メタデータ) (2022-07-29T04:54:57Z) - Divide-and-Conquer Hard-thresholding Rules in High-dimensional
Imbalanced Classification [1.0312968200748118]
高次元の線形判別分析(LDA)における不均衡クラスサイズの影響について検討した。
マイノリティ・クラスと呼ばれる1つのクラスのデータの不足により、LDAはマイノリティ・クラスを無視し、最大誤分類率を得ることを示す。
そこで本研究では,不等式化率の大きな差を低減させる分割・対数法に基づくハードコンカレンスルールの新たな構成法を提案する。
論文 参考訳(メタデータ) (2021-11-05T07:44:28Z) - Adversarial Examples for $k$-Nearest Neighbor Classifiers Based on
Higher-Order Voronoi Diagrams [69.4411417775822]
逆例は機械学習モデルにおいて広く研究されている現象である。
そこで本研究では,$k$-nearest 近傍分類の逆ロバスト性を評価するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-11-19T08:49:10Z) - Theoretical Insights Into Multiclass Classification: A High-dimensional
Asymptotic View [82.80085730891126]
線形多クラス分類の最初の現代的精度解析を行う。
分析の結果,分類精度は分布に依存していることがわかった。
得られた洞察は、他の分類アルゴリズムの正確な理解の道を開くかもしれない。
論文 参考訳(メタデータ) (2020-11-16T05:17:29Z) - Multiclass Classification via Class-Weighted Nearest Neighbors [10.509405690286176]
マルチクラス分類のためのk-アネレスト近傍アルゴリズムの統計特性について検討する。
我々は, 精度, クラス重み付きリスク, 均一誤差に基づいて, 上限値と最小値の下位境界を導出する。
論文 参考訳(メタデータ) (2020-04-09T17:50:16Z) - M2m: Imbalanced Classification via Major-to-minor Translation [79.09018382489506]
ほとんどの実世界のシナリオでは、ラベル付きトレーニングデータセットは非常にクラス不均衡であり、ディープニューラルネットワークは、バランスの取れたテスト基準への一般化に苦しむ。
本稿では,より頻度の低いクラスを,より頻度の低いクラスからのサンプルを翻訳することによって,この問題を緩和する新しい方法を提案する。
提案手法は,従来の再サンプリング法や再重み付け法と比較して,マイノリティクラスの一般化を著しく改善することを示す。
論文 参考訳(メタデータ) (2020-04-01T13:21:17Z) - On a Generalization of the Average Distance Classifier [2.578242050187029]
この問題に対処するために,平均距離分類器の簡単な変換を提案する。
結果として得られる分類器は、下層の集団が同じ位置と規模を持つ場合でも、非常によく機能する。
シミュレーションおよび実データを用いた数値実験により,提案手法の有用性が示された。
論文 参考訳(メタデータ) (2020-01-08T10:00:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。