論文の概要: Multilabel Prototype Generation for Data Reduction in k-Nearest
Neighbour classification
- arxiv url: http://arxiv.org/abs/2207.10947v1
- Date: Fri, 22 Jul 2022 08:51:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-25 13:26:20.987661
- Title: Multilabel Prototype Generation for Data Reduction in k-Nearest
Neighbour classification
- Title(参考訳): k-Nearest Neighbour分類におけるデータ削減のためのマルチラベルプロトタイプ生成
- Authors: Jose J. Valero-Mas, Antonio Javier Gallego, Pablo Alonso-Jim\'enez,
and Xavier Serra
- Abstract要約: PG(Prototype Generation)メソッドは通常、$k$-Nearest Neighbour ($k$NN)分類器の効率を改善するために検討される。
本研究は,4種類のPG戦略の新規な適応を多ラベルケースに適用するものである。
- 参考スコア(独自算出の注目度): 15.21875460369665
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Prototype Generation (PG) methods are typically considered for improving the
efficiency of the $k$-Nearest Neighbour ($k$NN) classifier when tackling
high-size corpora. Such approaches aim at generating a reduced version of the
corpus without decreasing the classification performance when compared to the
initial set. Despite their large application in multiclass scenarios, very few
works have addressed the proposal of PG methods for the multilabel space. In
this regard, this work presents the novel adaptation of four multiclass PG
strategies to the multilabel case. These proposals are evaluated with three
multilabel $k$NN-based classifiers, 12 corpora comprising a varied range of
domains and corpus sizes, and different noise scenarios artificially induced in
the data. The results obtained show that the proposed adaptations are capable
of significantly improving -- both in terms of efficiency and classification
performance -- the only reference multilabel PG work in the literature as well
as the case in which no PG method is applied, also presenting a statistically
superior robustness in noisy scenarios. Moreover, these novel PG strategies
allow prioritising either the efficiency or efficacy criteria through its
configuration depending on the target scenario, hence covering a wide area in
the solution space not previously filled by other works.
- Abstract(参考訳): PG(Prototype Generation)法は、通常、大規模コーパスに取り組む際に、$k$-Nearest Neighbour(k$NN)分類器の効率を改善するために検討される。
このようなアプローチは、初期セットと比較して分類性能を低下させることなくコーパスの縮小バージョンを生成することを目的としている。
マルチクラスシナリオでの大規模な適用にもかかわらず、マルチラベル空間のためのPGメソッドの提案に対処する研究はほとんどない。
本研究は,4種類のPG戦略の新規な適応を多ラベルケースに適用するものである。
これらの提案は、3つのマルチラベルの$k$NNベースの分類器、さまざまなドメインとコーパスサイズからなる12のコーパス、およびデータに人工的に誘導される異なるノイズシナリオを用いて評価される。
その結果, 提案手法は, 提案手法を適用せず, ノイズシナリオにおいて統計的に優れたロバスト性を示すとともに, 効率性, 分類性能の両面において, 文献における参照多重ラベルPGの唯一の手法であることがわかった。
さらに、これらの新しいPG戦略は、目標シナリオに応じて、その構成による効率性または有効性基準の優先順位付けを可能にするため、これまで他の作業で満たされていなかった解空間の広い範囲をカバーできる。
関連論文リスト
- IDoFew: Intermediate Training Using Dual-Clustering in Language Models
for Few Labels Text Classification [24.11420537250414]
変換器からの双方向表現(BERT)は、自然言語処理(NLP)やテキスト分類を含むテキストマイニングタスクにおいて非常に効果的である。
いくつかのタスクは、制限付きラベル付きテキスト分類など、これらのモデルに依然として課題を生じさせる。
擬似ラベルを確実にモデル化する2段階の中間クラスタリングを開発した。
論文 参考訳(メタデータ) (2024-01-08T17:07:37Z) - Large-scale Fully-Unsupervised Re-Identification [78.47108158030213]
大規模未ラベルデータから学ぶための2つの戦略を提案する。
第1の戦略は、近傍関係に違反することなく、それぞれのデータセットサイズを減らすために、局所的な近傍サンプリングを行う。
第2の戦略は、低時間上限の複雑さを持ち、メモリの複雑さを O(n2) から O(kn) に k n で還元する新しい再帰的手法を利用する。
論文 参考訳(メタデータ) (2023-07-26T16:19:19Z) - Progressive Sub-Graph Clustering Algorithm for Semi-Supervised Domain
Adaptation Speaker Verification [17.284276598514502]
マルチモデル投票と二重ガウスに基づく評価に基づく新しいプログレッシブサブグラフクラスタリングアルゴリズムを提案する。
破滅的なクラスタリング結果を防止するため、段階的にkを増大させ、二重ガウスに基づく評価アルゴリズムを用いる反復的手法を採用する。
論文 参考訳(メタデータ) (2023-05-22T04:26:18Z) - Harmonizing Base and Novel Classes: A Class-Contrastive Approach for
Generalized Few-Shot Segmentation [78.74340676536441]
本稿では,プロトタイプの更新を規制し,プロトタイプ間の距離を広くするために,クラス間のコントラスト損失とクラス関係損失を提案する。
提案手法は,PASCAL VOC および MS COCO データセット上での一般化された小ショットセグメンテーションタスクに対して,新しい最先端性能を実現する。
論文 参考訳(メタデータ) (2023-03-24T00:30:25Z) - Rethinking Clustering-Based Pseudo-Labeling for Unsupervised
Meta-Learning [146.11600461034746]
教師なしメタラーニングのメソッドであるCACTUsは、擬似ラベル付きクラスタリングベースのアプローチである。
このアプローチはモデルに依存しないため、教師付きアルゴリズムと組み合わせてラベルのないデータから学習することができる。
このことの核となる理由は、埋め込み空間においてクラスタリングに優しい性質が欠如していることである。
論文 参考訳(メタデータ) (2022-09-27T19:04:36Z) - An Evolutionary Approach for Creating of Diverse Classifier Ensembles [11.540822622379176]
CIF-Eと呼ばれる4段階のプロトコルに基づく分類器の選択と融合のためのフレームワークを提案する。
我々は,提案したCIF-Eプロトコルに従って,24種類のアンサンブルアプローチを実装し,評価した。
実験により、提案された進化的アプローチは、多くのよく知られたUCIデータセットにおいて最先端の文献的アプローチより優れていることが示された。
論文 参考訳(メタデータ) (2022-08-23T14:23:27Z) - Bottom-up Hierarchical Classification Using Confusion-based Logit
Compression [0.0]
下位分類器の過度な適合を避けるため、後方推定にはスタンドアローン検証セットが好ましい。
一般化ロジットとラベルの混同に基づく単純で頑健なロジットベクトル圧縮手法を提案する。
提案手法は, 高い階層的分類性能を維持しつつ, 信頼性の高い後続推定に十分な検証例を持たないという問題を緩和するものである。
論文 参考訳(メタデータ) (2021-10-05T00:18:58Z) - Adaptive Affinity Loss and Erroneous Pseudo-Label Refinement for Weakly
Supervised Semantic Segmentation [48.294903659573585]
本稿では,多段階アプローチの親和性学習を単一段階モデルに組み込むことを提案する。
深層ニューラルネットワークは、トレーニングフェーズで包括的なセマンティック情報を提供するために使用される。
提案手法の有効性を評価するため,PASCAL VOC 2012データセットを用いて実験を行った。
論文 参考訳(メタデータ) (2021-08-03T07:48:33Z) - AP-Loss for Accurate One-Stage Object Detection [49.13608882885456]
一段階の物体検出器は、分類損失と局所化損失を同時に最適化することによって訓練される。
前者は、多数のアンカーのため、非常に前景と後方のアンカーの不均衡に悩まされる。
本稿では,一段検知器の分類タスクをランキングタスクに置き換える新しい枠組みを提案する。
論文 参考訳(メタデータ) (2020-08-17T13:22:01Z) - Unsupervised Domain Adaptation in Person re-ID via k-Reciprocal
Clustering and Large-Scale Heterogeneous Environment Synthesis [76.46004354572956]
個人再識別のための教師なし領域適応手法を提案する。
実験結果から,ktCUDA法とSHRED法は,再同定性能において,+5.7 mAPの平均的改善を実現することがわかった。
論文 参考訳(メタデータ) (2020-01-14T17:43:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。