論文の概要: Optimizing Classification of Infrequent Labels by Reducing Variability in Label Distribution
- arxiv url: http://arxiv.org/abs/2511.07459v1
- Date: Wed, 12 Nov 2025 01:00:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-12 20:17:03.339022
- Title: Optimizing Classification of Infrequent Labels by Reducing Variability in Label Distribution
- Title(参考訳): ラベル分布のばらつき低減による低頻度ラベルの最適分類
- Authors: Ashutosh Agarwal,
- Abstract要約: LEVERは、エクストリーム分類(XC)タスクにおいて、頻度の低いカテゴリがもたらす課題に対処するために設計されている。
稀なカテゴリーは、しばしばスパースサンプルによって特徴づけられ、高いラベルの不整合に悩まされ、分類性能を損なう。
LEVERは、ロバストなシームススタイルのアーキテクチャを採用し、ラベルの不整合を低減するために知識伝達を活用することで、この問題を軽減する。
複数のXCデータセットにわたる包括的なテストは、頻繁なカテゴリの処理において大幅に改善されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: This paper presents a novel solution, LEVER, designed to address the challenges posed by underperforming infrequent categories in Extreme Classification (XC) tasks. Infrequent categories, often characterized by sparse samples, suffer from high label inconsistency, which undermines classification performance. LEVER mitigates this problem by adopting a robust Siamese-style architecture, leveraging knowledge transfer to reduce label inconsistency and enhance the performance of One-vs-All classifiers. Comprehensive testing across multiple XC datasets reveals substantial improvements in the handling of infrequent categories, setting a new benchmark for the field. Additionally, the paper introduces two newly created multi-intent datasets, offering essential resources for future XC research.
- Abstract(参考訳): 本稿では,エクストリーム分類(XC)タスクにおいて,頻度の低いカテゴリがもたらす課題に対処するために,新しいソリューションLEVERを提案する。
稀なカテゴリーは、しばしばスパースサンプルによって特徴づけられ、高いラベルの不整合に悩まされ、分類性能を損なう。
LEVERは、ロバストなシームススタイルのアーキテクチャを採用し、ラベルの不整合を低減し、One-vs-All分類器の性能を高めるために知識伝達を活用することでこの問題を軽減する。
複数のXCデータセットに対する総合的なテストでは、頻度の低いカテゴリの処理が大幅に改善され、この分野の新しいベンチマークが設定される。
さらに,新たに作成された2つのマルチインテリジェントデータセットを導入し,将来的なXC研究に不可欠なリソースを提供する。
関連論文リスト
- Consistent Supervised-Unsupervised Alignment for Generalized Category Discovery [49.67913741459179]
Generalized Category Discovery (GCD)は、未知のデータから新しいカテゴリを同時に発見しながら、既知のカテゴリを分類することに焦点を当てている。
従来のGCD手法は、不整合最適化目標とカテゴリー混乱による課題に直面している。
本稿ではニューラル・コラプスにインスパイアされた一般化カテゴリー発見(NC-GCD)フレームワークを提案する。
論文 参考訳(メタデータ) (2025-07-07T07:34:41Z) - Active Generalized Category Discovery [60.69060965936214]
GCD(Generalized Category Discovery)は、新しいクラスと古いクラスの未ラベルのサンプルをクラスタ化するための取り組みである。
我々は,能動的学習の精神を取り入れて,能動的一般化カテゴリー発見(AGCD)という新たな設定を提案する。
提案手法は, 汎用および微粒なデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2024-03-07T07:12:24Z) - Prompt Tuned Embedding Classification for Multi-Label Industry Sector Allocation [2.024620791810963]
本研究では,マルチラベルテキスト分類のためのPrompt Tuningとベースラインの性能をベンチマークする。
企業を投資会社の独自産業分類に分類するために適用される。
このモデルのパフォーマンスは、よく知られた企業とあまり知られていない企業の両方で一貫していることを確認します。
論文 参考訳(メタデータ) (2023-09-21T13:45:32Z) - Retrieval-augmented Multi-label Text Classification [20.100081284294973]
マルチラベルテキスト分類は、大きなラベルセットの設定において難しい課題である。
Retrieval augmentationは、分類モデルのサンプル効率を改善することを目的としている。
本手法は,法および生物医学領域の4つのデータセットに対して評価する。
論文 参考訳(メタデータ) (2023-05-22T14:16:23Z) - Dynamic Conceptional Contrastive Learning for Generalized Category
Discovery [76.82327473338734]
Generalized category discovery (GCD) は、部分的にラベル付けされたデータを自動でクラスタリングすることを目的としている。
ラベル付きデータには、ラベル付きデータの既知のカテゴリだけでなく、新しいカテゴリのインスタンスも含まれている。
GCDの効果的な方法の1つは、ラベルなしデータの識別表現を学習するために自己教師付き学習を適用することである。
本稿では,クラスタリングの精度を効果的に向上する動的概念コントラスト学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-30T14:04:39Z) - An Effective Approach for Multi-label Classification with Missing Labels [8.470008570115146]
分類ネットワークにさらなる複雑さをもたらすことなく、アノテーションのコストを削減するための擬似ラベルベースのアプローチを提案する。
新たな損失関数を設計することにより、各インスタンスが少なくとも1つの正のラベルを含む必要があるという要求を緩和することができる。
提案手法は,正のラベルと負のラベルの不均衡を扱える一方で,既存の欠落ラベル学習手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-10-24T23:13:57Z) - Long-tailed Extreme Multi-label Text Classification with Generated
Pseudo Label Descriptions [28.416742933744942]
本稿では,新しい手法を提案することで,テールラベル予測の課題に対処する。
これは、厳しいデータ不足条件下で情報ラベル記述を生成するための訓練されたbacker-of-words(BoW)分類器の有効性を組み合わせたものである。
提案手法はXMTCベンチマークデータセット上での最先端性能を実現し,これまでで最高の手法であるテールラベル予測を著しく上回っている。
論文 参考訳(メタデータ) (2022-04-02T23:42:32Z) - Coherent Hierarchical Multi-Label Classification Networks [56.41950277906307]
C-HMCNN(h)はHMC問題に対する新しいアプローチであり、階層情報を利用して制約に整合した予測を生成し、性能を向上させる。
最先端モデルと比較してC-HMCNN(h)の優れた性能を示す広範囲な実験的検討を行った。
論文 参考訳(メタデータ) (2020-10-20T09:37:02Z) - On Leveraging Unlabeled Data for Concurrent Positive-Unlabeled Classification and Robust Generation [72.062661402124]
余分なデータに晒された場合,PU分類と条件生成を共同で目標とする新たなトレーニングフレームワークを提案する。
我々は,CNI-CGANの最適条件を実証し,多様なデータセットについて広範な評価を行った。
論文 参考訳(メタデータ) (2020-06-14T08:27:40Z) - Global Multiclass Classification and Dataset Construction via
Heterogeneous Local Experts [37.27708297562079]
得られたデータセットの信頼性を確保しながら、ラベルの数を最小化する方法を示す。
MNISTとCIFAR-10データセットを用いた実験では、アグリゲーション方式の良好な精度が示されている。
論文 参考訳(メタデータ) (2020-05-21T18:07:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。