論文の概要: On Missing Labels, Long-tails and Propensities in Extreme Multi-label
Classification
- arxiv url: http://arxiv.org/abs/2207.13186v1
- Date: Tue, 26 Jul 2022 21:23:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-28 14:05:35.066491
- Title: On Missing Labels, Long-tails and Propensities in Extreme Multi-label
Classification
- Title(参考訳): 極端多重ラベル分類における欠落ラベル, 長尾, 長尾について
- Authors: Erik Schultheis, Marek Wydmuch, Rohit Babbar, Krzysztof Dembczy\'nski
- Abstract要約: Jain氏らが2016年に導入した固有性モデルは、極端なマルチラベル分類(XMLC)において、欠落した、長い尾のラベルを扱うための標準的アプローチとなっている。
本稿では,提案手法の問題点を網羅的に論じ,いくつかのレシピを紹介し,その一部は検索エンジンやレコメンデータシステムで使用されるソリューションに関連している。
- 参考スコア(独自算出の注目度): 5.247557449370602
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The propensity model introduced by Jain et al. 2016 has become a standard
approach for dealing with missing and long-tail labels in extreme multi-label
classification (XMLC). In this paper, we critically revise this approach
showing that despite its theoretical soundness, its application in contemporary
XMLC works is debatable. We exhaustively discuss the flaws of the
propensity-based approach, and present several recipes, some of them related to
solutions used in search engines and recommender systems, that we believe
constitute promising alternatives to be followed in XMLC.
- Abstract(参考訳): jain et al. 2016 によって導入されたプロペンシティモデルは、極端に多重ラベル分類 (xmlc) において欠落ラベルと長尾ラベルを扱う標準的なアプローチとなった。
本稿では,その理論的健全性にもかかわらず,現代XMLCにおけるその応用は議論の余地があることを示す。
本稿では,提案手法の問題点を徹底的に議論し,いくつかのレシピ,検索エンジンやレコメンデータシステムで使用されるソリューションに関連するものについて紹介する。
関連論文リスト
- Class-Distribution-Aware Pseudo Labeling for Semi-Supervised Multi-Label
Learning [97.88458953075205]
Pseudo-labelingは、ラベルなしデータを利用するための人気で効果的なアプローチとして登場した。
本稿では,クラスアウェアの擬似ラベル処理を行うCAP(Class-Aware Pseudo-Labeling)という新しい手法を提案する。
論文 参考訳(メタデータ) (2023-05-04T12:52:18Z) - Reliable Representations Learning for Incomplete Multi-View Partial Multi-Label Classification [78.15629210659516]
本稿ではRANKという不完全なマルチビュー部分的マルチラベル分類ネットワークを提案する。
既存の手法に固有のビューレベルの重みを分解し、各サンプルのビューに品質スコアを動的に割り当てる品質対応サブネットワークを提案する。
我々のモデルは、完全なマルチビューマルチラベルデータセットを処理できるだけでなく、欠落したインスタンスやラベルを持つデータセットでも機能する。
論文 参考訳(メタデータ) (2023-03-30T03:09:25Z) - An Effective Approach for Multi-label Classification with Missing Labels [8.470008570115146]
分類ネットワークにさらなる複雑さをもたらすことなく、アノテーションのコストを削減するための擬似ラベルベースのアプローチを提案する。
新たな損失関数を設計することにより、各インスタンスが少なくとも1つの正のラベルを含む必要があるという要求を緩和することができる。
提案手法は,正のラベルと負のラベルの不均衡を扱える一方で,既存の欠落ラベル学習手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-10-24T23:13:57Z) - A Survey on Extreme Multi-label Learning [72.8751573611815]
マルチラベル学習は、近年、学術分野と産業分野の両方から大きな注目を集めている。
計算とメモリのオーバーヘッドのため、それらを非常に大きなラベル空間に直接適応することは不可能である。
eXtreme Multi-label Learning (XML)は重要なタスクとなり、多くの効果的なアプローチが提案されている。
論文 参考訳(メタデータ) (2022-10-08T08:31:34Z) - Long-tailed Extreme Multi-label Text Classification with Generated
Pseudo Label Descriptions [28.416742933744942]
本稿では,新しい手法を提案することで,テールラベル予測の課題に対処する。
これは、厳しいデータ不足条件下で情報ラベル記述を生成するための訓練されたbacker-of-words(BoW)分類器の有効性を組み合わせたものである。
提案手法はXMTCベンチマークデータセット上での最先端性能を実現し,これまでで最高の手法であるテールラベル予測を著しく上回っている。
論文 参考訳(メタデータ) (2022-04-02T23:42:32Z) - Propensity-scored Probabilistic Label Trees [3.764094942736144]
本稿では,XMLC問題に対する最適解を効率的に見つけるために,$A*$-searchアルゴリズムに基づく推論手順を提案する。
本稿では、この手法の魅力を、人気のあるXMLCベンチマークデータセットに関する広範な実証的研究で実証する。
論文 参考訳(メタデータ) (2021-10-20T22:10:20Z) - Label Disentanglement in Partition-based Extreme Multilabel
Classification [111.25321342479491]
分割型XMCにおけるラベル割り当て問題を最適化問題として定式化できることを示す。
提案手法はマルチモーダルラベルのアンタングル化に成功し、4つのXMCベンチマークでSOTA(State-of-the-art)結果が得られた。
論文 参考訳(メタデータ) (2021-06-24T03:24:18Z) - Coherent Hierarchical Multi-Label Classification Networks [56.41950277906307]
C-HMCNN(h)はHMC問題に対する新しいアプローチであり、階層情報を利用して制約に整合した予測を生成し、性能を向上させる。
最先端モデルと比較してC-HMCNN(h)の優れた性能を示す広範囲な実験的検討を行った。
論文 参考訳(メタデータ) (2020-10-20T09:37:02Z) - Interaction Matching for Long-Tail Multi-Label Classification [57.262792333593644]
既存のマルチラベル分類モデルにおいて,制約に対処するためのエレガントで効果的なアプローチを提案する。
ソフトなn-gram相互作用マッチングを実行することで、ラベルと自然言語記述をマッチングする。
論文 参考訳(メタデータ) (2020-05-18T15:27:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。