論文の概要: Propensity-scored Probabilistic Label Trees
- arxiv url: http://arxiv.org/abs/2110.10803v1
- Date: Wed, 20 Oct 2021 22:10:20 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-22 18:21:21.851019
- Title: Propensity-scored Probabilistic Label Trees
- Title(参考訳): 確率的確率的ラベル木
- Authors: Marek Wydmuch, Kalina Jasinska-Kobus, Rohit Babbar, Krzysztof
Dembczy\'nski
- Abstract要約: 本稿では,XMLC問題に対する最適解を効率的に見つけるために,$A*$-searchアルゴリズムに基づく推論手順を提案する。
本稿では、この手法の魅力を、人気のあるXMLCベンチマークデータセットに関する広範な実証的研究で実証する。
- 参考スコア(独自算出の注目度): 3.764094942736144
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Extreme multi-label classification (XMLC) refers to the task of tagging
instances with small subsets of relevant labels coming from an extremely large
set of all possible labels. Recently, XMLC has been widely applied to diverse
web applications such as automatic content labeling, online advertising, or
recommendation systems. In such environments, label distribution is often
highly imbalanced, consisting mostly of very rare tail labels, and relevant
labels can be missing. As a remedy to these problems, the propensity model has
been introduced and applied within several XMLC algorithms. In this work, we
focus on the problem of optimal predictions under this model for probabilistic
label trees, a popular approach for XMLC problems. We introduce an inference
procedure, based on the $A^*$-search algorithm, that efficiently finds the
optimal solution, assuming that all probabilities and propensities are known.
We demonstrate the attractiveness of this approach in a wide empirical study on
popular XMLC benchmark datasets.
- Abstract(参考訳): Extreme Multi-label Classification (XMLC)は、すべての可能なラベルの非常に大きなセットから、関連するラベルの小さなサブセットでインスタンスをタグ付けするタスクを指す。
近年、XMLCは自動コンテンツラベリング、オンライン広告、レコメンデーションシステムなど様々なウェブアプリケーションに広く応用されている。
このような環境では、ラベルの分布は高度にバランスが取れず、ほとんどがレアなテールラベルであり、関連するラベルが欠落することがある。
これらの問題に対する対策として、確率モデルが導入され、いくつかのXMLCアルゴリズムで適用されている。
本稿では,XMLC問題に対する一般的なアプローチである確率的ラベルツリーに対するモデルに基づく最適予測の問題に焦点を当てる。
a^*$-searchアルゴリズムに基づく推論手順を導入し、すべての確率と確率が知られていることを仮定して、最適解を効率的に発見する。
我々は、人気のあるxmlcベンチマークデータセットに関する幅広い実証研究において、このアプローチの魅力を実証する。
関連論文リスト
- Towards Imbalanced Large Scale Multi-label Classification with Partially
Annotated Labels [8.977819892091]
マルチラベル分類は、複数のクラスにインスタンスを関連付けることができる日常生活において、広く発生する問題である。
本研究では,ラベルの不均衡の問題に対処し,部分ラベルを用いたニューラルネットワークのトレーニング方法について検討する。
論文 参考訳(メタデータ) (2023-07-31T21:50:48Z) - Class-Distribution-Aware Pseudo Labeling for Semi-Supervised Multi-Label
Learning [97.88458953075205]
Pseudo-labelingは、ラベルなしデータを利用するための人気で効果的なアプローチとして登場した。
本稿では,クラスアウェアの擬似ラベル処理を行うCAP(Class-Aware Pseudo-Labeling)という新しい手法を提案する。
論文 参考訳(メタデータ) (2023-05-04T12:52:18Z) - An Effective Approach for Multi-label Classification with Missing Labels [8.470008570115146]
分類ネットワークにさらなる複雑さをもたらすことなく、アノテーションのコストを削減するための擬似ラベルベースのアプローチを提案する。
新たな損失関数を設計することにより、各インスタンスが少なくとも1つの正のラベルを含む必要があるという要求を緩和することができる。
提案手法は,正のラベルと負のラベルの不均衡を扱える一方で,既存の欠落ラベル学習手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-10-24T23:13:57Z) - A Survey on Extreme Multi-label Learning [72.8751573611815]
マルチラベル学習は、近年、学術分野と産業分野の両方から大きな注目を集めている。
計算とメモリのオーバーヘッドのため、それらを非常に大きなラベル空間に直接適応することは不可能である。
eXtreme Multi-label Learning (XML)は重要なタスクとなり、多くの効果的なアプローチが提案されている。
論文 参考訳(メタデータ) (2022-10-08T08:31:34Z) - On Missing Labels, Long-tails and Propensities in Extreme Multi-label
Classification [5.247557449370602]
Jain氏らが2016年に導入した固有性モデルは、極端なマルチラベル分類(XMLC)において、欠落した、長い尾のラベルを扱うための標準的アプローチとなっている。
本稿では,提案手法の問題点を網羅的に論じ,いくつかのレシピを紹介し,その一部は検索エンジンやレコメンデータシステムで使用されるソリューションに関連している。
論文 参考訳(メタデータ) (2022-07-26T21:23:23Z) - One Positive Label is Sufficient: Single-Positive Multi-Label Learning
with Label Enhancement [71.9401831465908]
本研究では,SPMLL (Single- positive multi-label learning) について検討した。
ラベルエンハンスメントを用いた単陽性MultIラベル学習という新しい手法を提案する。
ベンチマークデータセットの実験により,提案手法の有効性が検証された。
論文 参考訳(メタデータ) (2022-06-01T14:26:30Z) - Label Disentanglement in Partition-based Extreme Multilabel
Classification [111.25321342479491]
分割型XMCにおけるラベル割り当て問題を最適化問題として定式化できることを示す。
提案手法はマルチモーダルラベルのアンタングル化に成功し、4つのXMCベンチマークでSOTA(State-of-the-art)結果が得られた。
論文 参考訳(メタデータ) (2021-06-24T03:24:18Z) - LightXML: Transformer with Dynamic Negative Sampling for
High-Performance Extreme Multi-label Text Classification [27.80266694835677]
Extreme Multi-label text Classification (XMC) は、大きなラベルセットから最も関連性の高いラベルを見つけるタスクである。
エンドツーエンドのトレーニングと動的負ラベルサンプリングを採用したLightXMLを提案する。
実験では、LightXMLは5つの極端なマルチラベルデータセットで最先端のメソッドより優れています。
論文 参考訳(メタデータ) (2021-01-09T07:04:18Z) - A Study on the Autoregressive and non-Autoregressive Multi-label
Learning [77.11075863067131]
本稿では,ラベルとラベルの依存関係を共同で抽出する自己アテンションに基づく変分エンコーダモデルを提案する。
したがって、ラベルラベルとラベル機能の両方の依存関係を保ちながら、すべてのラベルを並列に予測することができる。
論文 参考訳(メタデータ) (2020-12-03T05:41:44Z) - Probabilistic Label Trees for Extreme Multi-label Classification [8.347190888362194]
極端なマルチラベル分類(XMLC)の問題は,木としてラベルを整理することで効率的に処理される。
PLTは多ラベル問題に対する階層的ソフトマックスの一般化として扱うことができる。
このモデルを導入し、トレーニングと推論手順とその計算コストについて論じる。
完全にオンラインのアルゴリズムと木構造を持つアルゴリズムとの間には,特定の等価性があることを実証する。
論文 参考訳(メタデータ) (2020-09-23T15:30:00Z) - Interaction Matching for Long-Tail Multi-Label Classification [57.262792333593644]
既存のマルチラベル分類モデルにおいて,制約に対処するためのエレガントで効果的なアプローチを提案する。
ソフトなn-gram相互作用マッチングを実行することで、ラベルと自然言語記述をマッチングする。
論文 参考訳(メタデータ) (2020-05-18T15:27:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。