論文の概要: Probabilistic Label Trees for Extreme Multi-label Classification
- arxiv url: http://arxiv.org/abs/2009.11218v1
- Date: Wed, 23 Sep 2020 15:30:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-15 15:35:48.187229
- Title: Probabilistic Label Trees for Extreme Multi-label Classification
- Title(参考訳): 極端多重ラベル分類のための確率的ラベル木
- Authors: Kalina Jasinska-Kobus, Marek Wydmuch, Krzysztof Dembczynski, Mikhail
Kuznetsov, Robert Busa-Fekete
- Abstract要約: 極端なマルチラベル分類(XMLC)の問題は,木としてラベルを整理することで効率的に処理される。
PLTは多ラベル問題に対する階層的ソフトマックスの一般化として扱うことができる。
このモデルを導入し、トレーニングと推論手順とその計算コストについて論じる。
完全にオンラインのアルゴリズムと木構造を持つアルゴリズムとの間には,特定の等価性があることを実証する。
- 参考スコア(独自算出の注目度): 8.347190888362194
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Extreme multi-label classification (XMLC) is a learning task of tagging
instances with a small subset of relevant labels chosen from an extremely large
pool of possible labels. Problems of this scale can be efficiently handled by
organizing labels as a tree, like in hierarchical softmax used for multi-class
problems. In this paper, we thoroughly investigate probabilistic label trees
(PLTs) which can be treated as a generalization of hierarchical softmax for
multi-label problems. We first introduce the PLT model and discuss training and
inference procedures and their computational costs. Next, we prove the
consistency of PLTs for a wide spectrum of performance metrics. To this end, we
upperbound their regret by a function of surrogate-loss regrets of node
classifiers. Furthermore, we consider a problem of training PLTs in a fully
online setting, without any prior knowledge of training instances, their
features, or labels. In this case, both node classifiers and the tree structure
are trained online. We prove a specific equivalence between the fully online
algorithm and an algorithm with a tree structure given in advance. Finally, we
discuss several implementations of PLTs and introduce a new one, napkinXC,
which we empirically evaluate and compare with state-of-the-art algorithms.
- Abstract(参考訳): Extreme Multi-label Classification (XMLC)は、非常に大きなラベルプールから選択された関連するラベルの小さなサブセットでインスタンスをタグ付けする学習タスクである。
このスケールの問題は、階層的ソフトマックスのように木としてラベルを整理することで効率的に処理できる。
本稿では,多ラベル問題に対する階層型ソフトマックスの一般化として扱える確率的ラベルツリー(PLT)について,徹底的に検討する。
まず、PLTモデルを紹介し、トレーニングと推論手順とその計算コストについて論じる。
次に、幅広いパフォーマンスメトリクスに対して、pltの一貫性を証明します。
この目的のために、ノード分類器のサロゲート損失の関数によって、その後悔を上乗せする。
さらに,トレーニングインスタンスや特徴,ラベルに関する事前知識がなくても,完全オンライン環境でPLTをトレーニングするという問題も検討する。
この場合、ノード分類器とツリー構造の両方をオンラインでトレーニングする。
完全オンラインアルゴリズムと木構造を予め与えたアルゴリズムとの特定の等価性を証明する。
最後に,pltの実装をいくつか議論し,最先端アルゴリズムと比較し,実証的に評価する新しい手法であるnapkinxcを紹介する。
関連論文リスト
- Semi-Supervised Hierarchical Multi-Label Classifier Based on Local Information [1.6574413179773761]
局所情報に基づく半教師付き階層型多言語分類器(SSHMC-BLI)
SSHMC-BLIは、ラベル付き隣人のラベルのパスからラベルなしのインスタンスごとに擬似ラベルを構築する。
機能ゲノミクスによる12の挑戦的なデータセットの実験では、ラベル付きデータとラベル付きデータを使用することで、ラベル付きデータのみに基づいてトレーニングされた教師付き階層型分類器のパフォーマンスを向上させることができる。
論文 参考訳(メタデータ) (2024-04-30T20:16:40Z) - Multi-Label Knowledge Distillation [86.03990467785312]
本稿では,新しい多ラベル知識蒸留法を提案する。
一方、マルチラベル学習問題をバイナリ分類問題に分割することにより、ロジットからの情報的意味知識を利用する。
一方,ラベルワイド埋め込みの構造情報を活用することにより,学習した特徴表現の識別性を向上する。
論文 参考訳(メタデータ) (2023-08-12T03:19:08Z) - Contrastive Meta-Learning for Few-shot Node Classification [54.36506013228169]
少ないショットノード分類は、限定されたラベル付きノードのみを参照としてグラフ上のノードのラベルを予測することを目的としている。
グラフ上にCOSMICという新しい対照的なメタラーニングフレームワークを2つの重要な設計で作成する。
論文 参考訳(メタデータ) (2023-06-27T02:22:45Z) - Tree Learning: Optimal Algorithms and Sample Complexity [10.638365461509]
任意の分布から抽出したラベル付きサンプルから,データの階層木表現を学習する問題について検討する。
本稿では,この問題に対する最適なサンプル境界を,学習やオンライン学習など,いくつかの学習環境において提示する。
論文 参考訳(メタデータ) (2023-02-09T08:35:17Z) - Use All The Labels: A Hierarchical Multi-Label Contrastive Learning
Framework [75.79736930414715]
本稿では,すべての利用可能なラベルを活用でき,クラス間の階層的関係を維持できる階層型多言語表現学習フレームワークを提案する。
比較損失に階層的ペナルティを併用し,その階層的制約を強制する。
論文 参考訳(メタデータ) (2022-04-27T21:41:44Z) - Propensity-scored Probabilistic Label Trees [3.764094942736144]
本稿では,XMLC問題に対する最適解を効率的に見つけるために,$A*$-searchアルゴリズムに基づく推論手順を提案する。
本稿では、この手法の魅力を、人気のあるXMLCベンチマークデータセットに関する広範な実証的研究で実証する。
論文 参考訳(メタデータ) (2021-10-20T22:10:20Z) - Label Disentanglement in Partition-based Extreme Multilabel
Classification [111.25321342479491]
分割型XMCにおけるラベル割り当て問題を最適化問題として定式化できることを示す。
提案手法はマルチモーダルラベルのアンタングル化に成功し、4つのXMCベンチマークでSOTA(State-of-the-art)結果が得られた。
論文 参考訳(メタデータ) (2021-06-24T03:24:18Z) - Theoretical Insights Into Multiclass Classification: A High-dimensional
Asymptotic View [82.80085730891126]
線形多クラス分類の最初の現代的精度解析を行う。
分析の結果,分類精度は分布に依存していることがわかった。
得られた洞察は、他の分類アルゴリズムの正確な理解の道を開くかもしれない。
論文 参考訳(メタデータ) (2020-11-16T05:17:29Z) - Online probabilistic label trees [5.694890215546457]
OPLTは、時間と空間の複雑さの低さと強力な理論的保証によって特徴づけられる。
オンラインのマルチラベルとマルチクラスの分類に使用することができる。
論文 参考訳(メタデータ) (2020-07-08T21:45:00Z) - Online Metric Learning for Multi-Label Classification [22.484707213499714]
マルチラベル分類のための新しいオンラインメトリック学習パラダイムを提案する。
我々はまず,$k$-Nearest Neighbour(k$NN)に基づくマルチラベル分類のための新しい指標を提案する。
論文 参考訳(メタデータ) (2020-06-12T11:33:04Z) - Interaction Matching for Long-Tail Multi-Label Classification [57.262792333593644]
既存のマルチラベル分類モデルにおいて,制約に対処するためのエレガントで効果的なアプローチを提案する。
ソフトなn-gram相互作用マッチングを実行することで、ラベルと自然言語記述をマッチングする。
論文 参考訳(メタデータ) (2020-05-18T15:27:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。