論文の概要: Multilabel Classification by Hierarchical Partitioning and
Data-dependent Grouping
- arxiv url: http://arxiv.org/abs/2006.14084v2
- Date: Sat, 31 Oct 2020 19:11:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-17 09:32:05.005241
- Title: Multilabel Classification by Hierarchical Partitioning and
Data-dependent Grouping
- Title(参考訳): 階層分割とデータ依存グルーピングによるマルチラベル分類
- Authors: Shashanka Ubaru, Sanjeeb Dash, Arya Mazumdar, Oktay Gunluk
- Abstract要約: ラベルベクトルの空間性と階層構造を利用して、それらを低次元空間に埋め込む。
我々は、低ランク非負行列因子化に基づくグループ構成を用いる、新しいデータ依存型グループ化手法を提案する。
次に、大規模問題におけるラベル階層を利用して、大きなラベル空間を分割し、より小さなサブプロブレムを生成する階層的分割手法を提案する。
- 参考スコア(独自算出の注目度): 33.48217977134427
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In modern multilabel classification problems, each data instance belongs to a
small number of classes from a large set of classes. In other words, these
problems involve learning very sparse binary label vectors. Moreover, in
large-scale problems, the labels typically have certain (unknown) hierarchy. In
this paper we exploit the sparsity of label vectors and the hierarchical
structure to embed them in low-dimensional space using label groupings.
Consequently, we solve the classification problem in a much lower dimensional
space and then obtain labels in the original space using an appropriately
defined lifting. Our method builds on the work of (Ubaru & Mazumdar, 2017),
where the idea of group testing was also explored for multilabel
classification. We first present a novel data-dependent grouping approach,
where we use a group construction based on a low-rank Nonnegative Matrix
Factorization (NMF) of the label matrix of training instances. The construction
also allows us, using recent results, to develop a fast prediction algorithm
that has a logarithmic runtime in the number of labels. We then present a
hierarchical partitioning approach that exploits the label hierarchy in large
scale problems to divide up the large label space and create smaller
sub-problems, which can then be solved independently via the grouping approach.
Numerical results on many benchmark datasets illustrate that, compared to other
popular methods, our proposed methods achieve competitive accuracy with
significantly lower computational costs.
- Abstract(参考訳): 現代のマルチラベル分類問題では、各データインスタンスは、多数のクラスからの少数のクラスに属している。
言い換えれば、これらの問題は非常にスパースなバイナリラベルベクトルを学習する。
さらに、大規模な問題では、ラベルは通常特定の(未知の)階層を持つ。
本稿では,ラベルベクトルのスパーシティと階層構造を利用して,ラベルグルーピングを用いた低次元空間への埋め込みを行う。
そこで,より低い次元空間における分類問題を解き,適切に定義された昇降法を用いて元の空間のラベルを得る。
提案手法は,マルチラベル分類のためのグループテストについても検討したUbaru & Mazumdar(2017)の成果に基づいている。
まず,トレーニングインスタンスのラベル行列の低ランク非負行列分解(nmf)に基づくグループ構成を用いた,新しいデータ依存型グループ化手法を提案する。
この構成により、最近の結果を用いて、ラベル数に対数ランタイムを持つ高速な予測アルゴリズムを開発することができる。
次に、大規模問題におけるラベル階層を利用して、大きなラベル空間を分割し、より小さなサブプロブレムを生成する階層的分割手法を提案する。
多くのベンチマークデータセットの数値的な結果から,提案手法は他の一般的な手法と比較して,計算コストを大幅に削減して競争精度を向上することを示した。
関連論文リスト
- Semi-Supervised Hierarchical Multi-Label Classifier Based on Local Information [1.6574413179773761]
局所情報に基づく半教師付き階層型多言語分類器(SSHMC-BLI)
SSHMC-BLIは、ラベル付き隣人のラベルのパスからラベルなしのインスタンスごとに擬似ラベルを構築する。
機能ゲノミクスによる12の挑戦的なデータセットの実験では、ラベル付きデータとラベル付きデータを使用することで、ラベル付きデータのみに基づいてトレーニングされた教師付き階層型分類器のパフォーマンスを向上させることができる。
論文 参考訳(メタデータ) (2024-04-30T20:16:40Z) - Active Generalized Category Discovery [60.69060965936214]
GCD(Generalized Category Discovery)は、新しいクラスと古いクラスの未ラベルのサンプルをクラスタ化するための取り組みである。
我々は,能動的学習の精神を取り入れて,能動的一般化カテゴリー発見(AGCD)という新たな設定を提案する。
提案手法は, 汎用および微粒なデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2024-03-07T07:12:24Z) - Towards Imbalanced Large Scale Multi-label Classification with Partially
Annotated Labels [8.977819892091]
マルチラベル分類は、複数のクラスにインスタンスを関連付けることができる日常生活において、広く発生する問題である。
本研究では,ラベルの不均衡の問題に対処し,部分ラベルを用いたニューラルネットワークのトレーニング方法について検討する。
論文 参考訳(メタデータ) (2023-07-31T21:50:48Z) - Making Binary Classification from Multiple Unlabeled Datasets Almost
Free of Supervision [128.6645627461981]
本稿では,複数ラベル付きデータセットからの2値分類という新たな問題設定を提案する。
MU-OPPOでは、ラベル付けされていないすべてのデータセットのクラスプリエントは不要です。
このフレームワークは,クラス前の推定誤差が小さくなり,バイナリ分類の性能が向上することを示す。
論文 参考訳(メタデータ) (2023-06-12T11:33:46Z) - Adopting the Multi-answer Questioning Task with an Auxiliary Metric for
Extreme Multi-label Text Classification Utilizing the Label Hierarchy [10.87653109398961]
本稿では,過度なマルチラベル分類のための複数問合せタスクを採用する。
本研究では,提案手法と評価基準を法域に適用する。
論文 参考訳(メタデータ) (2023-03-02T08:40:31Z) - Complementary to Multiple Labels: A Correlation-Aware Correction
Approach [65.59584909436259]
理論上, マルチクラスCLLにおける遷移行列が, 複数ラベルの場合どのように歪むかを示す。
候補ラベルから遷移行列を推定する2段階の手法を提案する。
論文 参考訳(メタデータ) (2023-02-25T04:48:48Z) - Review of Extreme Multilabel Classification [1.888738346075831]
極端なマルチラベル分類(英: Extreme multilabel classification、XML)は、機械学習における活発な関心領域である。
コミュニティは、頭や尾のラベルの予測を正しく識別するために有用なメトリクスセットを考案した。
論文 参考訳(メタデータ) (2023-02-12T18:29:20Z) - Multi-Instance Partial-Label Learning: Towards Exploiting Dual Inexact
Supervision [53.530957567507365]
実世界のタスクでは、各トレーニングサンプルは、1つの基底真実ラベルといくつかの偽陽性ラベルを含む候補ラベルセットに関連付けられている。
本稿では,Multi-instance partial-label learning (MIPL) などの問題を定式化する。
既存のマルチインスタンス学習アルゴリズムと部分ラベル学習アルゴリズムはMIPL問題の解法に最適である。
論文 参考訳(メタデータ) (2022-12-18T03:28:51Z) - An Effective Approach for Multi-label Classification with Missing Labels [8.470008570115146]
分類ネットワークにさらなる複雑さをもたらすことなく、アノテーションのコストを削減するための擬似ラベルベースのアプローチを提案する。
新たな損失関数を設計することにより、各インスタンスが少なくとも1つの正のラベルを含む必要があるという要求を緩和することができる。
提案手法は,正のラベルと負のラベルの不均衡を扱える一方で,既存の欠落ラベル学習手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-10-24T23:13:57Z) - Label Disentanglement in Partition-based Extreme Multilabel
Classification [111.25321342479491]
分割型XMCにおけるラベル割り当て問題を最適化問題として定式化できることを示す。
提案手法はマルチモーダルラベルのアンタングル化に成功し、4つのXMCベンチマークでSOTA(State-of-the-art)結果が得られた。
論文 参考訳(メタデータ) (2021-06-24T03:24:18Z) - MATCH: Metadata-Aware Text Classification in A Large Hierarchy [60.59183151617578]
MATCHはメタデータと階層情報の両方を利用するエンドツーエンドのフレームワークである。
親による各子ラベルのパラメータと出力確率を正規化するさまざまな方法を提案します。
大規模なラベル階層を持つ2つの大規模なテキストデータセットの実験は、MATCHの有効性を示しています。
論文 参考訳(メタデータ) (2021-02-15T05:23:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。