論文の概要: A Survey on Extreme Multi-label Learning
- arxiv url: http://arxiv.org/abs/2210.03968v1
- Date: Sat, 8 Oct 2022 08:31:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-11 18:21:38.540379
- Title: A Survey on Extreme Multi-label Learning
- Title(参考訳): エクストリーム・マルチラベル学習に関する調査研究
- Authors: Tong Wei, Zhen Mao, Jiang-Xin Shi, Yu-Feng Li, Min-Ling Zhang
- Abstract要約: マルチラベル学習は、近年、学術分野と産業分野の両方から大きな注目を集めている。
計算とメモリのオーバーヘッドのため、それらを非常に大きなラベル空間に直接適応することは不可能である。
eXtreme Multi-label Learning (XML)は重要なタスクとなり、多くの効果的なアプローチが提案されている。
- 参考スコア(独自算出の注目度): 72.8751573611815
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multi-label learning has attracted significant attention from both academic
and industry field in recent decades. Although existing multi-label learning
algorithms achieved good performance in various tasks, they implicitly assume
the size of target label space is not huge, which can be restrictive for
real-world scenarios. Moreover, it is infeasible to directly adapt them to
extremely large label space because of the compute and memory overhead.
Therefore, eXtreme Multi-label Learning (XML) is becoming an important task and
many effective approaches are proposed. To fully understand XML, we conduct a
survey study in this paper. We first clarify a formal definition for XML from
the perspective of supervised learning. Then, based on different model
architectures and challenges of the problem, we provide a thorough discussion
of the advantages and disadvantages of each category of methods. For the
benefit of conducting empirical studies, we collect abundant resources
regarding XML, including code implementations, and useful tools. Lastly, we
propose possible research directions in XML, such as new evaluation metrics,
the tail label problem, and weakly supervised XML.
- Abstract(参考訳): マルチレーベル学習は、近年、学術分野と産業分野の両方から大きな注目を集めている。
既存のマルチラベル学習アルゴリズムは様々なタスクで優れた性能を達成しているが、ターゲットラベル空間のサイズは巨大ではないと暗黙的に仮定しており、現実のシナリオでは制限される可能性がある。
さらに、計算とメモリのオーバーヘッドのため、それらを非常に大きなラベル空間に直接適応することは不可能である。
そのため、eXtreme Multi-label Learning (XML) は重要な課題となり、多くの効果的なアプローチが提案されている。
XMLを十分に理解するために,本稿では調査研究を行う。
まず,教師あり学習の観点からxmlの形式的定義を明らかにする。
そして、異なるモデルアーキテクチャと問題の課題に基づいて、各カテゴリのメソッドの長所と短所について徹底的に議論する。
実証的研究を行うために、コード実装や有用なツールを含むXMLに関する豊富なリソースを収集します。
最後に、新しい評価指標、テールラベル問題、弱い教師付きXMLなど、XMLにおける研究方向を提案する。
関連論文リスト
- ICXML: An In-Context Learning Framework for Zero-Shot Extreme Multi-Label Classification [22.825115483590285]
本稿では,非常に大きなラベル空間から各インスタンスの複数のラベルを予測することを目的とした,エクストリームマルチラベル分類(XMC)の課題に焦点を当てる。
In-Context Extreme Multilabel Learning (ICXML)という2段階のフレームワークを導入する。
論文 参考訳(メタデータ) (2023-11-16T08:01:17Z) - Multi-Label Knowledge Distillation [86.03990467785312]
本稿では,新しい多ラベル知識蒸留法を提案する。
一方、マルチラベル学習問題をバイナリ分類問題に分割することにより、ロジットからの情報的意味知識を利用する。
一方,ラベルワイド埋め込みの構造情報を活用することにより,学習した特徴表現の識別性を向上する。
論文 参考訳(メタデータ) (2023-08-12T03:19:08Z) - A Survey of Label-Efficient Deep Learning for 3D Point Clouds [109.07889215814589]
本稿では,点雲のラベル効率学習に関する包括的調査を行う。
本稿では,ラベルの種類によって提供されるデータ前提条件に基づいて,ラベル効率のよい学習手法を整理する分類法を提案する。
それぞれのアプローチについて、問題設定の概要と、関連する進展と課題を示す広範な文献レビューを提供する。
論文 参考訳(メタデータ) (2023-05-31T12:54:51Z) - Light-weight Deep Extreme Multilabel Classification [12.29534534973133]
Extreme Multi-label (XML) 分類は、多数のラベルを含む教師付きマルチラベル学習のタスクを指す。
我々は最近開発されたディープラーニングベースのXMLフレームワークをラベル埋め込みを用いて変更するLightDXMLと呼ばれる手法を開発した。
LightDXMLはまた、再ランカモジュールの要求を取り除き、時間とメモリの要求をさらに節約する。
論文 参考訳(メタデータ) (2023-04-20T09:06:10Z) - A Multi-label Continual Learning Framework to Scale Deep Learning
Approaches for Packaging Equipment Monitoring [57.5099555438223]
連続シナリオにおけるマルチラベル分類を初めて研究した。
タスク数に関して対数的複雑性を持つ効率的なアプローチを提案する。
我々は,包装業界における実世界のマルチラベル予測問題に対するアプローチを検証した。
論文 参考訳(メタデータ) (2022-08-08T15:58:39Z) - Large Loss Matters in Weakly Supervised Multi-Label Classification [50.262533546999045]
まず、観測されていないラベルを負のラベルとみなし、Wタスクをノイズの多いマルチラベル分類にキャストする。
ノイズラベルを記憶しないために,大規模な損失サンプルを拒絶または補正する新しいW法を提案する。
提案手法は, 弱教師付きマルチラベル分類において, 大きな損失を適切に処理することが重要であることを検証した。
論文 参考訳(メタデータ) (2022-06-08T08:30:24Z) - DeepXML: A Deep Extreme Multi-Label Learning Framework Applied to Short
Text Documents [10.573976360424473]
本稿では,DeepXMLフレームワークを開発し,深部マルチラベルタスクを4つのシンプルなサブタスクに分解し,それらを正確かつ効率的に訓練する。
DeepXMLはAstecアルゴリズムの精度を2~12%向上し、トレーニングが5~30倍高速になる可能性がある。
またAstecは、最大6200万のラベルを含むBingの短いテキストデータセットを効率的にトレーニングし、コモディティハードウェア上で毎日数十億のユーザとデータポイントを予測できる。
論文 参考訳(メタデータ) (2021-11-12T12:25:23Z) - Propensity-scored Probabilistic Label Trees [3.764094942736144]
本稿では,XMLC問題に対する最適解を効率的に見つけるために,$A*$-searchアルゴリズムに基づく推論手順を提案する。
本稿では、この手法の魅力を、人気のあるXMLCベンチマークデータセットに関する広範な実証的研究で実証する。
論文 参考訳(メタデータ) (2021-10-20T22:10:20Z) - The Emerging Trends of Multi-Label Learning [45.63795570392158]
エクサバイトのデータは人間によって毎日生成されるため、ビッグデータによってもたらされるマルチラベル学習に対する大きな課題に対処する新たな取り組みの必要性が高まっている。
ビッグデータ時代における新興トレンドとマルチラベル学習の新たな課題を明示的に分析することに焦点を当てた体系的研究の欠如がある。
このミッションを遂行し、今後の研究の方向性と新たな応用を説明するための総合的な調査を求めることが不可欠である。
論文 参考訳(メタデータ) (2020-11-23T03:36:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。