論文の概要: Explaining the Performance of Multi-label Classification Methods with
Data Set Properties
- arxiv url: http://arxiv.org/abs/2106.15411v1
- Date: Mon, 28 Jun 2021 11:00:05 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-30 15:43:37.033799
- Title: Explaining the Performance of Multi-label Classification Methods with
Data Set Properties
- Title(参考訳): データセット特性を用いたマルチラベル分類法の性能説明
- Authors: Jasmin Bogatinovski, Ljup\v{c}o Todorovski, Sa\v{s}o D\v{z}eroski,
Dragi Kocev
- Abstract要約: MLC(Multi-label Classification)のためのデータセットと手法に関する総合メタラーニング研究を提案する。
ここでは,40個のMLCデータセットを,データの異なる特性を記述した50個のメタ特徴を用いて解析する。
MLCデータセットの空間を記述する最も顕著なメタ機能は、ラベル空間の異なる側面を評価するものである。
- 参考スコア(独自算出の注目度): 1.1278903078792917
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Meta learning generalizes the empirical experience with different learning
tasks and holds promise for providing important empirical insight into the
behaviour of machine learning algorithms. In this paper, we present a
comprehensive meta-learning study of data sets and methods for multi-label
classification (MLC). MLC is a practically relevant machine learning task where
each example is labelled with multiple labels simultaneously. Here, we analyze
40 MLC data sets by using 50 meta features describing different properties of
the data. The main findings of this study are as follows. First, the most
prominent meta features that describe the space of MLC data sets are the ones
assessing different aspects of the label space. Second, the meta models show
that the most important meta features describe the label space, and, the meta
features describing the relationships among the labels tend to occur a bit more
often than the meta features describing the distributions between and within
the individual labels. Third, the optimization of the hyperparameters can
improve the predictive performance, however, quite often the extent of the
improvements does not always justify the resource utilization.
- Abstract(参考訳): メタ学習は、異なる学習タスクで経験経験を一般化し、機械学習アルゴリズムの振る舞いに関する重要な経験的洞察を提供する。
本稿では,データセットの包括的メタラーニング研究とマルチラベル分類(mlc)の手法を提案する。
MLCは、各サンプルに複数のラベルを同時にラベル付けする、実用的な機械学習タスクである。
本稿では,データの異なる特性を記述する50のメタ特徴を用いて,40個のmlcデータセットを解析する。
本研究の主な成果は以下の通りである。
まず、LCデータセットの空間を記述する最も顕著なメタ機能は、ラベル空間の異なる側面を評価するものである。
第二に、メタモデルは、最も重要なメタ特徴がラベル空間を記述していることを示し、そして、ラベル間の関係を記述するメタ特徴は、個々のラベル間の分布を記述するメタ特徴よりも、少し頻繁に発生する傾向がある。
第三に、ハイパーパラメータの最適化は予測性能を改善することができるが、改善の程度は必ずしも資源利用を正当化するとは限らない。
関連論文リスト
- Logit Separability-Driven Samples and Multiple Class-Related Words Selection for Advancing In-Context Learning [0.0]
本稿では,ロジットレベルのサンプルとクラス関連単語の明瞭度を評価するための基準であるロジット分離性を導入する。
各サンプルに複数のクラス関連語を組み込むことで,より広い範囲のラベル情報を提供することで,性能の向上が期待できる。
サンプルを共同で整理し,複数のクラス関連単語を各サンプルラベルペアに統合する,ロジット分離性に基づくlicLを提案する。
論文 参考訳(メタデータ) (2024-06-16T12:11:46Z) - infoVerse: A Universal Framework for Dataset Characterization with
Multidimensional Meta-information [68.76707843019886]
infoVerseは、データセットの特徴付けのための普遍的なフレームワークである。
infoVerseは、様々なモデル駆動メタ情報を統合することで、データセットの多次元特性をキャプチャする。
実世界の3つのアプリケーション(データプルーニング、アクティブラーニング、データアノテーション)において、infoVerse空間で選択されたサンプルは、強いベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2023-05-30T18:12:48Z) - Exploring Structured Semantic Prior for Multi Label Recognition with
Incomplete Labels [60.675714333081466]
不完全なラベルを持つマルチラベル認識(MLR)は非常に難しい。
最近の研究は、視覚言語モデルであるCLIPにおける画像とラベルの対応を探り、不十分なアノテーションを補うことを目指している。
我々は,MLRにおけるラベル管理の欠如を,構造化されたセマンティクスを導出することにより,不完全なラベルで修復することを提唱する。
論文 参考訳(メタデータ) (2023-03-23T12:39:20Z) - PLATINUM: Semi-Supervised Model Agnostic Meta-Learning using Submodular
Mutual Information [3.1845305066053347]
FSC (Few-shot Classification) は、クラスごとに少数の(通常1から5までの)データポイントを使用するトレーニングモデルを必要とする。
サブモジュール相互情報(SMI)関数を用いてFSCの性能を向上する半教師付きモデル非依存メタラーニングフレームワークPLATINUMを提案する。
論文 参考訳(メタデータ) (2022-01-30T22:07:17Z) - Simple multi-dataset detection [83.9604523643406]
複数の大規模データセット上で統合検出器を訓練する簡単な方法を提案する。
データセット固有のアウトプットを共通の意味分類に自動的に統合する方法を示す。
私たちのアプローチは手動の分類学の調整を必要としません。
論文 参考訳(メタデータ) (2021-02-25T18:55:58Z) - MATCH: Metadata-Aware Text Classification in A Large Hierarchy [60.59183151617578]
MATCHはメタデータと階層情報の両方を利用するエンドツーエンドのフレームワークである。
親による各子ラベルのパラメータと出力確率を正規化するさまざまな方法を提案します。
大規模なラベル階層を持つ2つの大規模なテキストデータセットの実験は、MATCHの有効性を示しています。
論文 参考訳(メタデータ) (2021-02-15T05:23:08Z) - Multi-label Few/Zero-shot Learning with Knowledge Aggregated from
Multiple Label Graphs [8.44680447457879]
本稿では,異なる意味的ラベル関係をコードする複数のラベルグラフから知識を融合する,シンプルな多グラフ集約モデルを提案する。
本研究は,多グラフ知識集約を用いた手法が,少数・ゼロショットラベルのほとんどすべてにおいて,大幅な性能向上を実現していることを示す。
論文 参考訳(メタデータ) (2020-10-15T01:15:43Z) - Few-shot Learning for Multi-label Intent Detection [59.66787898744991]
State-of-the-art work estimates label-instancelevance scores and using threshold to select multiple associated intent labels。
2つのデータセットの実験により、提案モデルが1ショットと5ショットの両方の設定において強いベースラインを著しく上回ることが示された。
論文 参考訳(メタデータ) (2020-10-11T14:42:18Z) - Minimally Supervised Categorization of Text with Metadata [40.13841133991089]
メタデータでテキストを分類する最小限のフレームワークであるMetaCatを提案する。
我々は,単語,文書,ラベル,メタデータ間の関係を記述した生成プロセスを開発する。
同じ生成過程に基づいて,ラベル不足のボトルネックに対処するため,トレーニングサンプルを合成する。
論文 参考訳(メタデータ) (2020-05-01T21:42:32Z) - Incremental Meta-Learning via Indirect Discriminant Alignment [118.61152684795178]
メタ学習のメタ学習段階において,段階的な学習の概念を発達させる。
我々のアプローチは、完全なメタトレーニングセットでモデルをトレーニングするのと比べて、テスト時に好適に機能する。
論文 参考訳(メタデータ) (2020-02-11T01:39:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。