論文の概要: Investigating Class-level Difficulty Factors in Multi-label
Classification Problems
- arxiv url: http://arxiv.org/abs/2005.00430v1
- Date: Fri, 1 May 2020 15:06:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-08 00:13:36.815645
- Title: Investigating Class-level Difficulty Factors in Multi-label
Classification Problems
- Title(参考訳): 多ラベル分類問題におけるクラスレベルの困難要因の検討
- Authors: Mark Marsden, Kevin McGuinness, Joseph Antony, Haolin Wei, Milan
Redzic, Jian Tang, Zhilan Hu, Alan Smeaton, Noel E O'Connor
- Abstract要約: 本研究は,マルチラベル分類問題におけるクラスレベルの難易度因子の利用を初めて検討する。
周波数、視覚的変化、セマンティック抽象化、クラス共起の4つの困難因子が提案されている。
これらの困難因子は、データセット間でのクラスレベルのパフォーマンスの予測など、いくつかの潜在的な応用があることが示されている。
- 参考スコア(独自算出の注目度): 23.51529285126783
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: This work investigates the use of class-level difficulty factors in
multi-label classification problems for the first time. Four class-level
difficulty factors are proposed: frequency, visual variation, semantic
abstraction, and class co-occurrence. Once computed for a given multi-label
classification dataset, these difficulty factors are shown to have several
potential applications including the prediction of class-level performance
across datasets and the improvement of predictive performance through
difficulty weighted optimisation. Significant improvements to mAP and AUC
performance are observed for two challenging multi-label datasets (WWW Crowd
and Visual Genome) with the inclusion of difficulty weighted optimisation. The
proposed technique does not require any additional computational complexity
during training or inference and can be extended over time with inclusion of
other class-level difficulty factors.
- Abstract(参考訳): 本研究は,マルチラベル分類問題におけるクラスレベルの難易度を初めて検討する。
クラスレベルの難易度には,頻度,視覚変動,意味的抽象化,クラス共起という4つの要因が提案されている。
与えられたマルチラベル分類データセットに対して計算すると、これらの困難因子は、データセット間のクラスレベルのパフォーマンスの予測や、重み付け最適化による予測性能の改善など、いくつかの潜在的な応用があることが示される。
重み付け最適化が困難である2つの挑戦的マルチラベルデータセット(WWW CrowdとVisual Genome)では、mAPとAUCのパフォーマンスが大幅に改善されている。
提案手法は, 学習や推論において, 余分な計算複雑性を伴わず, クラスレベルの難易度を考慮し, 時間とともに拡張することができる。
関連論文リスト
- The Multiplex Classification Framework: optimizing multi-label classifiers through problem transformation, ontology engineering, and model ensembling [0.0]
本稿では,多重化分類フレームワークについて紹介する。
このフレームワークには,任意のクラスへの適応性や論理的制約など,いくつかのメリットがある。
従来の分類モデルとMultiformxアプローチを比較した2つの実験を行った。
論文 参考訳(メタデータ) (2024-12-18T20:07:27Z) - Exploring Contrastive Learning for Long-Tailed Multi-Label Text Classification [48.81069245141415]
マルチラベルテキスト分類のための新しいコントラスト損失関数を提案する。
マイクロF1スコアは、他の頻繁に採用される損失関数と一致するか、上回っている。
これは、3つのマルチラベルデータセットでMacro-F1スコアが大幅に改善されたことを示している。
論文 参考訳(メタデータ) (2024-04-12T11:12:16Z) - Balanced Classification: A Unified Framework for Long-Tailed Object
Detection [74.94216414011326]
従来の検出器は、分類バイアスによる長期データを扱う際の性能劣化に悩まされる。
本稿では,カテゴリ分布の格差に起因する不平等の適応的是正を可能にする,BAlanced CLassification (BACL) と呼ばれる統一フレームワークを提案する。
BACLは、さまざまなバックボーンとアーキテクチャを持つさまざまなデータセット間で、一貫してパフォーマンス改善を実現している。
論文 参考訳(メタデータ) (2023-08-04T09:11:07Z) - Difficulty-Net: Learning to Predict Difficulty for Long-Tailed
Recognition [5.977483447975081]
メタラーニングフレームワークにおいて,モデルの性能を用いてクラスの難易度を予測することを学習するDifficulty-Netを提案する。
本稿では,相対的難易度と運転者損失という2つの重要な概念を紹介する。
提案手法の有効性を実証した。
論文 参考訳(メタデータ) (2022-09-07T07:04:08Z) - PercentMatch: Percentile-based Dynamic Thresholding for Multi-Label
Semi-Supervised Classification [64.39761523935613]
トレーニング中の各クラスに対する正と負の擬似ラベルのスコア閾値を動的に変更するためのパーセンタイルベースのしきい値調整手法を提案する。
近年のSSL方式と比較して, Pascal VOC2007 と MS-COCO のデータセットの性能は高い。
論文 参考訳(メタデータ) (2022-08-30T01:27:48Z) - Let the Model Decide its Curriculum for Multitask Learning [22.043291547405545]
モデルに基づくアプローチによって計算される難易度に基づく学習カリキュラムにトレーニングインスタンスを配置する手法を2種類提案する。
インスタンスレベルとデータセットレベルの技術は、それぞれのベースラインに対して平均4.17%と3.15%のパフォーマンス向上をもたらすため、強い表現をもたらすことを示す。
論文 参考訳(メタデータ) (2022-05-19T23:34:22Z) - Multitask Learning for Class-Imbalanced Discourse Classification [74.41900374452472]
マルチタスクアプローチは,現在のベンチマークで7%のマイクロf1コアを改善できることを示す。
また,NLPにおける資源不足問題に対処するための追加手法の比較検討を行った。
論文 参考訳(メタデータ) (2021-01-02T07:13:41Z) - Theoretical Insights Into Multiclass Classification: A High-dimensional
Asymptotic View [82.80085730891126]
線形多クラス分類の最初の現代的精度解析を行う。
分析の結果,分類精度は分布に依存していることがわかった。
得られた洞察は、他の分類アルゴリズムの正確な理解の道を開くかもしれない。
論文 参考訳(メタデータ) (2020-11-16T05:17:29Z) - Coherent Hierarchical Multi-Label Classification Networks [56.41950277906307]
C-HMCNN(h)はHMC問題に対する新しいアプローチであり、階層情報を利用して制約に整合した予測を生成し、性能を向上させる。
最先端モデルと比較してC-HMCNN(h)の優れた性能を示す広範囲な実験的検討を行った。
論文 参考訳(メタデータ) (2020-10-20T09:37:02Z) - Combined Cleaning and Resampling Algorithm for Multi-Class Imbalanced
Data with Label Noise [11.868507571027626]
本稿では,新しいオーバーサンプリング手法であるマルチクラス・コンバインド・クリーニングとリサンプリングのアルゴリズムを提案する。
提案手法は, オーバーサンプリングに適した領域をモデル化するためのエネルギーベース手法を用いて, SMOTEよりも小さな解離や外れ値の影響を受けない。
重なり合うクラス分布が学習アルゴリズムの性能に与える影響を低減することを目的として, 同時クリーニング操作と組み合わせた。
論文 参考訳(メタデータ) (2020-04-07T13:59:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。