論文の概要: Boosting Multi-Label Image Classification with Complementary Parallel
Self-Distillation
- arxiv url: http://arxiv.org/abs/2205.10986v1
- Date: Mon, 23 May 2022 01:28:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-24 15:13:05.589816
- Title: Boosting Multi-Label Image Classification with Complementary Parallel
Self-Distillation
- Title(参考訳): 並列自己蒸留による複数ラベル画像分類の高速化
- Authors: Jiazhi Xu and Sheng Huang and Fengtao Zhou and Luwen Huangfu and
Daniel Zeng and Bo Liu
- Abstract要約: マルチラベル画像分類手法は通常、ラベル相関を利用して優れた性能を実現する。
共起(co-occurrence)のような相関を強調することは、ターゲット自体の差別的な特徴を見落とし、モデルオーバーフィットにつながる可能性がある。
本研究では,MLICモデルの強化を目的としたParallel Self-Distillation (PSD) という汎用フレームワークを提案する。
- 参考スコア(独自算出の注目度): 15.518137695660668
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Multi-Label Image Classification (MLIC) approaches usually exploit label
correlations to achieve good performance. However, emphasizing correlation like
co-occurrence may overlook discriminative features of the target itself and
lead to model overfitting, thus undermining the performance. In this study, we
propose a generic framework named Parallel Self-Distillation (PSD) for boosting
MLIC models. PSD decomposes the original MLIC task into several simpler MLIC
sub-tasks via two elaborated complementary task decomposition strategies named
Co-occurrence Graph Partition (CGP) and Dis-occurrence Graph Partition (DGP).
Then, the MLIC models of fewer categories are trained with these sub-tasks in
parallel for respectively learning the joint patterns and the category-specific
patterns of labels. Finally, knowledge distillation is leveraged to learn a
compact global ensemble of full categories with these learned patterns for
reconciling the label correlation exploitation and model overfitting. Extensive
results on MS-COCO and NUS-WIDE datasets demonstrate that our framework can be
easily plugged into many MLIC approaches and improve performances of recent
state-of-the-art approaches. The explainable visual study also further
validates that our method is able to learn both the category-specific and
co-occurring features. The source code is released at
https://github.com/Robbie-Xu/CPSD.
- Abstract(参考訳): マルチラベル画像分類(mlic)アプローチは、通常、ラベル相関を利用して良好な性能を達成する。
しかし、共起のような相関性を強調することは、ターゲット自体の識別的特徴を見落とし、モデルオーバーフィットを招き、性能を損なう可能性がある。
本研究では,MLICモデルの強化を目的としたParallel Self-Distillation (PSD) という汎用フレームワークを提案する。
PSDは、元のMLICタスクを、Co-occurrence Graph Partition (CGP) とDis-occurrence Graph Partition (DGP) という2つの精巧な補完的なタスク分解戦略を介して、より単純なMLICサブタスクに分解する。
次に、これらのサブタスクを用いて、より少ないカテゴリのMLICモデルを並列に訓練し、それぞれがラベルのジョイントパターンとカテゴリ固有のパターンを学習する。
最後に、知識蒸留を利用して、ラベル相関利用とモデル過適合を再現するこれらの学習パターンを用いて、全カテゴリのコンパクトなグローバルアンサンブルを学習する。
MS-COCO と NUS-WIDE データセットの広範な結果は、我々のフレームワークを多くの MLIC アプローチに簡単にプラグインでき、最近の最先端アプローチのパフォーマンスを向上させることができることを示している。
また,本手法がカテゴリー別・共起的特徴の双方を学習可能であることの検証も行った。
ソースコードはhttps://github.com/Robbie-Xu/CPSDで公開されている。
関連論文リスト
- Language Models are Graph Learners [70.14063765424012]
言語モデル(LM)は、グラフニューラルネットワーク(GNN)やグラフトランスフォーマー(GT)など、ドメイン固有のモデルの優位性に挑戦している。
本稿では,ノード分類タスクにおける最先端のGNNに匹敵する性能を実現するために,既製のLMを有効活用する手法を提案する。
論文 参考訳(メタデータ) (2024-10-03T08:27:54Z) - Investigating Self-Supervised Methods for Label-Efficient Learning [27.029542823306866]
低撮影能力のためのコントラスト学習、クラスタリング、マスク付き画像モデリングなど、さまざまな自己教師付きプレテキストタスクについて検討する。
マスク画像モデリングとクラスタリングの両方をプリテキストタスクとして含むフレームワークを導入する。
実規模データセット上でモデルをテストした場合,マルチクラス分類,マルチラベル分類,セマンティックセマンティックセグメンテーションにおける性能向上を示す。
論文 参考訳(メタデータ) (2024-06-25T10:56:03Z) - Improving Multi-label Recognition using Class Co-Occurrence Probabilities [7.062238472483738]
マルチラベル認識(MLR)は、画像内の複数のオブジェクトを識別する。
最近の研究は、タスクのための大規模なテキスト画像データセットに基づいて訓練された視覚言語モデル(VLM)からの情報を活用している。
オブジェクトペアの共起情報を組み込んだ独立分類器の拡張フレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-24T20:33:25Z) - Explore In-Context Segmentation via Latent Diffusion Models [132.26274147026854]
潜在拡散モデル(LDM)は、文脈内セグメンテーションに有効な最小限のモデルである。
画像とビデオの両方のデータセットを含む、新しい、公正なコンテキスト内セグメンテーションベンチマークを構築します。
論文 参考訳(メタデータ) (2024-03-14T17:52:31Z) - CARAT: Contrastive Feature Reconstruction and Aggregation for
Multi-Modal Multi-Label Emotion Recognition [18.75994345925282]
マルチモーダルマルチラベル感情認識(MMER)は、複数のモーダルから関連する感情を識別することを目的としている。
MMERの課題は、異種データから複数のラベルの識別機能を効果的に取得する方法である。
本稿では,MMERタスクのためのContrAstive Feature Restruction and AggregaTion(CARAT)を提案する。
論文 参考訳(メタデータ) (2023-12-15T20:58:05Z) - Class-level Structural Relation Modelling and Smoothing for Visual
Representation Learning [12.247343963572732]
本稿では、視覚表現学習のためのbfクラスレベルの構造関係モデリングと平滑化というフレームワークを提案する。
クラスレベルの関係モデリング、クラス対応グラフガイドサンプリング、グラフガイド表現学習モジュールが含まれる。
実験では、構造化知識モデリングによる表現学習の有効性を実証し、CSRMSを任意の最先端の視覚的表現学習モデルに組み込むことにより、パフォーマンス向上を図っている。
論文 参考訳(メタデータ) (2023-08-08T09:03:46Z) - Hybrid Relation Guided Set Matching for Few-shot Action Recognition [51.3308583226322]
本稿では,2つの鍵成分を組み込んだHybrid Relation Guided Set Matching (HyRSM) 手法を提案する。
ハイブリッドリレーションモジュールの目的は、エピソード内の関連関係とクロスビデオの完全活用により、タスク固有の埋め込みを学習することである。
我々は,HyRSMを6つの挑戦的ベンチマークで評価した。
論文 参考訳(メタデータ) (2022-04-28T11:43:41Z) - Semantic Representation and Dependency Learning for Multi-Label Image
Recognition [76.52120002993728]
本稿では,各カテゴリのカテゴリ固有のセマンティック表現を学習するための,新しい,効果的なセマンティック表現と依存性学習(SRDL)フレームワークを提案する。
具体的には,カテゴリー別注意領域(CAR)モジュールを設計し,チャネル/空間的注意行列を生成してモデルを導出する。
また、カテゴリ間のセマンティック依存を暗黙的に学習するオブジェクト消去(OE)モジュールを設計し、セマンティック認識領域を消去する。
論文 参考訳(メタデータ) (2022-04-08T00:55:15Z) - AGCN: Augmented Graph Convolutional Network for Lifelong Multi-label
Image Recognition [8.06616666179388]
Lifelong Multi-Label (LML)画像認識は、シーケンシャルなマルチラベル画像認識データストリームにオンラインのクラスインクリメンタル分類器を構築する。
LML画像認識の鍵となる課題は、学習データの部分ラベルと古いクラスにおける破滅的蓄積に関するラベル関係の構築である。
逐次認識タスク間でラベル関係を構築することができる拡張グラフ畳み込みネットワーク(AGCN)モデルを提案する。
論文 参考訳(メタデータ) (2022-03-10T18:37:56Z) - Deep Relational Metric Learning [84.95793654872399]
本稿では,画像クラスタリングと検索のためのディープリレーショナルメトリック学習フレームワークを提案する。
我々は、クラス間分布とクラス内分布の両方をモデル化するために、異なる側面から画像を特徴付ける特徴のアンサンブルを学ぶ。
広く使われているCUB-200-2011、Cars196、Stanford Online Productsデータセットの実験は、我々のフレームワークが既存の深層学習方法を改善し、非常に競争力のある結果をもたらすことを示した。
論文 参考訳(メタデータ) (2021-08-23T09:31:18Z) - MetaDistiller: Network Self-Boosting via Meta-Learned Top-Down
Distillation [153.56211546576978]
本研究では,ラベル生成器を用いて高い適合性を有するソフトターゲットを生成することを提案する。
このラベルジェネレータを最適化するためにメタ学習技術を用いることができる。
実験は CIFAR-100 と ILSVRC2012 の2つの標準分類ベンチマークで実施された。
論文 参考訳(メタデータ) (2020-08-27T13:04:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。