論文の概要: G2NetPL: Generic Game-Theoretic Network for Partial-Label Image
Classification
- arxiv url: http://arxiv.org/abs/2210.11469v1
- Date: Thu, 20 Oct 2022 17:59:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-21 15:16:19.838974
- Title: G2NetPL: Generic Game-Theoretic Network for Partial-Label Image
Classification
- Title(参考訳): G2NetPL:部分ラベル画像分類のためのジェネリックゲーム理論ネットワーク
- Authors: Rabab Abdelfattah, Xin Zhang, Mostafa M. Fouda, Xiaofeng Wang, Song
Wang
- Abstract要約: マルチラベル画像分類は、画像内の全ての可能なラベルを予測することを目的としている。
既存の部分ラベル学習の研究は、各トレーニングイメージが正負のラベルのサブセットでラベル付けされている場合に焦点を当てている。
本稿では、部分ラベル学習のためのエンドツーエンドのジェネリックゲーム理論ネットワーク(G2NetPL)を提案する。
- 参考スコア(独自算出の注目度): 14.82038002764209
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-label image classification aims to predict all possible labels in an
image. It is usually formulated as a partial-label learning problem, since it
could be expensive in practice to annotate all the labels in every training
image. Existing works on partial-label learning focus on the case where each
training image is labeled with only a subset of its positive/negative labels.
To effectively address partial-label classification, this paper proposes an
end-to-end Generic Game-theoretic Network (G2NetPL) for partial-label learning,
which can be applied to most partial-label settings, including a very
challenging, but annotation-efficient case where only a subset of the training
images are labeled, each with only one positive label, while the rest of the
training images remain unlabeled. In G2NetPL, each unobserved label is
associated with a soft pseudo label, which, together with the network,
formulates a two-player non-zero-sum non-cooperative game. The objective of the
network is to minimize the loss function with given pseudo labels, while the
pseudo labels will seek convergence to 1 (positive) or 0 (negative) with a
penalty of deviating from the predicted labels determined by the network. In
addition, we introduce a confidence-aware scheduler into the loss of the
network to adaptively perform easy-to-hard learning for different labels.
Extensive experiments demonstrate that our proposed G2NetPL outperforms many
state-of-the-art multi-label classification methods under various partial-label
settings on three different datasets.
- Abstract(参考訳): マルチラベル画像分類は、画像内の全ての可能なラベルを予測することを目的としている。
訓練画像の全てのラベルに注釈を付けるのにコストがかかるため、通常は部分ラベル学習問題として定式化される。
既存の学習は、各トレーニングイメージが正負のラベルのサブセットでラベル付けされている場合に焦点を当てている。
本稿では,部分ラベル分類を効果的に扱うために,訓練画像のサブセットのみをラベル付けし,一方に正のラベルのみを付け,他方にラベルを付けない部分ラベル学習のためのエンド・ツー・エンド汎用ゲーム理論ネットワーク(g2netpl)を提案する。
G2NetPLでは、各未観測ラベルはソフトな擬似ラベルに関連付けられ、ネットワークとともに2人のプレイヤ非ゼロサム非協調ゲームが定式化される。
ネットワークの目的は、与えられた擬似ラベルによる損失関数を最小化することであり、擬似ラベルは、ネットワークによって決定された予測ラベルから逸脱するペナルティを持つ1(正)または0(負)への収束を求める。
さらに,ネットワークの喪失に対して信頼性を考慮したスケジューラを導入し,異なるラベルに対して適応的に学習を行う。
実験の結果,提案したG2NetPLは,3つの異なるデータセットの様々な部分ラベル設定の下で,最先端の多ラベル分類法よりも優れていた。
関連論文リスト
- NP$^2$L: Negative Pseudo Partial Labels Extraction for Graph Neural
Networks [48.39834063008816]
擬似ラベルはグラフニューラルネットワーク(GNN)で使われ、メッセージパッシングレベルでの学習を支援する。
本稿では,GNNにおいて擬似ラベルを使用する新しい手法を提案する。
本手法は,部分ラベルの重なりが無く,負のノード対関係として定義される場合,より正確であることを示す。
論文 参考訳(メタデータ) (2023-10-02T11:13:59Z) - Distilling Self-Supervised Vision Transformers for Weakly-Supervised
Few-Shot Classification & Segmentation [58.03255076119459]
視覚変換器(ViT)を利用した弱教師付き小ショット画像分類とセグメンテーションの課題に対処する。
提案手法は,自己監督型ViTからトークン表現を抽出し,その相関関係を利用して分類とセグメンテーションの予測を行う。
Pascal-5iとCOCO-20iの実験は、様々な監視設定において大きなパフォーマンス向上を示した。
論文 参考訳(メタデータ) (2023-07-07T06:16:43Z) - Pseudo Labels for Single Positive Multi-Label Learning [0.0]
単一正のマルチラベル学習(SPML)はコスト効率の良いソリューションであり、モデルがイメージ毎にひとつの正のラベルでトレーニングされる。
本研究では,1つの正のデータを完全なラベル付きデータに変換する手法を提案する。
論文 参考訳(メタデータ) (2023-06-01T17:21:42Z) - Bridging the Gap between Model Explanations in Partially Annotated
Multi-label Classification [85.76130799062379]
偽陰性ラベルがモデルの説明にどのように影響するかを考察する。
本稿では,部分ラベルで学習したモデルの属性スコアを向上し,その説明をフルラベルで学習したモデルと類似させる。
論文 参考訳(メタデータ) (2023-04-04T14:00:59Z) - Label Structure Preserving Contrastive Embedding for Multi-Label
Learning with Missing Labels [30.79809627981242]
欠落ラベルを識別するためのラベル補正機構を導入し、欠落ラベル(CLML)を用いた多ラベル画像分類において、ユニークなコントラスト損失を定義する。
既存のマルチラベルCLの損失とは異なり、CLMLは潜在表現空間における低ランクなグローバルおよびローカルなラベル依存性も保持する。
提案した戦略は、3つの標準データセットでそれぞれ1.2%、1.6%、および1.3%のマージンでResnet101モデルの分類性能を改善することが示されている。
論文 参考訳(メタデータ) (2022-09-03T02:44:07Z) - PLMCL: Partial-Label Momentum Curriculum Learning for Multi-Label Image
Classification [25.451065364433028]
マルチラベル画像分類は、画像内の全ての可能なラベルを予測することを目的としている。
既存の部分ラベル学習の研究は、各トレーニングイメージがラベルのサブセットでアノテートされている場合に焦点を当てている。
本稿では,トレーニング画像のサブセットのみをラベル付けした新たな部分ラベル設定を提案する。
論文 参考訳(メタデータ) (2022-08-22T01:23:08Z) - Acknowledging the Unknown for Multi-label Learning with Single Positive
Labels [65.5889334964149]
伝統的に、全ての無注釈ラベルは、単一正のマルチラベル学習(SPML)において負のラベルとして仮定される。
本研究では, 予測確率のエントロピーを最大化するエントロピー最大化(EM)損失を提案する。
非通知ラベルの正負ラベル不均衡を考慮し、非対称耐性戦略とより精密な監視を行うセルフペースト手順を備えた非対称擬似ラベル(APL)を提案する。
論文 参考訳(メタデータ) (2022-03-30T11:43:59Z) - Structured Semantic Transfer for Multi-Label Recognition with Partial
Labels [85.6967666661044]
部分ラベル付きマルチラベル認識モデルのトレーニングを可能にする構造化意味伝達(SST)フレームワークを提案する。
このフレームワークは2つの相補的なトランスファーモジュールから構成され、インテリアイメージとクロスイメージセマンティック相関を探索する。
Microsoft COCO、Visual Genome、Pascal VOCデータセットの実験は、提案されたSSTフレームワークが現在の最先端アルゴリズムよりも優れたパフォーマンスが得られることを示している。
論文 参考訳(メタデータ) (2021-12-21T02:15:01Z) - Mixed Supervision Learning for Whole Slide Image Classification [88.31842052998319]
超高解像度画像のための混合監視学習フレームワークを提案する。
パッチトレーニングの段階では、このフレームワークは、粗いイメージレベルのラベルを使用して、自己教師付き学習を洗練することができる。
画素レベルの偽陽性と偽陰性を抑制するための包括的な戦略が提案されている。
論文 参考訳(メタデータ) (2021-07-02T09:46:06Z) - Multi-Label Learning from Single Positive Labels [37.17676289125165]
与えられた画像に対して適用可能なラベルを全て予測することは、マルチラベル分類(multi-label classification)として知られている。
その結果,ラベルの確認が著しく少ないにもかかわらず,完全ラベル付き分類器の性能にアプローチできることが示唆された。
論文 参考訳(メタデータ) (2021-06-17T17:58:04Z) - Re-labeling ImageNet: from Single to Multi-Labels, from Global to
Localized Labels [34.13899937264952]
ImageNetは間違いなく最も人気のある画像分類ベンチマークですが、ラベルノイズのかなりのレベルを持つものでもあります。
近年の研究では、シングルラベルベンチマークと仮定されているにもかかわらず、多くのサンプルが複数のクラスを含んでいることが示されている。
私たちは、単一ラベルアノテーションと効果的に複数のラベル画像の間のミスマッチは、ランダムな作物が適用されるトレーニングセットアップにおいて同様に問題であると主張しています。
論文 参考訳(メタデータ) (2021-01-13T11:55:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。