論文の概要: Unsupervised Multi-label Dataset Generation from Web Data
- arxiv url: http://arxiv.org/abs/2005.05623v1
- Date: Tue, 12 May 2020 08:57:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-03 19:18:07.967896
- Title: Unsupervised Multi-label Dataset Generation from Web Data
- Title(参考訳): Webデータからの教師なしマルチラベルデータセット生成
- Authors: Carlos Roig, David Varas, Issey Masuda, Juan Carlos Riveiro, Elisenda
Bou-Balust
- Abstract要約: 本稿では,Webデータからマルチラベルデータセットを教師なしで生成するシステムを提案する。
シングルラベルデータセットの生成は、教師なしノイズ低減フェーズ(アンカーを使用したクラスタのクラスタリングと選択)を使用して、正しくラベル付けされた画像の85%を取得する。
次に、クラスアクティベーションマップと各クラスに関連する不確実性を用いて、データセット内の画像に新しいラベルを割り当てる、教師なしラベル拡張処理を実行する。
- 参考スコア(独自算出の注目度): 2.267916014951237
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents a system towards the generation of multi-label datasets
from web data in an unsupervised manner. To achieve this objective, this work
comprises two main contributions, namely: a) the generation of a low-noise
unsupervised single-label dataset from web-data, and b) the augmentation of
labels in such dataset (from single label to multi label). The generation of a
single-label dataset uses an unsupervised noise reduction phase (clustering and
selection of clusters using anchors) obtaining a 85% of correctly labeled
images. An unsupervised label augmentation process is then performed to assign
new labels to the images in the dataset using the class activation maps and the
uncertainty associated with each class. This process is applied to the dataset
generated in this paper and a public dataset (Places365) achieving a 9.5% and
27% of extra labels in each dataset respectively, therefore demonstrating that
the presented system can robustly enrich the initial dataset.
- Abstract(参考訳): 本稿では,Webデータからマルチラベルデータセットを教師なしで生成するシステムを提案する。
この目的を達成するために、この作品には2つの主な貢献がある。
a) Webデータから低ノイズで教師なしの単一ラベルデータセットの生成
b) このようなデータセットにおけるラベルの増大(シングルラベルからマルチラベルまで)
シングルラベルデータセットの生成は、教師なしノイズ低減フェーズ(アンカーを使用したクラスタのクラスタリングと選択)を使用して、正しくラベル付けされた画像の85%を取得する。
次に、クラスアクティベーションマップと各クラスに関連する不確実性を用いて、データセット内の画像に新しいラベルを割り当てる、教師なしラベル拡張処理を実行する。
本論文で作成したデータセットと、各データセットにそれぞれ9.5%と27%のラベルを付加したパブリックデータセット(places365)に適用することにより、提案するシステムが初期データセットを堅牢に強化できることを実証する。
関連論文リスト
- Generalized Category Discovery with Clustering Assignment Consistency [56.92546133591019]
一般化圏発見(GCD)は、最近提案されたオープンワールドタスクである。
クラスタリングの一貫性を促進するための協調学習ベースのフレームワークを提案する。
提案手法は,3つの総合的なベンチマークと3つのきめ細かい視覚認識データセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-10-30T00:32:47Z) - TransPOS: Transformers for Consolidating Different POS Tagset Datasets [0.8399688944263843]
本稿では、異なるタグ付け方式の下で、POSタグをラベル付けする2つのデータセットについて考察する。
完全に結合しない2つのデータセットを統合する問題に対処するため,Transformerを用いた新しい教師付きアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-09-24T08:43:53Z) - OSSGAN: Open-Set Semi-Supervised Image Generation [26.67298827670573]
我々は、オープンセット半教師付き画像生成と呼ばれる条件付きGANの挑戦的なトレーニング手法を導入する。
OSSGANは、未ラベルの画像が関心のクラスのうちの1つまたは2つに属しているかどうかに基づいて、差別者に決定の手がかりを提供する。
Tiny ImageNetとImageNetの実験結果は、教師付きBigGANおよび半教師付きメソッドよりも顕著に改善されている。
論文 参考訳(メタデータ) (2022-04-29T17:26:09Z) - Learning Semantic Segmentation from Multiple Datasets with Label Shifts [101.24334184653355]
本論文では,ラベル空間が異なる複数のデータセットを対象としたモデルの自動学習手法であるUniSegを提案する。
具体的には,ラベルの相反と共起を考慮に入れた2つの損失を提案する。
論文 参考訳(メタデータ) (2022-02-28T18:55:19Z) - GuidedMix-Net: Semi-supervised Semantic Segmentation by Using Labeled
Images as Reference [90.5402652758316]
半教師付きセマンティックセマンティックセグメンテーションのための新しい手法である GuidedMix-Net を提案する。
ラベル付き情報を使用して、ラベルなしのインスタンスの学習をガイドする。
競合セグメンテーションの精度を達成し、mIoUを以前のアプローチに比べて+7$%大きく改善する。
論文 参考訳(メタデータ) (2021-12-28T06:48:03Z) - GuidedMix-Net: Learning to Improve Pseudo Masks Using Labeled Images as
Reference [153.354332374204]
半教師付きセマンティックセマンティックセグメンテーションのための新しい手法である GuidedMix-Net を提案する。
まず、ラベル付きデータとラベルなしデータの間に特徴アライメントの目的を導入し、類似した画像対をキャプチャする。
MITransは、ラベルなしデータのさらなるプログレッシブな精細化のための強力な知識モジュールであることが示されている。
ラベル付きデータに対する教師付き学習とともに、ラベル付きデータの予測が生成した擬似マスクとともに学習される。
論文 参考訳(メタデータ) (2021-06-29T02:48:45Z) - Adversarial Knowledge Transfer from Unlabeled Data [62.97253639100014]
本稿では,インターネット規模の未ラベルデータから知識を伝達し,分類器の性能を向上させるための新しいAdversarial Knowledge Transferフレームワークを提案する。
我々の手法の重要な新しい側面は、ラベル付けされていないソースデータは、ラベル付けされたターゲットデータと異なるクラスであることができ、個別のプリテキストタスクを定義する必要がないことである。
論文 参考訳(メタデータ) (2020-08-13T08:04:27Z) - openXDATA: A Tool for Multi-Target Data Generation and Missing Label
Completion [23.14045574165086]
機械学習の一般的な問題は、不整合ラベル空間と欠落ラベルを持つデータセットを扱うことである。
本研究では,一部ラベル付きあるいは非ラベル付きデータセットで不足ラベルを補完するopenXdataツールを紹介する。
根拠となる真理値に近づいたレートで、すべてのデータセットに対してカテゴリと連続ラベルの両方を推定する能力を示す。
論文 参考訳(メタデータ) (2020-07-27T22:05:53Z) - Multi-Level Generative Models for Partial Label Learning with Non-random
Label Noise [47.01917619550429]
部分ラベル学習のための新しい多段階生成モデル(MGPLL)を提案する。
ラベルレベルの逆生成器と特徴レベルの逆生成器の両方を双方向マッピングフレームワークで学習する。
提案手法は,部分ラベル学習における最先端性能を示す。
論文 参考訳(メタデータ) (2020-05-11T20:13:19Z) - Automatically Discovering and Learning New Visual Categories with
Ranking Statistics [145.89790963544314]
我々は,他のクラスをラベル付けした画像コレクションにおいて,新しいクラスを発見する問題に対処する。
汎用クラスタリングモデルを学び、後者を用いて、非競合データ中の新しいクラスを識別する。
我々は,標準分類ベンチマークに対するアプローチと,新しいカテゴリー発見法の性能を,有意なマージンで評価した。
論文 参考訳(メタデータ) (2020-02-13T18:53:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。