論文の概要: SCIDA: Self-Correction Integrated Domain Adaptation from Single- to
Multi-label Aerial Images
- arxiv url: http://arxiv.org/abs/2108.06810v1
- Date: Sun, 15 Aug 2021 20:38:02 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-17 15:07:07.228103
- Title: SCIDA: Self-Correction Integrated Domain Adaptation from Single- to
Multi-label Aerial Images
- Title(参考訳): SCIDA: 単一-多ラベル空中画像からの自己補正統合ドメイン適応
- Authors: Tianze Yu, Jianzhe Lin, Lichao Mou, Yuansheng Hua, Xiaoxiang Zhu and
Z. Jane Wang
- Abstract要約: 画像分類のためのほとんどの公開データセットは単一のラベルでできており、画像は本質的に日々の生活の中でマルチラベル化されている。
自動多言語学習のための新しい統合ドメイン適応法(SCIDA)を提案する。
SCIDAは、大規模で公開可能なシングルラベル画像から、マルチラベル画像分類モデルを自動的に学習する弱い教師付きである。
- 参考スコア(独自算出の注目度): 30.12949142271464
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Most publicly available datasets for image classification are with single
labels, while images are inherently multi-labeled in our daily life. Such an
annotation gap makes many pre-trained single-label classification models fail
in practical scenarios. This annotation issue is more concerned for aerial
images: Aerial data collected from sensors naturally cover a relatively large
land area with multiple labels, while annotated aerial datasets, which are
publicly available (e.g., UCM, AID), are single-labeled. As manually annotating
multi-label aerial images would be time/labor-consuming, we propose a novel
self-correction integrated domain adaptation (SCIDA) method for automatic
multi-label learning. SCIDA is weakly supervised, i.e., automatically learning
the multi-label image classification model from using massive, publicly
available single-label images. To achieve this goal, we propose a novel
Label-Wise self-Correction (LWC) module to better explore underlying label
correlations. This module also makes the unsupervised domain adaptation (UDA)
from single- to multi-label data possible. For model training, the proposed
model only uses single-label information yet requires no prior knowledge of
multi-labeled data; and it predicts labels for multi-label aerial images. In
our experiments, trained with single-labeled MAI-AID-s and MAI-UCM-s datasets,
the proposed model is tested directly on our collected Multi-scene Aerial Image
(MAI) dataset.
- Abstract(参考訳): 画像分類のためのほとんどの公開データセットは単一のラベルでできており、画像は本質的に私たちの日常生活でマルチラベル化されている。
このようなアノテーションギャップは、訓練済みのシングルラベル分類モデルの多くを現実的なシナリオでフェールさせる。
センサーから収集された空中データは、複数のラベルを持つ比較的大きな土地を自然にカバーし、注釈付き空中データセットは、一般に公開されている(UCM、AIDなど)。
マルチラベル画像に手動でアノテートすることは時間/ラベル消費であるので,自動マルチラベル学習のための新しい自己修正統合ドメイン適応 (scida) 法を提案する。
SCIDAは、大規模で公開可能なシングルラベル画像から、マルチラベル画像分類モデルを自動的に学習する弱い教師付きである。
この目的を達成するために,ラベル相関をよりよく研究するための新しいラベル・ワイズ自己補正(LWC)モジュールを提案する。
このモジュールは、シングルからマルチラベルデータへの教師なしドメイン適応(uda)も可能にする。
モデルトレーニングにおいて,提案モデルは単一ラベル情報のみを使用するが,複数ラベルデータの事前知識は必要とせず,多ラベル空中画像のラベルを予測する。
単ラベルMAI-AID-sおよびMAI-UCM-sデータセットを用いて学習した実験では,本モデルが収集したMAI(Multi-scene Aerial Image)データセット上で直接テストされる。
関連論文リスト
- INSITE: labelling medical images using submodular functions and
semi-supervised data programming [19.88996560236578]
ディープモデルをトレーニングするための大量のラベル付きデータが、リソース制約された設定の実装ボトルネックを生み出します。
情報サブセット選択を適用し、多数の非競合データから、少数の代表画像や多種多様な画像を識別する。
新たにアノテートされた画像は、いくつかのデータプログラミング駆動ラベリング機能を開発するための例示として使用される。
論文 参考訳(メタデータ) (2024-02-11T12:02:00Z) - Vision-Language Pseudo-Labels for Single-Positive Multi-Label Learning [11.489541220229798]
一般的なマルチラベル学習では、モデルは単一の入力画像に対して複数のラベルやカテゴリを予測することを学習する。
これは、タスクがイメージの多くの可能なラベルから単一のラベルを予測している、標準的なマルチクラスイメージ分類とは対照的である。
論文 参考訳(メタデータ) (2023-10-24T16:36:51Z) - Pseudo Labels for Single Positive Multi-Label Learning [0.0]
単一正のマルチラベル学習(SPML)はコスト効率の良いソリューションであり、モデルがイメージ毎にひとつの正のラベルでトレーニングされる。
本研究では,1つの正のデータを完全なラベル付きデータに変換する手法を提案する。
論文 参考訳(メタデータ) (2023-06-01T17:21:42Z) - Multi-Granularity Denoising and Bidirectional Alignment for Weakly
Supervised Semantic Segmentation [75.32213865436442]
本稿では,雑音ラベルと多クラス一般化問題を緩和するために,MDBAモデルを提案する。
MDBAモデルはPASCAL VOC 2012データセットの検証とテストセットにおいて69.5%と70.2%のmIoUに達することができる。
論文 参考訳(メタデータ) (2023-05-09T03:33:43Z) - Dual-Perspective Semantic-Aware Representation Blending for Multi-Label
Image Recognition with Partial Labels [70.36722026729859]
本稿では,多粒度カテゴリ固有の意味表現を異なる画像にブレンドした,二重パースペクティブな意味認識表現ブレンディング(DSRB)を提案する。
提案したDSは、すべての比率ラベル設定において、最先端のアルゴリズムを一貫して上回っている。
論文 参考訳(メタデータ) (2022-05-26T00:33:44Z) - Semantic-Aware Representation Blending for Multi-Label Image Recognition
with Partial Labels [86.17081952197788]
そこで我々は,未知のラベルを補うために,異なる画像にカテゴリ固有の表現をブレンドして,既知のラベルの情報を伝達することを提案する。
MS-COCO、Visual Genome、Pascal VOC 2007データセットの実験は、提案されたSARBフレームワークが、現在の主要な競合相手よりも優れたパフォーマンスを得ることを示している。
論文 参考訳(メタデータ) (2022-03-04T07:56:16Z) - Structured Semantic Transfer for Multi-Label Recognition with Partial
Labels [85.6967666661044]
部分ラベル付きマルチラベル認識モデルのトレーニングを可能にする構造化意味伝達(SST)フレームワークを提案する。
このフレームワークは2つの相補的なトランスファーモジュールから構成され、インテリアイメージとクロスイメージセマンティック相関を探索する。
Microsoft COCO、Visual Genome、Pascal VOCデータセットの実験は、提案されたSSTフレームワークが現在の最先端アルゴリズムよりも優れたパフォーマンスが得られることを示している。
論文 参考訳(メタデータ) (2021-12-21T02:15:01Z) - Inferring Prototypes for Multi-Label Few-Shot Image Classification with
Word Vector Guided Attention [45.6809084493491]
ML-FSIC (Multi-label few-shot Image Classification) は、画像に記述ラベルを割り当てるタスクである。
本稿では,ラベルの意味に関する事前知識の形式として,単語埋め込みを提案する。
我々のモデルは、モデルパラメータを微調整することなく、未確認ラベルのプロトタイプを推測することができる。
論文 参考訳(メタデータ) (2021-12-02T07:59:11Z) - Semi-Supervised Domain Adaptation with Prototypical Alignment and
Consistency Learning [86.6929930921905]
本稿では,いくつかの対象サンプルがラベル付けされていれば,ドメインシフトに対処するのにどの程度役立つか検討する。
ランドマークの可能性を最大限に追求するために、ランドマークから各クラスのターゲットプロトタイプを計算するプロトタイプアライメント(PA)モジュールを組み込んでいます。
具体的には,ラベル付き画像に深刻な摂動を生じさせ,PAを非自明にし,モデル一般化性を促進する。
論文 参考訳(メタデータ) (2021-04-19T08:46:08Z) - Instance-Aware Graph Convolutional Network for Multi-Label
Classification [55.131166957803345]
グラフ畳み込みニューラルネットワーク(GCN)は、マルチラベル画像認識タスクを効果的に強化した。
マルチラベル分類のための事例対応グラフ畳み込みニューラルネットワーク(IA-GCN)フレームワークを提案する。
論文 参考訳(メタデータ) (2020-08-19T12:49:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。