論文の概要: A Label Propagation Strategy for CutMix in Multi-Label Remote Sensing Image Classification
- arxiv url: http://arxiv.org/abs/2405.13451v1
- Date: Wed, 22 May 2024 08:45:03 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-25 00:55:07.016801
- Title: A Label Propagation Strategy for CutMix in Multi-Label Remote Sensing Image Classification
- Title(参考訳): マルチラベルリモートセンシング画像分類におけるカットミクスのラベル伝搬戦略
- Authors: Tom Burgert, Tim Siebert, Kai Norman Clasen, Begüm Demir,
- Abstract要約: 我々は、ラベルノイズの影響を受けずに、RSのLC問題にCutMixを効果的に適用できる戦略を導入する。
提案するLP戦略は,画素レベルの位置情報を利用して,拡張トレーニング画像の複数ラベルを更新する。
- 参考スコア(独自算出の注目度): 2.4949076090402724
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The development of supervised deep learning-based methods for multi-label scene classification (MLC) is one of the prominent research directions in remote sensing (RS). Yet, collecting annotations for large RS image archives is time-consuming and costly. To address this issue, several data augmentation methods have been introduced in RS. Among others, the data augmentation technique CutMix, which combines parts of two existing training images to generate an augmented image, stands out as a particularly effective approach. However, the direct application of CutMix in RS MLC can lead to the erasure or addition of class labels (i.e., label noise) in the augmented (i.e., combined) training image. To address this problem, we introduce a label propagation (LP) strategy that allows the effective application of CutMix in the context of MLC problems in RS without being affected by label noise. To this end, our proposed LP strategy exploits pixel-level class positional information to update the multi-label of the augmented training image. We propose to access such class positional information from reference maps associated to each training image (e.g., thematic products) or from class explanation masks provided by an explanation method if no reference maps are available. Similarly to pairing two training images, our LP strategy carries out a pairing operation on the associated pixel-level class positional information to derive the updated multi-label for the augmented image. Experimental results show the effectiveness of our LP strategy in general and its robustness in the case of various simulated and real scenarios with noisy class positional information in particular.
- Abstract(参考訳): マルチラベルシーン分類(MLC)のための教師付き深層学習手法の開発は、リモートセンシング(RS)における顕著な研究方向の1つである。
しかし、大規模なRS画像アーカイブのためのアノテーションの収集には時間と費用がかかる。
この問題に対処するため、RSにいくつかのデータ拡張手法が導入されている。
中でも、既存の2つのトレーニング画像の一部を組み合わせて強化画像を生成する、データ拡張技術であるCutMixは、特に効果的なアプローチとして際立っている。
しかし、RS MLCにおけるCutMixの直接適用は、拡張訓練画像におけるクラスラベル(ラベルノイズ)の消去や追加につながる可能性がある。
この問題に対処するために,ラベルノイズの影響を受けずに,RSのLC問題にCutMixを効果的に適用するラベル伝搬(LP)戦略を導入する。
この目的のために,提案するLPストラテジーでは,画素レベルのクラス位置情報を活用して,拡張トレーニング画像のマルチラベルを更新する。
本稿では,各トレーニングイメージ(テーマ製品など)に関連する参照マップや,参照マップが存在しない場合の説明方法によって提供されるクラス説明マスクから,そのようなクラス位置情報にアクセスすることを提案する。
2つのトレーニング画像のペアリングと同様に、我々のLP戦略は、拡張画像の更新されたマルチラベルを導出するために、関連するピクセルレベルのクラス位置情報をペアリングする操作を行う。
実験結果から,特にノイズのあるクラス位置情報を持つ各種シナリオにおけるLP戦略の有効性と,その堅牢性が確認された。
関連論文リスト
- Multi-Label Self-Supervised Learning with Scene Images [21.549234013998255]
本稿では,シーン/マルチラベル画像SSLを多ラベル分類問題として扱うことで,画質の表現を学習可能であることを示す。
提案手法はMulti-Label Self-supervised Learning (MLS) と呼ばれる。
論文 参考訳(メタデータ) (2023-08-07T04:04:22Z) - CSP: Self-Supervised Contrastive Spatial Pre-Training for
Geospatial-Visual Representations [90.50864830038202]
ジオタグ付き画像の自己教師型学習フレームワークであるContrastive Spatial Pre-Training(CSP)を提案する。
デュアルエンコーダを用いて画像とその対応する位置情報を別々に符号化し、コントラスト目的を用いて画像から効果的な位置表現を学習する。
CSPは、様々なラベル付きトレーニングデータサンプリング比と10~34%の相対的な改善で、モデル性能を大幅に向上させる。
論文 参考訳(メタデータ) (2023-05-01T23:11:18Z) - On the Effects of Different Types of Label Noise in Multi-Label Remote
Sensing Image Classification [1.6758573326215689]
リモートセンシング(RS)画像のマルチラベル分類(MLC)のための高精度な手法の開発は、RSにおいて最も重要な研究トピックの1つである。
複数のランドカバークラスラベル (multi-labels) でアノテートされた多数の信頼できるトレーニングイメージを必要とするディープニューラルネットワークの使用は、RSで人気がある。
本稿では,3つの異なる雑音頑健なCV SLC法について検討し,RSのマルチラベル雑音シナリオに対して頑健であるように適応する。
論文 参考訳(メタデータ) (2022-07-28T09:38:30Z) - Dual-Perspective Semantic-Aware Representation Blending for Multi-Label
Image Recognition with Partial Labels [70.36722026729859]
本稿では,多粒度カテゴリ固有の意味表現を異なる画像にブレンドした,二重パースペクティブな意味認識表現ブレンディング(DSRB)を提案する。
提案したDSは、すべての比率ラベル設定において、最先端のアルゴリズムを一貫して上回っている。
論文 参考訳(メタデータ) (2022-05-26T00:33:44Z) - Heterogeneous Semantic Transfer for Multi-label Recognition with Partial Labels [70.45813147115126]
部分ラベル付きマルチラベル画像認識(MLR-PL)は、アノテーションのコストを大幅に削減し、大規模なMLRを促進する。
それぞれの画像と異なる画像の間に強い意味的相関が存在することがわかった。
これらの相関関係は、未知のラベルを取得するために、既知のラベルが持つ知識を転送するのに役立ちます。
論文 参考訳(メタデータ) (2022-05-23T08:37:38Z) - Semantic-Aware Representation Blending for Multi-Label Image Recognition
with Partial Labels [86.17081952197788]
そこで我々は,未知のラベルを補うために,異なる画像にカテゴリ固有の表現をブレンドして,既知のラベルの情報を伝達することを提案する。
MS-COCO、Visual Genome、Pascal VOC 2007データセットの実験は、提案されたSARBフレームワークが、現在の主要な競合相手よりも優れたパフォーマンスを得ることを示している。
論文 参考訳(メタデータ) (2022-03-04T07:56:16Z) - CCML: A Novel Collaborative Learning Model for Classification of Remote
Sensing Images with Noisy Multi-Labels [0.9995347522610671]
CNNモデルのトレーニングフェーズにおけるマルチラベルノイズの悪影響を軽減するために,CCML(Consensual Collaborative Multi-Label Learning)法を提案する。
CCMLは、4つのメインモジュールに基づいてRS画像の騒々しいマルチラベルを特定し、ランク付けし、修正します。
論文 参考訳(メタデータ) (2020-12-19T15:42:24Z) - Deep Active Learning for Joint Classification & Segmentation with Weak
Annotator [22.271760669551817]
クラスアクティベーションマップ(CAM)のようなCNNの可視化と解釈手法は、一般的に、クラス予測に関連する画像領域を強調するために使用される。
本稿では,画素レベルのアノテーションを段階的に統合する能動的学習フレームワークを提案する。
提案手法は, ランダムなサンプル選択を用いることで, 最先端のCAMやAL手法よりも優れた性能を示すことを示す。
論文 参考訳(メタデータ) (2020-10-10T03:25:54Z) - Attention-Aware Noisy Label Learning for Image Classification [97.26664962498887]
大規模ラベル付きサンプルで学習した深層畳み込みニューラルネットワーク(CNN)は、コンピュータビジョンにおいて顕著な進歩を遂げている。
大量のラベル付きビジュアルデータを取得する最も安価な方法は、Flickrのようなユーザーが提供するラベルでウェブサイトからクロールすることである。
本稿では,潜在的なラベルノイズのあるデータセットに基づいて学習したネットワークの識別能力を向上させるために,注目に敏感なラベル学習手法を提案する。
論文 参考訳(メタデータ) (2020-09-30T15:45:36Z) - Knowledge-Guided Multi-Label Few-Shot Learning for General Image
Recognition [75.44233392355711]
KGGRフレームワークは、ディープニューラルネットワークと統計ラベル相関の事前知識を利用する。
まず、統計ラベルの共起に基づいて異なるラベルを相関させる構造化知識グラフを構築する。
次に、ラベルセマンティクスを導入し、学習セマンティクス固有の特徴をガイドする。
グラフノードの相互作用を探索するためにグラフ伝搬ネットワークを利用する。
論文 参考訳(メタデータ) (2020-09-20T15:05:29Z) - Learning to Segment from Scribbles using Multi-scale Adversarial
Attention Gates [16.28285034098361]
弱い教師付き学習は、スクリブルのような弱いアノテーション形式に依存してモデルを訓練することができる。
我々は、複数の解像度でリアルなセグメンテーションマスクを生成するために、マルチスケールのGANをトレーニングし、スクリブルを使用して画像中の正しい位置を学習する。
モデルの成功の中心は、敵の信号が先行した形状として振る舞うことを条件とした、新しいアテンションゲーティング機構である。
論文 参考訳(メタデータ) (2020-07-02T14:39:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。