論文の概要: Scene Clustering Based Pseudo-labeling Strategy for Multi-modal Aerial
View Object Classification
- arxiv url: http://arxiv.org/abs/2205.01920v1
- Date: Wed, 4 May 2022 07:13:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-05 14:24:31.838900
- Title: Scene Clustering Based Pseudo-labeling Strategy for Multi-modal Aerial
View Object Classification
- Title(参考訳): シーンクラスタリングに基づくマルチモーダル航空ビューオブジェクト分類のための擬似ラベル戦略
- Authors: Jun Yu, Hao Chang, Keda Lu, Liwen Zhang, Shenshen Du
- Abstract要約: 微細なデータ、クラス不均衡、および様々な撮影条件は、一般的な画像分類の表現能力を妨げる。
これらの特性を利用して、シーンクラスタリングに基づく擬似ラベル戦略(SCP-Label)を提案する。
SCP-Labelは、同じシーン内のオブジェクトに同じラベルを割り当てることによって、より精度を高める。
- 参考スコア(独自算出の注目度): 22.4510980822444
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-modal aerial view object classification (MAVOC) in Automatic target
recognition (ATR), although an important and challenging problem, has been
under studied. This paper firstly finds that fine-grained data, class imbalance
and various shooting conditions preclude the representational ability of
general image classification. Moreover, the MAVOC dataset has scene aggregation
characteristics. By exploiting these properties, we propose Scene Clustering
Based Pseudo-labeling Strategy (SCP-Label), a simple yet effective method to
employ in post-processing. The SCP-Label brings greater accuracy by assigning
the same label to objects within the same scene while also mitigating bias and
confusion with model ensembles. Its performance surpasses the official baseline
by a large margin of +20.57% Accuracy on Track 1 (SAR), and +31.86% Accuracy on
Track 2 (SAR+EO), demonstrating the potential of SCP-Label as post-processing.
Finally, we win the championship both on Track1 and Track2 in the CVPR 2022
Perception Beyond the Visible Spectrum (PBVS) Workshop MAVOC Challenge. Our
code is available at https://github.com/HowieChangchn/SCP-Label.
- Abstract(参考訳): 自動目標認識(ATR)におけるMAVOC(Multi-modal air view object classification)は,重要かつ困難な問題であるが,研究が進められている。
本稿では,まず,細粒度データ,クラス不均衡,種々の撮影条件が一般画像分類の表現能力を妨げることを見出した。
さらに,MAVOCデータセットはシーン集約特性を有する。
そこで本研究では,これらの特徴を生かして,シーンクラスタリングに基づく擬似ラベル戦略(scp-label)を提案する。
SCP-Labelは、同じラベルを同じシーン内のオブジェクトに割り当てると同時に、バイアスを軽減し、モデルのアンサンブルと混同する。
その性能は、トラック1(SAR)で+20.57%の精度、トラック2(SAR+EO)で+31.86%の精度で公式ベースラインを超え、後処理としてのSCP-Labelの可能性を示している。
最後に,CVPR 2022 Perception Beyond the Visible Spectrum (PBVS) Workshop MAVOC Challengeでトラック1とトラック2で優勝した。
私たちのコードはhttps://github.com/HowieChangchn/SCP-Label.comで利用可能です。
関連論文リスト
- SPECIAL: Zero-shot Hyperspectral Image Classification With CLIP [10.658533866562689]
CLIP(SPECIAL)に基づく新しいゼロショットハイパースペクトル画像分類フレームワークを提案する。
SPECIALフレームワークは,(1)CLIPに基づく擬似ラベル生成と(2)ノイズラベル学習の2段階からなる。
3つのベンチマークデータセットによる実験結果から,SPECIALはゼロショットHSI分類において既存の手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2025-01-27T17:13:03Z) - Label Filling via Mixed Supervision for Medical Image Segmentation from Noisy Annotations [22.910649758574852]
本稿では,LF-Net と呼ばれるシンプルで効果的なラベルフィリングフレームワークを提案する。
トレーニング中にノイズの多いアノテーションのみを付与した、基礎的なセグメンテーションラベルを予測する。
5つのデータセットの結果から、LF-Netは最先端の手法と比較して、すべてのデータセットのセグメンテーション精度を向上することが示された。
論文 参考訳(メタデータ) (2024-10-21T14:36:36Z) - Weakly Supervised Semantic Segmentation for Driving Scenes [27.0285166404621]
弱教師付きセマンティックセグメンテーション(WSSS)における最先端技術は、駆動シーンデータセットに深刻な性能劣化を示す。
シーンデータセットの駆動に適した新しいWSSSフレームワークを開発した。
論文 参考訳(メタデータ) (2023-12-21T08:16:26Z) - TagCLIP: A Local-to-Global Framework to Enhance Open-Vocabulary
Multi-Label Classification of CLIP Without Training [29.431698321195814]
Contrastive Language-Image Pre-Training (CLIP) はオープン語彙分類において顕著な能力を示した。
CLIPは、グローバル機能が最も顕著なクラスに支配される傾向があるため、マルチラベルデータセットのパフォーマンスが低い。
画像タグを得るための局所言語フレームワークを提案する。
論文 参考訳(メタデータ) (2023-12-20T08:15:40Z) - Pseudo-label Alignment for Semi-supervised Instance Segmentation [67.9616087910363]
擬似ラベルは半教師付きインスタンスセグメンテーションにおいて重要である。
既存のパイプラインでは、クラスやマスクの品質のミスマッチにより、貴重な情報を含む擬似ラベルをフィルタリングすることができる。
本稿では,疑似ラベル整合インスタンスセグメンテーション(PAIS)と呼ばれる新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-10T05:56:53Z) - Distilling Self-Supervised Vision Transformers for Weakly-Supervised
Few-Shot Classification & Segmentation [58.03255076119459]
視覚変換器(ViT)を利用した弱教師付き小ショット画像分類とセグメンテーションの課題に対処する。
提案手法は,自己監督型ViTからトークン表現を抽出し,その相関関係を利用して分類とセグメンテーションの予測を行う。
Pascal-5iとCOCO-20iの実験は、様々な監視設定において大きなパフォーマンス向上を示した。
論文 参考訳(メタデータ) (2023-07-07T06:16:43Z) - Multi-Granularity Denoising and Bidirectional Alignment for Weakly
Supervised Semantic Segmentation [75.32213865436442]
本稿では,雑音ラベルと多クラス一般化問題を緩和するために,MDBAモデルを提案する。
MDBAモデルはPASCAL VOC 2012データセットの検証とテストセットにおいて69.5%と70.2%のmIoUに達することができる。
論文 参考訳(メタデータ) (2023-05-09T03:33:43Z) - Ambiguity-Resistant Semi-Supervised Learning for Dense Object Detection [98.66771688028426]
本研究では,一段階検出器のためのAmbiguity-Resistant Semi-supervised Learning (ARSL)を提案する。
擬似ラベルの分類とローカライズ品質を定量化するために,JCE(Joint-Confidence Estimation)を提案する。
ARSLは、曖昧さを効果的に軽減し、MS COCOおよびPASCALVOC上で最先端のSSOD性能を達成する。
論文 参考訳(メタデータ) (2023-03-27T07:46:58Z) - Image Understands Point Cloud: Weakly Supervised 3D Semantic
Segmentation via Association Learning [59.64695628433855]
ラベルのない画像から補完的な情報を取り入れた3次元セグメンテーションのための新しいクロスモダリティ弱教師付き手法を提案する。
基本的に、ラベルの小さな部分のパワーを最大化するために、アクティブなラベリング戦略を備えたデュアルブランチネットワークを設計する。
提案手法は,1%未満のアクティブなアノテーションで,最先端の完全教師付き競合よりも優れていた。
論文 参考訳(メタデータ) (2022-09-16T07:59:04Z) - Masked Unsupervised Self-training for Zero-shot Image Classification [98.23094305347709]
Masked Unsupervised Self-Training (MUST)は、疑似ラベルと生画像という2つの異なる、補完的な監督源を活用する新しいアプローチである。
MUSTはCLIPを大きなマージンで改善し、教師なしと教師なしの分類のパフォーマンスギャップを狭める。
論文 参考訳(メタデータ) (2022-06-07T02:03:06Z) - Threshold Matters in WSSS: Manipulating the Activation for the Robust
and Accurate Segmentation Model Against Thresholds [16.6833745997519]
弱教師付きセマンティックセマンティックセマンティックセマンティクス(WSSS)は、画像レベルのラベルだけでセマンティクスモデルをトレーニングするという約束により、最近注目を集めている。
既存のWSSSメソッドは一般的に、CAMのスパースカバレッジがWSSSのパフォーマンスボトルネックを引き起こすと主張している。
本稿は, 実際のボトルネックはスパースカバレッジではなく, CAM後に適用されたグローバルしきい値決定方式である,という分析的および実証的な証拠を提供する。
論文 参考訳(メタデータ) (2022-03-30T04:26:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。