論文の概要: Beyond Full Labels: Energy-Double-Guided Single-Point Prompt for Infrared Small Target Label Generation
- arxiv url: http://arxiv.org/abs/2408.08191v5
- Date: Sat, 16 Nov 2024 00:21:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-19 14:29:13.325695
- Title: Beyond Full Labels: Energy-Double-Guided Single-Point Prompt for Infrared Small Target Label Generation
- Title(参考訳): 完全ラベルを超える:赤外小ターゲットラベル生成のためのエネルギー二重誘導単点プロンプト
- Authors: Shuai Yuan, Hanlin Qin, Renke Kou, Xiang Yan, Zechuan Li, Chenxu Peng, Huixin Zhou,
- Abstract要約: 我々は、赤外線小ターゲットラベル生成(IRSTLG)のための学習に基づくシングルポイントプロンプトパラダイムを開拓した。
本稿では、粗いIRSTDネットワークを洗練されたラベル生成手法に変換することを目的とした、エレガントで効果的なエネルギー二重ガイド型シングルポイントプロンプト(EDGSP)フレームワークを提案する。
本フレームワークは,SIRST,NUDT-SIRST,IRSTD-1kデータセット上で100%オブジェクトレベル検出確率 (Pd) と0%偽アラームレート (Fa) を達成し,IoU (Pixel-level intersection over union) を13.28%改善した。
- 参考スコア(独自算出の注目度): 3.8125649496040106
- License:
- Abstract: We pioneer a learning-based single-point prompt paradigm for infrared small target label generation (IRSTLG) to lobber annotation burdens. Unlike previous clustering-based methods, our intuition is that point-guided mask generation just requires one more prompt than target detection, i.e., IRSTLG can be treated as an infrared small target detection (IRSTD) with the location hint. Therefore, we propose an elegant yet effective Energy-Double-Guided Single-point Prompt (EDGSP) framework, aiming to adeptly transform a coarse IRSTD network into a refined label generation method. Specifically, EDGSP comprises three key modules: 1) target energy initialization (TEI), which establishes a foundational outline to streamline the mapping process for effective shape evolution, 2) double prompt embedding (DPE) for rapidly localizing interesting regions and reinforcing high-resolution individual edges to avoid label adhesion, and 3) bounding box-based matching (BBM) for eliminating false masks via considering comprehensive cluster boundary conditions to obtain a reliable output. In this way, pseudo labels generated by three backbones equipped with our EDGSP achieve 100% object-level probability of detection (Pd) and 0% false-alarm rate (Fa) on SIRST, NUDT-SIRST, and IRSTD-1k datasets, with a pixel-level intersection over union (IoU) improvement of 13.28% over state-of-the-art (SOTA) label generation methods. Further applying our inferred masks to train detection models, EDGSP, for the first time, enables a single-point-generated pseudo mask to surpass the manual labels. Even with coarse single-point annotations, it still achieves 99.5% performance of full labeling. Code is available at https://github.com/xdFai/EDGSP.
- Abstract(参考訳): 我々は、ロブラーアノテーションの負担を軽減するために、赤外線小ターゲットラベル生成(IRSTLG)のための学習ベースのシングルポイントプロンプトパラダイムを考案した。
従来のクラスタリング法とは異なり、我々の直感では、ポイント誘導マスク生成は目標検出よりも1つのプロンプトを必要とする。
そこで我々は,粗いIRSTDネットワークを改良されたラベル生成手法に適応的に変換することを目的とした,エレガントで効果的なEnergy-Double-Guided Single-point Prompt (EDGSP) フレームワークを提案する。
具体的には、EDGSPは3つの重要なモジュールから構成される。
1) 目標エネルギー初期化(TEI)は, 効率的な形状形成のためのマッピングプロセスの合理化のための基礎的概要を確立する。
2DPE(Double prompt embeding)は、興味のある領域を迅速に局在させ、ラベルの付着を避けるために高分解能な個別の縁を補強し、
3) 包括的クラスタ境界条件を考慮し, 疑似マスクを除去するためのバウンディングボックスベースマッチング (BBM) を行い, 信頼性の高い出力を得る。
これにより,SIRST,NUDT-SIRST,IRSTD-1kの3つのバックボーンが生成する擬似ラベルは,SIRST,NUDT-SIRST,IRSTD-1kデータセット上で100%のオブジェクトレベル検出確率(Pd)と0%の偽アラームレート(Fa)を達成し,IoU(Pixel-level intersection over union)の改善により,SOTA(State-of-the-art)ラベル生成法よりも13.28%向上した。
さらに,我々の推定マスクをトレーニング検出モデルに適用することにより,EDGSPは1点の擬似マスクを手動のラベルを超えることができる。
粗い単一ポイントアノテーションであっても、完全なラベル付けのパフォーマンスは99.5%である。
コードはhttps://github.com/xdFai/EDGSPで入手できる。
関連論文リスト
- Hybrid Mask Generation for Infrared Small Target Detection with Single-Point Supervision [18.168923054036682]
SIRST(Single-frame infrared small target)検出は、微小なターゲットを識別する必要があるため、大きな課題となる。
ネットワークトレーニングのためのシングルポイントラベルのみから,ターゲット毎に高品質なマスクを復元するハイブリッドマスク生成手法を提案する。
3つのデータセットにまたがる実験結果から,本手法は単一点監視による赤外線小目標検出法よりも優れていることが示された。
論文 参考訳(メタデータ) (2024-09-06T03:34:44Z) - KECOR: Kernel Coding Rate Maximization for Active 3D Object Detection [48.66703222700795]
我々は、ラベルの取得に最も有用なポイントクラウドを特定するために、新しいカーネル戦略を利用する。
1段目(SECOND)と2段目(SECOND)の両方に対応するため、アノテーションに選択した境界ボックスの総数と検出性能のトレードオフをよく組み込んだ分類エントロピー接点を組み込んだ。
その結果,ボックスレベルのアノテーションのコストは約44%,計算時間は26%削減された。
論文 参考訳(メタデータ) (2023-07-16T04:27:03Z) - Monte Carlo Linear Clustering with Single-Point Supervision is Enough
for Infrared Small Target Detection [48.707233614642796]
SIRST(Single-frame infrared small target)検出は、赤外線画像上の乱雑な背景から小さなターゲットを分離することを目的としている。
ディープラーニングに基づく手法は、SIRST検出において有望な性能を達成したが、大量のトレーニングデータを犠牲にしている。
単一点監視を用いたSIRST検出のための最初の手法を提案する。
論文 参考訳(メタデータ) (2023-04-10T08:04:05Z) - Dual-Refinement: Joint Label and Feature Refinement for Unsupervised
Domain Adaptive Person Re-Identification [51.98150752331922]
Unsupervised Domain Adaptive (UDA) Person Re-identification (再ID) は、ターゲットドメインデータのラベルが欠落しているため、難しい作業です。
オフラインクラスタリングフェーズにおける擬似ラベルとオンライントレーニングフェーズにおける特徴を共同で改良する,デュアルリファインメントと呼ばれる新しいアプローチを提案する。
本手法は最先端手法を大きなマージンで上回っている。
論文 参考訳(メタデータ) (2020-12-26T07:35:35Z) - Unsupervised Object Detection with LiDAR Clues [70.73881791310495]
本稿では,LiDARの手がかりを用いた非教師対象検出のための最初の実用的手法を提案する。
提案手法では,まず3次元点雲に基づく候補オブジェクトセグメントを生成する。
そして、セグメントラベルを割り当て、セグメントラベルネットワークを訓練する反復的なセグメントラベル処理を行う。
ラベル付けプロセスは、長い尾とオープンエンドの分布の問題を軽減するために慎重に設計されている。
論文 参考訳(メタデータ) (2020-11-25T18:59:54Z) - LG-GAN: Label Guided Adversarial Network for Flexible Targeted Attack of
Point Cloud-based Deep Networks [123.5839352227726]
本稿では,リアルタイムなフレキシブル・ターゲット・ポイント・クラウド・アタックのための新しいラベル誘導対向ネットワーク(LG-GAN)を提案する。
私たちの知る限りでは、これが第1世代ベースの3Dポイントクラウドアタック手法です。
論文 参考訳(メタデータ) (2020-11-01T17:17:10Z) - EHSOD: CAM-Guided End-to-end Hybrid-Supervised Object Detection with
Cascade Refinement [53.69674636044927]
本稿では,エンド・ツー・エンドのハイブリッド型オブジェクト検出システムであるEHSODについて述べる。
完全なアノテートと弱いアノテートの両方で、ワンショットでトレーニングすることができる。
完全なアノテートされたデータの30%しか持たない複数のオブジェクト検出ベンチマークで、同等の結果が得られる。
論文 参考訳(メタデータ) (2020-02-18T08:04:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。