論文の概要: From Easy to Hard: Progressive Active Learning Framework for Infrared Small Target Detection with Single Point Supervision
- arxiv url: http://arxiv.org/abs/2412.11154v2
- Date: Thu, 13 Mar 2025 08:04:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-14 17:08:08.159027
- Title: From Easy to Hard: Progressive Active Learning Framework for Infrared Small Target Detection with Single Point Supervision
- Title(参考訳): 難易度から難易度まで:単一点スーパービジョンによる赤外小ターゲット検出のためのプログレッシブアクティブラーニングフレームワーク
- Authors: Chuang Yu, Jinmiao Zhao, Yunpeng Liu, Sicheng Zhao, Yimian Dai, Xiangyu Yue,
- Abstract要約: 単一点監視のための革新的プログレッシブアクティブラーニング(PAL)フレームワークを構築した。
簡単なサンプルを自動選択することに焦点を当てたモデル事前開始概念を提案する。
PALフレームワークを搭載した既存のSIRST検出ネットワークは、複数の公開データセットに対して、最先端(SOTA)の結果を得たことを示す。
- 参考スコア(独自算出の注目度): 18.555485444818835
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, single-frame infrared small target (SIRST) detection with single point supervision has drawn wide-spread attention. However, the latest label evolution with single point supervision (LESPS) framework suffers from instability, excessive label evolution, and difficulty in exerting embedded network performance. Inspired by organisms gradually adapting to their environment and continuously accumulating knowledge, we construct an innovative Progressive Active Learning (PAL) framework for single point supervision, which drives the existing SIRST detection networks progressively and actively recognizes and learns more hard samples to achieve significant performance improvements. Specifically, to avoid the early low-performance model leading to the wrong selection of hard samples, we propose a model pre-start concept, which focuses on automatically selecting a portion of easy samples and helping the model have basic task-specific learning capabilities. Meanwhile, we propose a refined dual-update strategy, which can promote reasonable learning of harder samples and continuous refinement of pseudo-labels. In addition, to alleviate the risk of excessive label evolution, a decay factor is reasonably introduced, which helps to achieve a dynamic balance between the expansion and contraction of target annotations. Extensive experiments show that existing SIRST detection networks equipped with our PAL framework have achieved state-of-the-art (SOTA) results on multiple public datasets. Furthermore, our PAL framework can build an efficient and stable bridge between full supervision and single point supervision tasks. Our code are available at https://github.com/YuChuang1205/PAL.
- Abstract(参考訳): 近年,単一点監視による単一フレーム赤外小目標(SIRST)検出が広範に注目されている。
しかし、単一点監視(LESPS)フレームワークによる最新のラベルの進化は、不安定性、過剰なラベルの進化、組込みネットワークの性能向上の難しさに悩まされている。
生物が環境に徐々に適応し、継続的に知識を蓄積し、単一点監視のための革新的なプログレッシブ・アクティブ・ラーニング(PAL)フレームワークを構築した。
具体的には、初期の低パフォーマンスモデルがハードサンプルの選択を誤ったものにするのを避けるために、簡単なサンプルの一部を自動的に選択し、基本的なタスク固有の学習能力を持つモデルを支援することに焦点を当てたモデル事前開始概念を提案する。
一方,より厳密なサンプルの適切な学習と擬似ラベルの継続的な改良を促進できる改良された二重更新戦略を提案する。
さらに、ラベルの過剰な進化のリスクを軽減するために、崩壊係数が合理的に導入され、ターゲットアノテーションの拡張と収縮の間の動的バランスを達成するのに役立ちます。
PALフレームワークを搭載した既存のSIRST検出ネットワークは、複数の公開データセットに対して、最先端(SOTA)の結果を得たことを示す大規模な実験である。
さらに、当社のPALフレームワークは、全監督タスクと単一点監督タスクの間に、効率的で安定したブリッジを構築することができる。
私たちのコードはhttps://github.com/YuChuang1205/PAL.comで公開されています。
関連論文リスト
- CODE-CL: COnceptor-Based Gradient Projection for DEep Continual Learning [7.573297026523597]
我々は,Deep Continual Learning (CODE-CL) のためのConceptor-based gradient projectionを導入する。
CODE-CLは、過去のタスクの入力空間における方向的重要性を符号化し、新しい知識統合を1-S$で変調する。
概念に基づく表現を用いてタスク重複を分析し,高い相関性を持つタスクを同定する。
論文 参考訳(メタデータ) (2024-11-21T22:31:06Z) - Refined Infrared Small Target Detection Scheme with Single-Point Supervision [2.661766509317245]
単一点監視を用いた革新的赤外線小目標検出手法を提案する。
提案手法は最先端(SOTA)性能を実現する。
特に、提案手法は「ICPR 2024 Resource-Limited Infrared Small Target Detection Challenge Track 1: Weakly Supervised Infrared Small Target Detection」で3位を獲得した。
論文 参考訳(メタデータ) (2024-08-05T18:49:58Z) - Towards Robust Infrared Small Target Detection: A Feature-Enhanced and Sensitivity-Tunable Framework [2.4810332733338623]
本稿では,既存のSIRST検出ネットワークと互換性のあるFEST(Feature Enhanced and sensitivity-tunable)フレームワークを提案する。
我々のFESTフレームワークは既存のSIRST検出ネットワークの性能を大幅に向上させることができることを示す。
特に、FESTフレームワークを備えたマルチスケール方向認識ネットワーク(MSDA-Net)は、PRCV 2024広帯域赤外線小目標検出コンテストで優勝した。
論文 参考訳(メタデータ) (2024-07-29T15:22:02Z) - ACTRESS: Active Retraining for Semi-supervised Visual Grounding [52.08834188447851]
前回の研究であるRefTeacherは、疑似自信と注意に基づく監督を提供するために教師学生の枠組みを採用することで、この課題に取り組むための最初の試みである。
このアプローチは、Transformerベースのパイプラインに従う現在の最先端のビジュアルグラウンドモデルと互換性がない。
本稿では, ACTRESS を略したセミスーパービジョン視覚グラウンドのためのアクティブ・リトレーニング手法を提案する。
論文 参考訳(メタデータ) (2024-07-03T16:33:31Z) - Enhancing Infrared Small Target Detection Robustness with Bi-Level
Adversarial Framework [61.34862133870934]
本稿では,異なる汚職の存在下での検出の堅牢性を促進するために,二段階の対向的枠組みを提案する。
我々の手法は広範囲の汚職で21.96%のIOUを著しく改善し、特に一般ベンチマークで4.97%のIOUを推進している。
論文 参考訳(メタデータ) (2023-09-03T06:35:07Z) - Unsupervised Meta-Learning via Few-shot Pseudo-supervised Contrastive
Learning [72.3506897990639]
本稿では,Pseudo-supervised Contrast (PsCo) という,シンプルだが効果的なメタ学習フレームワークを提案する。
PsCoは、さまざまなドメイン内およびクロスドメインのいくつかのショット分類ベンチマークの下で、既存の教師なしメタラーニングメソッドより優れています。
論文 参考訳(メタデータ) (2023-03-02T06:10:13Z) - A Generic Shared Attention Mechanism for Various Backbone Neural Networks [53.36677373145012]
自己注意モジュール(SAM)は、異なる層にまたがる強い相関した注意マップを生成する。
Dense-and-Implicit Attention (DIA)はSAMをレイヤ間で共有し、長期間のメモリモジュールを使用する。
我々のシンプルで効果的なDIAは、様々なネットワークバックボーンを一貫して拡張できます。
論文 参考訳(メタデータ) (2022-10-27T13:24:08Z) - A Weakly Supervised Learning Framework for Salient Object Detection via
Hybrid Labels [96.56299163691979]
本稿では,ハイブリッドラベル下でのSODタスクに焦点をあてる。
このタスクにおけるラベルノイズと量不均衡の問題に対処するため、我々は3つの洗練されたトレーニング戦略を持つ新しいパイプラインフレームワークを設計する。
5つのSODベンチマーク実験により,本手法は弱教師付き/非教師付き手法と競合する性能を示した。
論文 参考訳(メタデータ) (2022-09-07T06:45:39Z) - Texture-guided Saliency Distilling for Unsupervised Salient Object
Detection [67.10779270290305]
本研究では, 簡便かつ高精度な塩分濃度の知識を抽出するUSOD法を提案する。
提案手法は,RGB,RGB-D,RGB-T,ビデオSODベンチマーク上での最先端USOD性能を実現する。
論文 参考訳(メタデータ) (2022-07-13T02:01:07Z) - Activation to Saliency: Forming High-Quality Labels for Unsupervised
Salient Object Detection [54.92703325989853]
本稿では,高品質なサリエンシキューを効果的に生成する2段階アクティベーション・ツー・サリエンシ(A2S)フレームワークを提案する。
トレーニングプロセス全体において、私たちのフレームワークにヒューマンアノテーションは関与していません。
本フレームワークは,既存のUSOD法と比較して高い性能を示した。
論文 参考訳(メタデータ) (2021-12-07T11:54:06Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。