論文の概要: Point-to-Mask: From Arbitrary Point Annotations to Mask-Level Infrared Small Target Detection
- arxiv url: http://arxiv.org/abs/2603.16257v1
- Date: Tue, 17 Mar 2026 08:44:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-18 17:42:07.178171
- Title: Point-to-Mask: From Arbitrary Point Annotations to Mask-Level Infrared Small Target Detection
- Title(参考訳): ポイント・ツー・マスク:任意点アノテーションからマスクレベル赤外小ターゲット検出へ
- Authors: Weihua Gao, Wenlong Niu, Jie Tang, Man Yang, Jiafeng Zhang, Xiaodong Peng,
- Abstract要約: Point-to-Maskは低コストのポイント監視とマスクレベルの検出をブリッジするフレームワークである。
提案手法は,強い擬似ラベル品質,高い検出精度,効率的な推論を実現する。
- 参考スコア(独自算出の注目度): 11.256548408562894
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Infrared small target detection (IRSTD) methods predominantly formulate the task as pixel-level segmentation, which requires costly dense annotations and is not well suited to tiny targets with weak texture and ambiguous boundaries. To address this issue, we propose Point-to-Mask, a framework that bridges low-cost point supervision and mask-level detection through two components: a Physics-driven Adaptive Mask Generation (PAMG) module that converts point annotations into compact target masks and geometric cues, and a lightweight Radius-aware Point Regression Network (RPR-Net) that reformulates IRSTD as target center localization and effective radius regression using spatiotemporal motion cues. The two modules form a closed loop: PAMG generates pseudo masks and geometric supervision during training, while the geometric predictions of RPR-Net are fed back to PAMG for pixel-level mask recovery during inference. To facilitate systematic evaluation, we further construct SIRSTD-Pixel, a sequential dataset with refined pixel-level annotations. Experiments show that the proposed framework achieves strong pseudo-label quality, high detection accuracy, and efficient inference, approaching full-supervision performance under point-supervised settings with substantially lower annotation cost. Code and datasets will be available at: https://github.com/GaoScience/point-to-mask.
- Abstract(参考訳): 赤外線小目標検出法(IRSTD)は,高コストで高密度なアノテーションを必要とする画素レベルのセグメンテーションとしてタスクを定式化し,弱いテクスチャとあいまいな境界を持つ小さなターゲットには適さない。
この問題に対処するため、我々は、物理学駆動の適応マスク生成(PAMG)モジュールでポイントアノテーションをコンパクトなターゲットマスクや幾何学的キューに変換する、低コストのポイント監視とマスクレベルの検出を橋渡しするフレームワークであるPoint-to-Maskと、IRSTDをターゲット中心の局所化と、時空間の動きキューを用いた効果的な半径回帰を再構成する軽量なRadius-aware Point Regression Network(RPR-Net)を提案する。
2つのモジュールはクローズドループを形成し、PAMGはトレーニング中に擬似マスクと幾何学的監視を生成し、RPR-Netの幾何学的予測は推論中にピクセルレベルのマスク回復のためにPAMGにフィードバックされる。
システム評価を容易にするため,画素レベルのアノテーションを改良したシーケンシャルデータセットであるSIRSTD-Pixelを構築した。
実験により,提案フレームワークは高い擬似ラベル品質,高い検出精度,効率的な推論を実現し,アノテーションコストを大幅に低減した点教師付き設定下でのフルスーパービジョン性能に近づいた。
コードとデータセットは、https://github.com/GaoScience/point-to-mask.comで提供される。
関連論文リスト
- P2Object: Single Point Supervised Object Detection and Instance Segmentation [58.778288785355]
バランスの取れたtextbftextitinstance レベルの提案バッグを構成する Point-to-Box Network (P2BNet) を導入する。
P2MNetはより正確なバウンディングボックスを生成し、セグメンテーションタスクに一般化することができる。
提案手法は,COCO,VOC,Cityscapesの平均精度において,従来の手法をはるかに上回っている。
論文 参考訳(メタデータ) (2025-04-10T14:51:08Z) - Bridge the Points: Graph-based Few-shot Segment Anything Semantically [79.1519244940518]
プレトレーニング技術の最近の進歩により、視覚基礎モデルの能力が向上した。
最近の研究はSAMをFew-shot Semantic segmentation (FSS)に拡張している。
本稿では,グラフ解析に基づく簡易かつ効果的な手法を提案する。
論文 参考訳(メタデータ) (2024-10-09T15:02:28Z) - Hybrid Mask Generation for Infrared Small Target Detection with Single-Point Supervision [11.083762911063857]
SIRST(Single-frame infrared small target)検出は、複雑な赤外背景乱れの中で微小な目標を識別する必要があるため、大きな課題となる。
本稿では,ポイントレベルのアノテーションから高品質な擬似マスクを得るための,弱教師付きパラダイムに焦点を当てる。
論文 参考訳(メタデータ) (2024-09-06T03:34:44Z) - P2RBox: Point Prompt Oriented Object Detection with SAM [28.96914721062631]
我々はP2RBoxを紹介した。これはオブジェクト指向オブジェクト検出のための回転ボックス(RBox)アノテーションを生成するためにポイントプロンプトを利用する。
P2RBoxには、境界感性マスクガイダンスと、空間情報を利用して粒度のあいまいさを低減する中心性ガイダンスという、2つの先進的なガイダンスが組み込まれている。
最先端のポイントアノテート生成手法であるPointOBBと比較すると、P2RBoxはDOTA-v1.0データセット上で約29%のmAPで性能が向上する。
論文 参考訳(メタデータ) (2023-11-22T03:33:00Z) - PWISeg: Point-based Weakly-supervised Instance Segmentation for Surgical
Instruments [27.89003436883652]
我々はPWISeg (Point-based Weakly-supervised Instance) という,弱制御型手術器具セグメンテーション手法を提案する。
PWISegは、特徴点とバウンディングボックスの関係をモデル化するために、ポイント・ツー・ボックスとポイント・ツー・マスクのブランチを備えたFCNベースのアーキテクチャを採用している。
そこで本研究では,キー・ツー・マスク・ブランチを駆動し,より正確なセグメンテーション予測を生成するキー・ピクセル・アソシエーション・ロスとキー・ピクセル・アソシエーション・ロスを提案する。
論文 参考訳(メタデータ) (2023-11-16T11:48:29Z) - Monte Carlo Linear Clustering with Single-Point Supervision is Enough
for Infrared Small Target Detection [48.707233614642796]
SIRST(Single-frame infrared small target)検出は、赤外線画像上の乱雑な背景から小さなターゲットを分離することを目的としている。
ディープラーニングに基づく手法は、SIRST検出において有望な性能を達成したが、大量のトレーニングデータを犠牲にしている。
単一点監視を用いたSIRST検出のための最初の手法を提案する。
論文 参考訳(メタデータ) (2023-04-10T08:04:05Z) - Pointly-Supervised Instance Segmentation [81.34136519194602]
インスタンスセグメンテーションの弱い監視の新しい形態であるポイントベースのインスタンスレベルのアノテーションを提案する。
標準のバウンディングボックスアノテーションと、各バウンディングボックス内で一様にサンプリングされるラベル付きポイントを組み合わせる。
実験では,COCO,PASCAL VOC,Cityscapes,LVISでトレーニングしたMask R-CNNモデルに対して,各オブジェクトあたりの注釈付きポイントが94%~98%の完全教師付きパフォーマンスを達成した。
論文 参考訳(メタデータ) (2021-04-13T17:59:40Z) - Dense Label Encoding for Boundary Discontinuity Free Rotation Detection [69.75559390700887]
本稿では,分類に基づく比較的研究の少ない方法論について検討する。
我々は2つの側面でフロンティアを推し進めるための新しい手法を提案する。
航空画像のための大規模公開データセットの実験と視覚解析は,我々のアプローチの有効性を示している。
論文 参考訳(メタデータ) (2020-11-19T05:42:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。