論文の概要: Exclusivity-Guided Mask Learning for Semi-Supervised Crowd Instance Segmentation and Counting
- arxiv url: http://arxiv.org/abs/2603.16241v1
- Date: Tue, 17 Mar 2026 08:25:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-18 17:42:07.169051
- Title: Exclusivity-Guided Mask Learning for Semi-Supervised Crowd Instance Segmentation and Counting
- Title(参考訳): 半スーパービジョンの集合インスタンスセグメンテーションとカウントのための排他性誘導型マスク学習
- Authors: Jiyang Huang, Hongru Cheng, Wei Lin, Jia Wan, Antoni B. Chan,
- Abstract要約: 本研究では,現在のデータセットに対するマスク監視を実現するために,排他制約付きデュアルプロンプトSAM(EDP-SAM)を提案する。
次に、識別マスクの目的によって空間的分離を行う排他性指導型マスク学習(XMask)を提案する。
XMaskをベースとして,ケースマスクを擬似ラベルとして利用する,半教師付きクラウドカウントフレームワークを提案する。
- 参考スコア(独自算出の注目度): 46.06620846193129
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Semi-supervised crowd analysis is a prominent area of research, as unlabeled data are typically abundant and inexpensive to obtain. However, traditional point-based annotations constrain performance because individual regions are inherently ambiguous, and consequently, learning fine-grained structural semantics from sparse anno tations remains an unresolved challenge. In this paper, we first propose an Exclusion-Constrained Dual-Prompt SAM (EDP-SAM), based on our Nearest Neighbor Exclusion Circle (NNEC) constraint, to generate mask supervision for current datasets. With the aim of segmenting individuals in dense scenes, we then propose Exclusivity-Guided Mask Learning (XMask), which enforces spatial separation through a discriminative mask objective. Gaussian smoothing and a differentiable center sampling strategy are utilized to improve feature continuity and training stability. Building on XMask, we present a semi-supervised crowd counting framework that uses instance mask priors as pseudo-labels, which contain richer shape information than traditional point cues. Extensive experiments on the ShanghaiTech A, UCF-QNRF, and JHU++ datasets (using 5%, 10%, and 40% labeled data) verify that our end-to-end model achieves state-of-the-art semi-supervised segmentation and counting performance, effectively bridging the gap between counting and instance segmentation within a unified framework.
- Abstract(参考訳): 半教師付き群集分析は、ラベルのないデータが典型的には豊富で入手しやすいため、顕著な研究分野である。
しかし、従来のポイントベースのアノテーションは、個々の領域が本質的に曖昧であるためパフォーマンスを制限しており、その結果、スパースアノテーションからきめ細かい構造的意味学を学ぶことは未解決の課題である。
本稿では,我々の近縁排他圏(NNEC)制約に基づく排他制約付きデュアルプロンプトSAM(EDP-SAM)を提案する。
密集した場面で個人をセグメンテーションすることを目的として,識別マスクの目的を通じて空間的分離を行う排他性指導型マスク学習(XMask)を提案する。
ガウス的平滑化と異なる中心サンプリング戦略を用いて特徴継続性と訓練安定性を向上させる。
XMaskをベースとして,従来のポイントキューよりもリッチな形状情報を含む擬似ラベルとして,ケースマスクの先行値を用いた半教師付きクラウドカウントフレームワークを提案する。
ShanghaiTech A、UCF-QNRF、JHU++データセット(5%、10%、40%ラベル付きデータ)の大規模な実験により、私たちのエンドツーエンドモデルは、最先端の半教師付きセグメンテーションとカウントパフォーマンスを実現し、統一されたフレームワーク内のカウントとインスタンスセグメンテーションのギャップを効果的に埋めることができます。
関連論文リスト
- ConformalSAM: Unlocking the Potential of Foundational Segmentation Models in Semi-Supervised Semantic Segmentation with Conformal Prediction [57.930531826380836]
本研究は,未ラベル画像のアノテータとして画素レベルの視覚課題におけるラベル不足に,基礎的セグメンテーションモデルが対処できるかどうかを考察する。
ConformalSAMは,まず対象ドメインのラベル付きデータを用いて基礎モデルを校正し,ラベルなしデータの信頼できないピクセルラベルをフィルタリングする新しいSSSSフレームワークである。
論文 参考訳(メタデータ) (2025-07-21T17:02:57Z) - Bridge the Points: Graph-based Few-shot Segment Anything Semantically [79.1519244940518]
プレトレーニング技術の最近の進歩により、視覚基礎モデルの能力が向上した。
最近の研究はSAMをFew-shot Semantic segmentation (FSS)に拡張している。
本稿では,グラフ解析に基づく簡易かつ効果的な手法を提案する。
論文 参考訳(メタデータ) (2024-10-09T15:02:28Z) - Enhancing Weakly Supervised Semantic Segmentation with Multi-modal Foundation Models: An End-to-End Approach [7.012760526318993]
Weakly-Supervised Semantic (WSSS)は、広範囲なラベリングに対してコスト効率のよい回避手段を提供する。
既存のWSSSメソッドは、セグメンテーション結果の低さにつながるオブジェクトの境界を理解するのに苦労しています。
本稿では,境界ボックス内の視覚的基盤モデルを活用することにより,これらの問題に対処する,新しい効果的なフレームワークを提案する。
論文 参考訳(メタデータ) (2024-05-10T16:42:25Z) - Robust Zero-Shot Crowd Counting and Localization With Adaptive Resolution SAM [55.93697196726016]
本稿では,SEEM(Seegment-Everything-Everywhere Model)を用いた簡易かつ効果的な群集カウント手法を提案する。
密集した群集シーンにおけるSEEMの性能は,高密度領域の多くの人々が欠落していることが主な原因である。
提案手法は,群集カウントにおいて最高の教師なし性能を実現すると同時に,いくつかの教師付き手法に匹敵する性能を示す。
論文 参考訳(メタデータ) (2024-02-27T13:55:17Z) - Point Cloud Instance Segmentation with Semi-supervised Bounding-Box
Mining [17.69745159912481]
ラベル付きおよび未ラベルのバウンディングボックスを監視として使用した,最初の半教師付きポイントクラウドインスタンスセグメンテーションフレームワーク(SPIB)を紹介した。
提案手法は,近年の完全教師付き手法と比較して,競争性能が向上する。
論文 参考訳(メタデータ) (2021-11-30T08:40:40Z) - A Three-Stage Self-Training Framework for Semi-Supervised Semantic
Segmentation [0.9786690381850356]
本稿では,セマンティックセグメンテーションのための3段階の自己学習フレームワークとして,包括的解を提案する。
本手法の鍵となる考え方は擬似マスク統計情報の抽出である。
次に、一貫性を強制するマルチタスクモデルを用いて擬似マスクの不確実性を減少させる。
論文 参考訳(メタデータ) (2020-12-01T21:00:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。