論文の概要: ModuSeg: Decoupling Object Discovery and Semantic Retrieval for Training-Free Weakly Supervised Segmentation
- arxiv url: http://arxiv.org/abs/2604.07021v1
- Date: Wed, 08 Apr 2026 12:38:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-09 17:30:51.525725
- Title: ModuSeg: Decoupling Object Discovery and Semantic Retrieval for Training-Free Weakly Supervised Segmentation
- Title(参考訳): ModuSeg: トレーニング不要の弱監視セグメンテーションのためのオブジェクト発見とセマンティック検索の分離
- Authors: Qingze He, Fagui Liu, Dengke Zhang, Qingmao Wei, Quan Tang,
- Abstract要約: 弱教師付きセマンティックセグメンテーションは、画像レベルのラベルを用いてピクセルレベルの予測を実現することを目的としている。
我々は、オブジェクト発見と意味代入を明確に分離することに焦点を当てた、トレーニング不要な弱教師付きセマンティックセマンティックセマンティクスフレームワークであるModuSegを紹介する。
- 参考スコア(独自算出の注目度): 8.671473711194741
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Weakly supervised semantic segmentation aims to achieve pixel-level predictions using image-level labels. Existing methods typically entangle semantic recognition and object localization, which often leads models to focus exclusively on sparse discriminative regions. Although foundation models show immense potential, many approaches still follow the tightly coupled optimization paradigm, struggling to effectively alleviate pseudo-label noise and often relying on time-consuming multi-stage retraining or unstable end-to-end joint optimization. To address the above challenges, we present ModuSeg, a training-free weakly supervised semantic segmentation framework centered on explicitly decoupling object discovery and semantic assignment. Specifically, we integrate a general mask proposer to extract geometric proposals with reliable boundaries, while leveraging semantic foundation models to construct an offline feature bank, transforming segmentation into a non-parametric feature retrieval process. Furthermore, we propose semantic boundary purification and soft-masked feature aggregation strategies to effectively mitigate boundary ambiguity and quantization errors, thereby extracting high-quality category prototypes. Extensive experiments demonstrate that the proposed decoupled architecture better preserves fine boundaries without parameter fine-tuning and achieves highly competitive performance on standard benchmark datasets. Code is available at https://github.com/Autumnair007/ModuSeg.
- Abstract(参考訳): 弱教師付きセマンティックセグメンテーションは、画像レベルのラベルを用いてピクセルレベルの予測を実現することを目的としている。
既存の手法は通常、セマンティック認識とオブジェクトのローカライゼーションを絡み合わせる。
基礎モデルは大きな可能性を示しているが、多くのアプローチは厳密に結合された最適化パラダイムに従っており、擬似ラベルノイズを効果的に軽減することができず、しばしば時間を要するマルチステージのリトレーニングや不安定なエンドツーエンドのジョイント最適化に依存している。
上記の課題に対処するため、トレーニング不要な弱教師付きセマンティックセマンティックセマンティクスフレームワークであるModuSegを紹介した。
具体的には、一般的なマスクプロジェクタを統合して、セグメンテーションを非パラメトリックな特徴検索プロセスに変換するために、セグメンテーションモデルを活用しながら、信頼性のある境界を持つ幾何学的提案を抽出する。
さらに,境界のあいまいさと量子化誤差を効果的に軽減し,高品質なカテゴリのプロトタイプを抽出するためのセマンティック・バウンダリ・パーフィケーションとソフトマインド・フィーチャーアグリゲーション・ストラテジーを提案する。
大規模な実験により、提案した疎結合アーキテクチャはパラメータの微調整を伴わずに細かな境界をよりよく保存し、標準ベンチマークデータセット上で高い競争性能を達成することが示された。
コードはhttps://github.com/Autumnair007/ModuSegで入手できる。
関連論文リスト
- Optimizing against Infeasible Inclusions from Data for Semantic Segmentation through Morphology [58.17907376475596]
最先端セマンティックセグメンテーションモデルは通常、データ駆動方式で最適化される。
InSeInは、手元に設定されたセグメンテーショントレーニングから空間クラス関係を規定する明示的な包含制約を抽出する。
そして、予測可能性を促進するために、トレーニング中にこれらの制約の違反を罰する形態的だが差別的な損失を強制する。
論文 参考訳(メタデータ) (2024-08-26T22:39:08Z) - MetaSeg: Content-Aware Meta-Net for Omni-Supervised Semantic
Segmentation [17.59676962334776]
弱いオブジェクトレベルのアノテーションから生成された擬似セグメンテーションラベルに必然的に存在するノイズラベル。
メタラーニングの最近の進歩に触発されて、クリーンラベルの背後に隠されたノイズを受動的に許容するのに苦労するのではなく、より実用的な解決策は、ノイズの多い領域を積極的に見つけることである、と私たちは主張する。
本稿では,任意のセグメンテーションモデルに対応するノイズインジケータとして,CAM-Netを主成分とするメタ学習に基づくセグメンテーション手法MetaSegを提案する。
論文 参考訳(メタデータ) (2024-01-22T07:31:52Z) - Label-efficient Segmentation via Affinity Propagation [27.016747627689288]
ラベル効率のよいスパースアノテーションを用いた弱教師付きセグメンテーションは、手間のかかるピクセルワイドラベリングプロセスのコストを削減するために研究の注目を集めている。
親和性モデリングを親和性伝播過程として定式化し、局所的および大域的親和性項を提案して、正確な擬似ラベルを生成する。
計算コストを大幅に削減する効率的なアルゴリズムも開発されている。
論文 参考訳(メタデータ) (2023-10-16T15:54:09Z) - Semantics-Aware Dynamic Localization and Refinement for Referring Image
Segmentation [102.25240608024063]
画像の参照は、言語表現からのイメージセグメントを参照する。
そこで我々は,局所化中心からセグメンテーション言語へ移行するアルゴリズムを開発した。
比較すると,本手法はより汎用的で有効である。
論文 参考訳(メタデータ) (2023-03-11T08:42:40Z) - Semantic Diffusion Network for Semantic Segmentation [1.933681537640272]
セマンティック境界認識を強化する演算子レベルのアプローチを導入する。
意味拡散ネットワーク(SDN)と呼ばれる新しい学習可能なアプローチを提案する。
我々のSDNは、元の機能からクラス間境界強化機能への微分可能なマッピングを構築することを目的としています。
論文 参考訳(メタデータ) (2023-02-04T01:39:16Z) - Attentional Prototype Inference for Few-Shot Segmentation [128.45753577331422]
数発のセグメンテーションのための確率的潜在変数フレームワークである注意型プロトタイプ推論(API)を提案する。
我々は各オブジェクトカテゴリのプロトタイプを表現するためにグローバル潜在変数を定義し、確率分布としてモデル化する。
我々は4つのベンチマークで広範な実験を行い、提案手法は最先端のプロトタイプベースの手法よりも、少なくとも競争力があり、しばしば優れた性能が得られる。
論文 参考訳(メタデータ) (2021-05-14T06:58:44Z) - Improving Semantic Segmentation via Decoupled Body and Edge Supervision [89.57847958016981]
既存のセグメンテーションアプローチは、グローバルコンテキストをモデル化することでオブジェクトの内部の一貫性を改善すること、あるいはマルチスケールの特徴融合によって境界に沿ったオブジェクトの詳細を洗練することを目的としている。
本稿では,セマンティックセグメンテーションのための新しいパラダイムを提案する。
我々の洞察は、セマンティックセグメンテーションの魅力ある性能には、画像の高頻度と低頻度に対応するオブジェクトのテキストボディとテキストエッジを具体的にモデル化する必要があるということである。
さまざまなベースラインやバックボーンネットワークを備えた提案したフレームワークが,オブジェクト内部の一貫性とオブジェクト境界を向上させることを示す。
論文 参考訳(メタデータ) (2020-07-20T12:11:22Z) - Towards Bounding-Box Free Panoptic Segmentation [16.4548904544277]
パン光学セグメンテーションのための新しいBunding-Box Free Network (BBFNet) を提案する。
BBFNetは、粗い流域レベルを予測し、境界が適切に定義された大きなインスタンス候補を検出するためにそれらを使用する。
境界が信頼性の低い小さなインスタンスでは、BBFNetはHoughの投票によってインスタンス中心を予測し、続いて平均シフトによって小さなオブジェクトを確実に検出する。
論文 参考訳(メタデータ) (2020-02-18T16:34:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。