論文の概要: SAUGE: Taming SAM for Uncertainty-Aligned Multi-Granularity Edge Detection
- arxiv url: http://arxiv.org/abs/2412.12892v1
- Date: Tue, 17 Dec 2024 13:18:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-18 14:01:20.265640
- Title: SAUGE: Taming SAM for Uncertainty-Aligned Multi-Granularity Edge Detection
- Title(参考訳): SAUGE:不確実性に適応したマルチグラニュラリティエッジ検出のためのターミングSAM
- Authors: Xing Liufu, Chaolei Tan, Xiaotong Lin, Yonggang Qi, Jinxuan Li, Jian-Fang Hu,
- Abstract要約: 我々は,セグメンテーションモデル(SAM)が,エッジラベルの不確実性をモデル化するための事前知識を提供することを明らかにした。
本モデルは,クロスデータセットエッジ検出のための強力な一般化性を示す。
- 参考スコア(独自算出の注目度): 8.651908243317301
- License:
- Abstract: Edge labels are typically at various granularity levels owing to the varying preferences of annotators, thus handling the subjectivity of per-pixel labels has been a focal point for edge detection. Previous methods often employ a simple voting strategy to diminish such label uncertainty or impose a strong assumption of labels with a pre-defined distribution, e.g., Gaussian. In this work, we unveil that the segment anything model (SAM) provides strong prior knowledge to model the uncertainty in edge labels. Our key insight is that the intermediate SAM features inherently correspond to object edges at various granularities, which reflects different edge options due to uncertainty. Therefore, we attempt to align uncertainty with granularity by regressing intermediate SAM features from different layers to object edges at multi-granularity levels. In doing so, the model can fully and explicitly explore diverse ``uncertainties'' in a data-driven fashion. Specifically, we inject a lightweight module (~ 1.5% additional parameters) into the frozen SAM to progressively fuse and adapt its intermediate features to estimate edges from coarse to fine. It is crucial to normalize the granularity level of human edge labels to match their innate uncertainty. For this, we simply perform linear blending to the real edge labels at hand to create pseudo labels with varying granularities. Consequently, our uncertainty-aligned edge detector can flexibly produce edges at any desired granularity (including an optimal one). Thanks to SAM, our model uniquely demonstrates strong generalizability for cross-dataset edge detection. Extensive experimental results on BSDS500, Muticue and NYUDv2 validate our model's superiority.
- Abstract(参考訳): エッジラベルは通常、アノテータの様々な好みのため様々な粒度レベルにあるため、ピクセルごとのラベルの主観性を扱うことはエッジ検出の焦点となっている。
従来の手法では、しばしば単純な投票戦略を用いてラベルの不確実性を減らしたり、事前に定義された分布、例えばガウス分布を持つラベルの強い仮定を課す。
本研究は, エッジラベルの不確かさをモデル化する上で, SAM(セグメント・アプライス・モデル)が強い事前知識を提供することを示す。
我々の重要な洞察は、中間SAM特徴は本質的に様々な粒度のオブジェクトエッジに対応しており、不確実性のために異なるエッジオプションを反映しているということである。
そこで我々は,異なる層からオブジェクトエッジへの中間SAM特徴を多粒度レベルで回帰することで,不確実性と粒度との整合を図る。
そうすることで、モデルはデータ駆動方式で多様な‘不確実性’を完全かつ明示的に探索することができる。
具体的には、凍結したSAMに軽量モジュール(約1.5%の追加パラメータ)を注入し、その中間機能を段階的に融合して適応させ、粗いエッジから細かいエッジを推定する。
人間のエッジラベルの粒度レベルを正規化し、自然の不確実性に適合させることが重要である。
そこで我々は,実端ラベルに線形ブレンディングを行い,様々な粒度を持つ擬似ラベルを作成する。
その結果、不確実性に整合したエッジ検出器は、任意の所望の粒度(最適なものを含む)のエッジを柔軟に生成できる。
SAMにより、我々のモデルは、クロスデータセットエッジ検出に強い一般化性を示す。
BSDS500, Muticue, NYUDv2の大規模な実験結果から, モデルの優位性が確認された。
関連論文リスト
- Generative Edge Detection with Stable Diffusion [52.870631376660924]
エッジ検出は一般的に、主に識別法によって対処されるピクセルレベルの分類問題と見なされる。
本稿では、事前学習した安定拡散モデルのポテンシャルを十分に活用して、GED(Generative Edge Detector)という新しい手法を提案する。
複数のデータセットに対して広範な実験を行い、競争性能を達成する。
論文 参考訳(メタデータ) (2024-10-04T01:52:23Z) - SAM-Driven Weakly Supervised Nodule Segmentation with Uncertainty-Aware Cross Teaching [13.5553526185399]
自動結節分割は超音波画像におけるコンピュータ支援診断に不可欠である。
近年、SAMのようなセグメンテーション基礎モデルは、自然画像に顕著な一般化性を示している。
本研究では, セグメンテーション基盤モデルを利用して擬似ラベルを生成する, 弱教師付きフレームワークを考案する。
論文 参考訳(メタデータ) (2024-07-18T14:27:54Z) - Multi-clue Consistency Learning to Bridge Gaps Between General and Oriented Object in Semi-supervised Detection [26.486535389258965]
半教師あり学習における汎用物体検出とオブジェクト指向物体検出の3つのギャップを実験的に発見する。
本稿では,これらのギャップを埋めるために,MCL(Multi-clue Consistency Learning)フレームワークを提案する。
提案したMCLは,半教師付きオブジェクト指向物体検出タスクにおいて最先端の性能を実現することができる。
論文 参考訳(メタデータ) (2024-07-08T13:14:25Z) - SuperEdge: Towards a Generalization Model for Self-Supervised Edge
Detection [2.912976132828368]
最先端のピクセルワイドアノテーションは労働集約的であり、手作業で取得すると矛盾する。
本稿では, マルチレベルのマルチホログラフィー技術を用いて, 合成データセットから実世界のデータセットへアノテーションを転送する, エッジ検出のための新しい自己教師型アプローチを提案する。
提案手法は,手動の注釈付きエッジラベルへの依存性を排除し,多様なデータセット間の一般化性を向上させる。
論文 参考訳(メタデータ) (2024-01-04T15:21:53Z) - Shrinking Class Space for Enhanced Certainty in Semi-Supervised Learning [59.44422468242455]
そこで我々はShrinkMatchと呼ばれる新しい手法を提案し、不確実なサンプルを学習する。
それぞれの不確実なサンプルに対して、元の Top-1 クラスを単に含むスランク類空間を適応的に求める。
次に、スランク空間における強と弱に強化された2つのサンプル間の整合正則化を課し、識別的表現を試みます。
論文 参考訳(メタデータ) (2023-08-13T14:05:24Z) - The Treasure Beneath Multiple Annotations: An Uncertainty-aware Edge
Detector [70.43599299422813]
既存のメソッドは、単純な投票プロセスを使用して複数のアノテーションを融合し、エッジ固有の曖昧さを無視し、アノテータのラベル付けバイアスを無視する。
多様なアノテーションの主観性とあいまいさを調査するために不確実性を利用した新しい不確実性認識エッジ検出器(UAED)を提案する。
UAEDは複数のエッジ検出ベンチマークで一貫したパフォーマンスを実現している。
論文 参考訳(メタデータ) (2023-03-21T13:14:36Z) - Exploiting Completeness and Uncertainty of Pseudo Labels for Weakly
Supervised Video Anomaly Detection [149.23913018423022]
弱教師付きビデオ異常検出は、ビデオレベルのラベルのみを用いて、ビデオ内の異常事象を特定することを目的としている。
2段階の自己学習法は擬似ラベルの自己生成によって著しく改善されている。
本稿では,自己学習のための完全性と不確実性を利用した強化フレームワークを提案する。
論文 参考訳(メタデータ) (2022-12-08T05:53:53Z) - Data-Uncertainty Guided Multi-Phase Learning for Semi-Supervised Object
Detection [66.10057490293981]
半監視対象検出のためのデータ不確実性誘導多相学習法を提案する。
本手法は,ベースライン手法と比較して異常に動作し,大きなマージンで性能を向上する。
論文 参考訳(メタデータ) (2021-03-29T09:27:23Z) - AutoAssign: Differentiable Label Assignment for Dense Object Detection [94.24431503373884]
Auto COCOは、物体検出のためのアンカーフリー検出器である。
外観認識は、完全に微分可能な重み付け機構によって実現される。
我々の最良のモデルでは52.1%のAPが達成され、既存の1段検出器よりも優れている。
論文 参考訳(メタデータ) (2020-07-07T14:32:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。