論文の概要: DiffEGG: Diffusion-Driven Edge Generation as a Pixel-Annotation-Free Alternative for Instance Annotation
- arxiv url: http://arxiv.org/abs/2503.07982v1
- Date: Tue, 11 Mar 2025 02:34:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-12 15:43:51.106206
- Title: DiffEGG: Diffusion-Driven Edge Generation as a Pixel-Annotation-Free Alternative for Instance Annotation
- Title(参考訳): DiffEGG: インスタンスアノテーションのPixelアノテーションフリー代替手段としての拡散駆動エッジ生成
- Authors: Sanghyun Jo, Ziseok Lee, Wooyeol Lee, Kyungsu Kim,
- Abstract要約: DiffEGGは、事前訓練された拡散モデルからインスタンス認識の特徴を抽出し、正確なエッジマップを生成する、完全にアノテーションのない手法である。
弱い教師付きセマンティックセマンティックセグメンテーション(WSS)のために、DiffEGGはインスタンスアノテーションなしでWPSを可能にする。
- 参考スコア(独自算出の注目度): 1.3624495460189863
- License:
- Abstract: Achieving precise panoptic segmentation relies on pixel-wise instance annotations, but obtaining such datasets is costly. Unsupervised instance segmentation (UIS) eliminates annotation requirements but struggles with adjacent instance merging and single-instance fragmentation, largely due to the limitations of DINO-based backbones which lack strong instance separation cues. Weakly-supervised panoptic segmentation (WPS) reduces annotation costs using sparse labels (e.g., points, boxes), yet these annotations remain expensive and introduce human bias and boundary errors. To address these challenges, we propose DiffEGG (Diffusion-Driven EdGe Generation), a fully annotation-free method that extracts instance-aware features from pretrained diffusion models to generate precise instance edge maps. Unlike DINO-based UIS methods, diffusion models inherently capture fine-grained, instance-aware features, enabling more precise boundary delineation. For WPS, DiffEGG eliminates annotation costs and human bias by operating without any form of manual supervision, addressing the key limitations of prior best methods. Additionally, we introduce RIP, a post-processing technique that fuses DiffEGG's edge maps with segmentation masks in a task-agnostic manner. RIP allows DiffEGG to be seamlessly integrated into various segmentation frameworks. When applied to UIS, DiffEGG and RIP achieve an average $+4.4\text{ AP}$ improvement over prior best UIS methods. When combined with weakly-supervised semantic segmentation (WSS), DiffEGG enables WPS without instance annotations, outperforming prior best point-supervised WPS methods by $+1.7\text{ PQ}$. These results demonstrate that DiffEGG's edge maps serve as a cost-effective, annotation-free alternative to instance annotations, significantly improving segmentation without human intervention. Code is available at https://github.com/shjo-april/DiffEGG.
- Abstract(参考訳): 正確な汎視的セグメンテーションを実現するには、ピクセル単位のインスタンスアノテーションに依存するが、そのようなデータセットを取得するにはコストがかかる。
教師なしのインスタンスセグメンテーション(UIS)は、アノテーションの要件を排除しているが、隣接するインスタンスのマージと単一インスタンスのフラグメンテーションに苦労している。
WPS(Weakly-supervised panoptic segmentation)は、スパースラベル(例えば、ポイント、ボックス)を用いたアノテーションのコストを削減するが、これらのアノテーションは高価であり、人間のバイアスや境界誤差をもたらす。
これらの課題に対処するため,DiffEGG (Diffusion-Driven EdGe Generation) を提案する。
DINOベースのUISメソッドとは異なり、拡散モデルは本質的にインスタンス認識の細粒度の特徴をキャプチャし、より正確な境界線化を可能にする。
WPSでは、DiffEGGは手動の監督なしに操作することで、アノテーションのコストと人間のバイアスを排除し、以前のベストメソッドの重要な制限に対処する。
さらに,DiffEGGのエッジマップとセグメンテーションマスクをタスク非依存で融合するポストプロセッシング手法であるRIPを導入する。
RIPはDiffEGGを様々なセグメンテーションフレームワークにシームレスに統合することを可能にする。
UISに適用すると、DiffEGGとRIPは以前の最高のUISメソッドよりも平均$+4.4\text{ AP}$の改善を達成する。
弱教師付きセマンティックセマンティックセグメンテーション(WSS)と組み合わせることで、DiffEGGはインスタンスアノテーションなしでWPSを可能にする。
これらの結果は、DiffEGGのエッジマップが、インスタンスアノテーションに代わるコスト効率の良いアノテーションのない代替品として機能し、人間の介入なしにセグメンテーションを大幅に改善することを示した。
コードはhttps://github.com/shjo-april/DiffEGGで入手できる。
関連論文リスト
- EAUWSeg: Eliminating annotation uncertainty in weakly-supervised medical image segmentation [4.334357692599945]
正確なピクセル間ラベルではなく、粗いアノテーションのみを必要とするため、弱く管理された医用画像のセグメンテーションが勢いを増している。
本稿では,その学習フレームワークEAUWSegと結合して,アノテーションの不確実性を排除した新しい弱いアノテーション手法を提案する。
EAUWSegは、既存の弱教師付きセグメンテーション法よりも優れていることを示す。
論文 参考訳(メタデータ) (2025-01-03T06:21:02Z) - BAISeg: Boundary Assisted Weakly Supervised Instance Segmentation [9.6046915661065]
インスタンスレベルの監視なしにインスタンスレベルのマスクを抽出する方法は、弱教師付きインスタンスセグメンテーション(WSIS)の主な課題である
人気のあるWSIS手法は、画素間関係の学習を通じて変位場(DF)を推定し、インスタンスを識別するためのクラスタリングを実行する。
本稿では,画素レベルのアノテーションでインスタンスセグメンテーションを実現するWSISの新しいパラダイムであるBundary-Assisted Instance(BAISeg)を提案する。
論文 参考訳(メタデータ) (2024-05-27T15:14:09Z) - Weakly Supervised 3D Instance Segmentation without Instance-level
Annotations [57.615325809883636]
3Dセマンティックシーン理解タスクは、ディープラーニングの出現によって大きな成功を収めた。
本稿では,分類的セマンティックラベルのみを監督対象とする,弱制御型3Dインスタンスセマンティクス手法を提案する。
分類的セマンティックラベルから擬似インスタンスラベルを生成することで,アノテーションコストの低減で既存の3Dインスタンスセグメンテーションの学習を支援することができる。
論文 参考訳(メタデータ) (2023-08-03T12:30:52Z) - All Points Matter: Entropy-Regularized Distribution Alignment for
Weakly-supervised 3D Segmentation [67.30502812804271]
擬似ラベルは、弱い教師付き3Dセグメンテーションタスクに広く使われており、学習に使えるのはスパース・グラウンド・トラス・ラベルのみである。
本稿では,生成した擬似ラベルを正規化し,擬似ラベルとモデル予測とのギャップを効果的に狭めるための新しい学習戦略を提案する。
論文 参考訳(メタデータ) (2023-05-25T08:19:31Z) - Edge-aware Plug-and-play Scheme for Semantic Segmentation [4.297988192695948]
提案手法は, 改良を伴わない任意の最先端(SOTA)モデルにシームレスに統合できる。
実験結果から,提案手法は改良を伴わない任意の最先端(SOTA)モデルにシームレスに統合できることが示唆された。
論文 参考訳(メタデータ) (2023-03-18T02:17:37Z) - UIA-ViT: Unsupervised Inconsistency-Aware Method based on Vision
Transformer for Face Forgery Detection [52.91782218300844]
そこで我々は、UIA-ViTと呼ばれるビジョン変換器に基づく教師なし不整合認識手法を提案する。
自己注意機構により、パッチ埋め込み間の注意マップは自然に一貫性関係を表現し、一貫性表現学習に適した視覚変換器となる。
論文 参考訳(メタデータ) (2022-10-23T15:24:47Z) - Collaborative Propagation on Multiple Instance Graphs for 3D Instance
Segmentation with Single-point Supervision [63.429704654271475]
本稿では,1つのオブジェクトを1つのポイントでラベル付けするだけでよい,弱教師付き手法RWSegを提案する。
これらの疎いラベルにより、セマンティック情報とインスタンス情報を伝達する2つの分岐を持つ統一的なフレームワークを導入する。
具体的には、異なるインスタンスグラフ間の競合を促進するクロスグラフ競合ランダムウォークス(CRW)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-08-10T02:14:39Z) - SIOD: Single Instance Annotated Per Category Per Image for Object
Detection [67.64774488115299]
画像内の既存のカテゴリ毎に1つのインスタンスアノテーションのみを必要とする単一インスタンスアノテーションオブジェクト検出(SIOD)を提案する。
WSOD(Inter-task)やSSOD(Inter-image)の相違点からイメージ内の相違点に分解されたSIODは、ラベルなしインスタンスの残りをマイニングする上で、より信頼性が高く豊富な事前知識を提供する。
SIOD設定下では、類似性に基づく擬似ラベル生成モジュール(SPLG)と、Pixelレベルのグループコントラスト学習モジュール(PGCL)からなる、シンプルで効果的なフレームワークであるDual-Mining(DMiner)を提案する。
論文 参考訳(メタデータ) (2022-03-29T08:49:51Z) - SparseDet: Improving Sparsely Annotated Object Detection with
Pseudo-positive Mining [76.95808270536318]
Pseudo- positive mining を用いてラベル付き地域とラベルなし地域を分離するエンド・ツー・エンドシステムを提案する。
ラベル付き領域は通常通り処理されるが、ラベルなし領域の処理には自己教師付き学習が使用される。
我々は,PASCAL-VOCとCOCOデータセットの5つの分割に対して,最先端の性能を達成するための徹底的な実験を行った。
論文 参考訳(メタデータ) (2022-01-12T18:57:04Z) - Learning to segment from misaligned and partial labels [0.0]
アーバン以外の多くの設定は、正確なセグメンテーションに必要な基盤構造を欠いている。
OpenStreetMaps (OSM)のようなオープンソースのインフラストラクチャアノテーションがこの問題を代表している。
本稿では,不整合アノテーションと欠落アノテーションを付与した画素画像分割を改良した,新規で一般化可能な2段階のフレームワークを提案する。
論文 参考訳(メタデータ) (2020-05-27T06:02:58Z) - Towards Bounding-Box Free Panoptic Segmentation [16.4548904544277]
パン光学セグメンテーションのための新しいBunding-Box Free Network (BBFNet) を提案する。
BBFNetは、粗い流域レベルを予測し、境界が適切に定義された大きなインスタンス候補を検出するためにそれらを使用する。
境界が信頼性の低い小さなインスタンスでは、BBFNetはHoughの投票によってインスタンス中心を予測し、続いて平均シフトによって小さなオブジェクトを確実に検出する。
論文 参考訳(メタデータ) (2020-02-18T16:34:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。