論文の概要: TRACE: Your Diffusion Model is Secretly an Instance Edge Detector
- arxiv url: http://arxiv.org/abs/2503.07982v2
- Date: Thu, 16 Oct 2025 02:11:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-17 16:37:10.314601
- Title: TRACE: Your Diffusion Model is Secretly an Instance Edge Detector
- Title(参考訳): TRACE:あなたの拡散モデルは秘密裏にインスタンスエッジ検出器
- Authors: Sanghyun Jo, Ziseok Lee, Wooyeol Lee, Jonghyun Choi, Jaesik Park, Kyungsu Kim,
- Abstract要約: 本稿では,テキストと画像の拡散モデルが秘密裏にインスタンスエッジアノテータとして機能していることを示し,TRACEを提案する。
TRACEは、オブジェクト境界が最初に自己アテンションマップに現れるインスタンスエネルジェンスポイント(IEP)を特定し、アテンション境界分割(ABDiv)を通して境界を抽出し、それらを軽量のワンステップエッジデコーダに蒸留する。
COCOベンチマークでは、TRACEは教師なしのインスタンスセグメンテーションを+5.1 APで改善し、タグ付きパノスコープセグメンテーションでは、インスタンスレベルのラベルを使わずに、ポイント付きベースラインを+1.7 PQで上回る。
- 参考スコア(独自算出の注目度): 45.119480971518946
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: High-quality instance and panoptic segmentation has traditionally relied on dense instance-level annotations such as masks, boxes, or points, which are costly, inconsistent, and difficult to scale. Unsupervised and weakly-supervised approaches reduce this burden but remain constrained by semantic backbone constraints and human bias, often producing merged or fragmented outputs. We present TRACE (TRAnsforming diffusion Cues to instance Edges), showing that text-to-image diffusion models secretly function as instance edge annotators. TRACE identifies the Instance Emergence Point (IEP) where object boundaries first appear in self-attention maps, extracts boundaries through Attention Boundary Divergence (ABDiv), and distills them into a lightweight one-step edge decoder. This design removes the need for per-image diffusion inversion, achieving 81x faster inference while producing sharper and more connected boundaries. On the COCO benchmark, TRACE improves unsupervised instance segmentation by +5.1 AP, and in tag-supervised panoptic segmentation it outperforms point-supervised baselines by +1.7 PQ without using any instance-level labels. These results reveal that diffusion models encode hidden instance boundary priors, and that decoding these signals offers a practical and scalable alternative to costly manual annotation. Code is available at https://github.com/shjo-april/DiffEGG.
- Abstract(参考訳): 高品質のインスタンスと汎視的セグメンテーションは、伝統的に、コストが高く、一貫性がなく、スケールが難しいマスク、ボックス、ポイントなどの高密度なインスタンスレベルのアノテーションに依存してきた。
教師なし、弱教師なしのアプローチは、この負担を軽減するが、意味的なバックボーンの制約と人間のバイアスに制約され続け、しばしばマージまたは断片化された出力を生成する。
TRACE(transforming diffusion Cues to instance Edges)では,テキストと画像の拡散モデルが秘密裏にインスタンスエッジアノテータとして機能していることを示す。
TRACEは、オブジェクト境界が最初に自己アテンションマップに現れるインスタンスエネルジェンスポイント(IEP)を特定し、アテンション境界分割(ABDiv)を通して境界を抽出し、それらを軽量のワンステップエッジデコーダに蒸留する。
この設計は、画像ごとの拡散反転の必要性を排除し、よりシャープでより接続された境界を生み出しながら81倍高速な推論を実現する。
COCOベンチマークでは、TRACEは教師なしのインスタンスセグメンテーションを+5.1 APで改善し、タグ付きパノスコープセグメンテーションでは、インスタンスレベルのラベルを使わずに、ポイント付きベースラインを+1.7 PQで上回る。
これらの結果は、拡散モデルが隠されたインスタンス境界を符号化し、これらの信号の復号化は、コストのかかる手作業によるアノテーションに代わる実用的でスケーラブルな代替手段を提供することを示している。
コードはhttps://github.com/shjo-april/DiffEGGで入手できる。
関連論文リスト
- Clustering is back: Reaching state-of-the-art LiDAR instance segmentation without training [69.2787246878521]
本研究は, セマンティックラベルのみを用いて, 競合するパノプティクスのセグメンテーションを実現できることを示す。
本手法は完全に説明可能であり,学習やパラメータチューニングは不要である。
論文 参考訳(メタデータ) (2025-03-17T14:12:08Z) - EAUWSeg: Eliminating annotation uncertainty in weakly-supervised medical image segmentation [4.334357692599945]
正確なピクセル間ラベルではなく、粗いアノテーションのみを必要とするため、弱く管理された医用画像のセグメンテーションが勢いを増している。
本稿では,その学習フレームワークEAUWSegと結合して,アノテーションの不確実性を排除した新しい弱いアノテーション手法を提案する。
EAUWSegは、既存の弱教師付きセグメンテーション法よりも優れていることを示す。
論文 参考訳(メタデータ) (2025-01-03T06:21:02Z) - BAISeg: Boundary Assisted Weakly Supervised Instance Segmentation [9.6046915661065]
インスタンスレベルの監視なしにインスタンスレベルのマスクを抽出する方法は、弱教師付きインスタンスセグメンテーション(WSIS)の主な課題である
人気のあるWSIS手法は、画素間関係の学習を通じて変位場(DF)を推定し、インスタンスを識別するためのクラスタリングを実行する。
本稿では,画素レベルのアノテーションでインスタンスセグメンテーションを実現するWSISの新しいパラダイムであるBundary-Assisted Instance(BAISeg)を提案する。
論文 参考訳(メタデータ) (2024-05-27T15:14:09Z) - The devil is in the object boundary: towards annotation-free instance segmentation using Foundation Models [24.53385855664792]
オブジェクト検出とインスタンスのセグメンテーションでは、SAMやDINOのような基礎モデルは満足なパフォーマンスを達成するのに苦労する。
我々は、新しい分類優先発見パイプラインにおいて、$textbfZip$, $textbfZ$ips up CL$textbfip$, SAMを提案する。
Zipは、COCOデータセット上のSAMのマスクAPを12.5%大きく向上させ、さまざまな設定で最先端のパフォーマンスを確立する。
論文 参考訳(メタデータ) (2024-04-18T07:22:38Z) - All Points Matter: Entropy-Regularized Distribution Alignment for
Weakly-supervised 3D Segmentation [67.30502812804271]
擬似ラベルは、弱い教師付き3Dセグメンテーションタスクに広く使われており、学習に使えるのはスパース・グラウンド・トラス・ラベルのみである。
本稿では,生成した擬似ラベルを正規化し,擬似ラベルとモデル予測とのギャップを効果的に狭めるための新しい学習戦略を提案する。
論文 参考訳(メタデータ) (2023-05-25T08:19:31Z) - Edge-aware Plug-and-play Scheme for Semantic Segmentation [4.297988192695948]
提案手法は, 改良を伴わない任意の最先端(SOTA)モデルにシームレスに統合できる。
実験結果から,提案手法は改良を伴わない任意の最先端(SOTA)モデルにシームレスに統合できることが示唆された。
論文 参考訳(メタデータ) (2023-03-18T02:17:37Z) - UIA-ViT: Unsupervised Inconsistency-Aware Method based on Vision
Transformer for Face Forgery Detection [52.91782218300844]
そこで我々は、UIA-ViTと呼ばれるビジョン変換器に基づく教師なし不整合認識手法を提案する。
自己注意機構により、パッチ埋め込み間の注意マップは自然に一貫性関係を表現し、一貫性表現学習に適した視覚変換器となる。
論文 参考訳(メタデータ) (2022-10-23T15:24:47Z) - Collaborative Propagation on Multiple Instance Graphs for 3D Instance
Segmentation with Single-point Supervision [63.429704654271475]
本稿では,1つのオブジェクトを1つのポイントでラベル付けするだけでよい,弱教師付き手法RWSegを提案する。
これらの疎いラベルにより、セマンティック情報とインスタンス情報を伝達する2つの分岐を持つ統一的なフレームワークを導入する。
具体的には、異なるインスタンスグラフ間の競合を促進するクロスグラフ競合ランダムウォークス(CRW)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-08-10T02:14:39Z) - SIOD: Single Instance Annotated Per Category Per Image for Object
Detection [67.64774488115299]
画像内の既存のカテゴリ毎に1つのインスタンスアノテーションのみを必要とする単一インスタンスアノテーションオブジェクト検出(SIOD)を提案する。
WSOD(Inter-task)やSSOD(Inter-image)の相違点からイメージ内の相違点に分解されたSIODは、ラベルなしインスタンスの残りをマイニングする上で、より信頼性が高く豊富な事前知識を提供する。
SIOD設定下では、類似性に基づく擬似ラベル生成モジュール(SPLG)と、Pixelレベルのグループコントラスト学習モジュール(PGCL)からなる、シンプルで効果的なフレームワークであるDual-Mining(DMiner)を提案する。
論文 参考訳(メタデータ) (2022-03-29T08:49:51Z) - SparseDet: Improving Sparsely Annotated Object Detection with
Pseudo-positive Mining [76.95808270536318]
Pseudo- positive mining を用いてラベル付き地域とラベルなし地域を分離するエンド・ツー・エンドシステムを提案する。
ラベル付き領域は通常通り処理されるが、ラベルなし領域の処理には自己教師付き学習が使用される。
我々は,PASCAL-VOCとCOCOデータセットの5つの分割に対して,最先端の性能を達成するための徹底的な実験を行った。
論文 参考訳(メタデータ) (2022-01-12T18:57:04Z) - Learning to segment from misaligned and partial labels [0.0]
アーバン以外の多くの設定は、正確なセグメンテーションに必要な基盤構造を欠いている。
OpenStreetMaps (OSM)のようなオープンソースのインフラストラクチャアノテーションがこの問題を代表している。
本稿では,不整合アノテーションと欠落アノテーションを付与した画素画像分割を改良した,新規で一般化可能な2段階のフレームワークを提案する。
論文 参考訳(メタデータ) (2020-05-27T06:02:58Z) - Towards Bounding-Box Free Panoptic Segmentation [16.4548904544277]
パン光学セグメンテーションのための新しいBunding-Box Free Network (BBFNet) を提案する。
BBFNetは、粗い流域レベルを予測し、境界が適切に定義された大きなインスタンス候補を検出するためにそれらを使用する。
境界が信頼性の低い小さなインスタンスでは、BBFNetはHoughの投票によってインスタンス中心を予測し、続いて平均シフトによって小さなオブジェクトを確実に検出する。
論文 参考訳(メタデータ) (2020-02-18T16:34:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。