論文の概要: INSID3: Training-Free In-Context Segmentation with DINOv3
- arxiv url: http://arxiv.org/abs/2603.28480v1
- Date: Mon, 30 Mar 2026 14:16:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:45.439225
- Title: INSID3: Training-Free In-Context Segmentation with DINOv3
- Title(参考訳): INSID3: DINOv3によるトレーニング不要なインコンテキストセグメンテーション
- Authors: Claudia Cuttano, Gabriele Trivigno, Christoph Reich, Daniel Cremers, Carlo Masone, Stefan Roth,
- Abstract要約: INSID3は、凍結したDINOv3機能のみから、さまざまな粒度で概念を分割する、トレーニング不要のアプローチである。
1ショットのセマンティクス、部分、パーソナライズされたセグメンテーションで最先端の結果を達成し、以前の処理を +7.5 % mIoU で上回る。
- 参考スコア(独自算出の注目度): 63.961377087673476
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In-context segmentation (ICS) aims to segment arbitrary concepts, e.g., objects, parts, or personalized instances, given one annotated visual examples. Existing work relies on (i) fine-tuning vision foundation models (VFMs), which improves in-domain results but harms generalization, or (ii) combines multiple frozen VFMs, which preserves generalization but yields architectural complexity and fixed segmentation granularities. We revisit ICS from a minimalist perspective and ask: Can a single self-supervised backbone support both semantic matching and segmentation, without any supervision or auxiliary models? We show that scaled-up dense self-supervised features from DINOv3 exhibit strong spatial structure and semantic correspondence. We introduce INSID3, a training-free approach that segments concepts at varying granularities only from frozen DINOv3 features, given an in-context example. INSID3 achieves state-of-the-art results across one-shot semantic, part, and personalized segmentation, outperforming previous work by +7.5 % mIoU, while using 3x fewer parameters and without any mask or category-level supervision. Code is available at https://github.com/visinf/INSID3 .
- Abstract(参考訳): In-context segmentation (ICS) は、オブジェクト、パーツ、パーソナライズされたインスタンスなど、任意の概念を分類することを目的としている。
既存の仕事は頼りにしている
一 ドメイン内の結果を改善するが一般化を損なう微調整視覚基礎モデル(VFM)
i) は、一般化を保存するが、アーキテクチャの複雑さと固定されたセグメント化の粒度をもたらす複数の凍結されたVFMを結合する。
私たちはICSをミニマリストの観点から再考し、次のように尋ねる。 単一の自己教師型バックボーンは、セマンティックマッチングとセグメンテーションの両方をサポートできますか?
本研究では,DINOv3の大規模自己教師機能により,空間構造が強く,意味的対応が強いことを示す。
InSID3(In-contextの例から、凍結したDINOv3機能のみから、さまざまな粒度で概念を分割するトレーニング不要のアプローチ)を導入する。
INSID3は1ショットセマンティック、パート、パーソナライズされたセグメンテーションの最先端の結果を達成し、3倍少ないパラメータを使用しながら、マスクやカテゴリレベルの監視を一切行わず、以前の作業よりも7.5%のmIoUを上回ります。
コードはhttps://github.com/visinf/INSID3で入手できる。
関連論文リスト
- Towards 3D Object-Centric Feature Learning for Semantic Scene Completion [18.41627244498394]
視覚に基づく3Dセマンティックシーンコンプリート(SSC)は、自動運転の可能性から注目を集めている。
シーンを個々のオブジェクトインスタンスに分解するオブジェクト中心の予測フレームワークであるOceanを提案する。
その結果,Oceanは17.40点,mIoUスコアは20.28点であった。
論文 参考訳(メタデータ) (2025-11-17T06:28:26Z) - SAMPO: Visual Preference Optimization for Intent-Aware Segmentation with Vision Foundation Models [5.3279948735247284]
SAMPOは、視覚的基礎モデルに、疎視的相互作用から高レベルのカテゴリー的意図を推論する新しいフレームワークである。
我々の研究は、視覚基盤モデルにおける意図認識のアライメントのための新しいパラダイムを確立し、補助的なプロンプトジェネレータや言語モデル支援の嗜好学習への依存を取り除く。
論文 参考訳(メタデータ) (2025-08-04T14:31:11Z) - One-shot In-context Part Segmentation [97.77292483684877]
パートセグメンテーションの課題に取り組むために,One-shot In-context Part (OIParts) フレームワークを提案する。
私たちのフレームワークは、トレーニングのない、フレキシブルで、データ効率のよいパートセグメンテーションに対して、新しいアプローチを提供します。
我々は多種多様な対象カテゴリで顕著なセグメンテーション性能を達成した。
論文 参考訳(メタデータ) (2025-03-03T03:50:54Z) - Test-Time Optimization for Domain Adaptive Open Vocabulary Segmentation [15.941958367737408]
Seg-TTOはゼロショットでオープンなセマンティックセグメンテーションのためのフレームワークである。
このギャップに対処するために、セグメンテーション固有のテスト時間最適化にフォーカスします。
Seg-TTOは明確なパフォーマンス向上(いくつかのデータセットで最大27%のmIoU増加)を示し、新たな最先端の確立を実現している。
論文 参考訳(メタデータ) (2025-01-08T18:58:24Z) - 3D-GRES: Generalized 3D Referring Expression Segmentation [77.10044505645064]
3D参照式(3D-RES)は、自然言語の記述に基づいて、特定のインスタンスを3D空間内にセグメント化することを目的としている。
一般化された3D参照式(3D-GRES)は、自然言語命令に基づいて任意の数のインスタンスをセグメントする機能を拡張する。
論文 参考訳(メタデータ) (2024-07-30T08:59:05Z) - OMG-Seg: Is One Model Good Enough For All Segmentation? [83.17068644513144]
OMG-Segは、タスク固有のクエリと出力を持つトランスフォーマーベースのエンコーダデコーダアーキテクチャである。
OMG-Segは10以上の異なるセグメンテーションタスクをサポートできるが、計算とパラメータのオーバーヘッドを大幅に削減できることを示す。
論文 参考訳(メタデータ) (2024-01-18T18:59:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。