論文の概要: Superpixel Anything: A general object-based framework for accurate yet regular superpixel segmentation
- arxiv url: http://arxiv.org/abs/2509.12791v1
- Date: Tue, 16 Sep 2025 08:09:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-17 17:50:52.959116
- Title: Superpixel Anything: A general object-based framework for accurate yet regular superpixel segmentation
- Title(参考訳): Superpixel Anything: 正確かつ正規なSuperpixelセグメンテーションのための汎用オブジェクトベースのフレームワーク
- Authors: Julien Walther, Rémi Giraud, Michaël Clément,
- Abstract要約: SPAM(SuperPixel Anything Model)は、画像を正確にかつ通常のスーパーピクセルに分割するための汎用的なフレームワークである。
我々は,オブジェクトマスクとスーパーピクセルの整合性を確保するために,意味非依存のセグメンテーションのための大規模事前学習モデルを活用する。
SPAMは以前のハイレベルセグメンテーションを処理でき、不確実領域を解決し、特定のオブジェクトにインタラクティブにフォーカスすることができる。
- 参考スコア(独自算出の注目度): 1.121518046252855
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Superpixels are widely used in computer vision to simplify image representation and reduce computational complexity. While traditional methods rely on low-level features, deep learning-based approaches leverage high-level features but also tend to sacrifice regularity of superpixels to capture complex objects, leading to accurate but less interpretable segmentations. In this work, we introduce SPAM (SuperPixel Anything Model), a versatile framework for segmenting images into accurate yet regular superpixels. We train a model to extract image features for superpixel generation, and at inference, we leverage a large-scale pretrained model for semantic-agnostic segmentation to ensure that superpixels align with object masks. SPAM can handle any prior high-level segmentation, resolving uncertainty regions, and is able to interactively focus on specific objects. Comprehensive experiments demonstrate that SPAM qualitatively and quantitatively outperforms state-of-the-art methods on segmentation tasks, making it a valuable and robust tool for various applications. Code and pre-trained models are available here: https://github.com/waldo-j/spam.
- Abstract(参考訳): スーパーピクセルは画像表現を単純化し、計算複雑性を減らすためにコンピュータビジョンで広く使われている。
従来の手法は低レベル機能に依存しているが、ディープラーニングベースのアプローチは高レベル機能を活用するが、複雑なオブジェクトをキャプチャするスーパーピクセルの規則性を犠牲にする傾向があり、精度は高いが解釈しにくいセグメンテーションをもたらす。
本研究では,SPAM(SuperPixel Anything Model)を提案する。
我々は,スーパーピクセル生成のための画像特徴抽出モデルを訓練し,推定時に,大規模事前学習モデルを用いて意味論的セグメンテーションを行い,スーパーピクセルとオブジェクトマスクの整合性を確保する。
SPAMは以前のハイレベルセグメンテーションを処理でき、不確実領域を解決し、特定のオブジェクトにインタラクティブにフォーカスすることができる。
総合的な実験により、SPAMはセグメンテーションタスクにおける最先端の手法を質的かつ定量的に上回り、様々なアプリケーションにとって有意義で堅牢なツールであることが示された。
コードと事前トレーニング済みのモデルについては、https://github.com/waldo-j/spam.comで公開されている。
関連論文リスト
- X-SAM: From Segment Anything to Any Segmentation [63.79182974315084]
大きな言語モデル(LLM)は、広い知識表現において強力な能力を示すが、本質的にはピクセルレベルの知覚的理解において不十分である。
テキスト化からテキスト化まで,セグメンテーションパラダイムを拡張したマルチモーダル大規模言語モデルフレームワークであるX-SAMを提案する。
インタラクティブな視覚的プロンプトで全てのインスタンスオブジェクトをセグメンテーションし、視覚的グラウンドでピクセルワイドな解釈能力を持つMLLMに権限を与える、Visual GrounDed (VGD)セグメンテーションと呼ばれる新しいセグメンテーションタスクを提案する。
論文 参考訳(メタデータ) (2025-08-06T17:19:10Z) - Superpixel Segmentation: A Long-Lasting Ill-Posed Problem [1.104960878651584]
スーパーピクセルの分割は,スーパーピクセルの形状とサイズに暗黙の規則性制約があるため,基本的に不適切な問題であることを示す。
我々は,超画素セグメンテーションタスクを専用にトレーニングすることなく,SAM(Segment Anything Model)のような最近のアーキテクチャを用いて,競争力のある結果が得られることを示す。
論文 参考訳(メタデータ) (2024-11-10T14:31:56Z) - PixelLM: Pixel Reasoning with Large Multimodal Model [110.500792765109]
PixelLMはピクセルレベルの推論と理解のための効率的かつ効率的なLMMである。
コードブックトークンの隠された埋め込みからマスクを生成し、詳細なターゲット関連情報をエンコードする。
PixelLMは、さまざまなピクセルレベルの画像推論と理解タスクを網羅し、複数のベンチマークで確立されたメソッドよりも優れています。
論文 参考訳(メタデータ) (2023-12-04T03:05:59Z) - Superpixel Transformers for Efficient Semantic Segmentation [32.537400525407186]
本稿では,画像の過剰部分化というスーパーピクセルの考え方を活用し,近代的なトランスフォーマーフレームワークでそれらを適用することによって,その解決策を提案する。
提案手法は,グローバルな自己認識機構によって生成されるリッチなスーパーピクセル特徴により,セマンティックセマンティックセグメンテーションにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2023-09-28T23:09:30Z) - Efficient Multiscale Object-based Superpixel Framework [62.48475585798724]
我々は,SICLE(Iterative CLEarcutting)によるスーパーピクセルという,新しいスーパーピクセルフレームワークを提案する。
SICLEは、複数スケールのセグメンテーションをオンザフライで生成できるオブジェクト情報を利用する。
これは最近のスーパーピクセル法を一般化し、複数のデライン化指標に従って効率と効率性に関する最先端のアプローチを超越している。
論文 参考訳(メタデータ) (2022-04-07T15:59:38Z) - Saliency Enhancement using Superpixel Similarity [77.34726150561087]
Saliency Object Detection (SOD) は画像解析にいくつかの応用がある。
深層学習に基づくSOD法は最も効果的であるが、類似した色を持つ前景の部品を見逃すことがある。
スーパーピクセル類似性(SESS)に対するtextitSaliency Enhancement というポストプロセッシング手法を導入する。
我々は,SESSが5つの画像データセット上での3つのディープラーニングに基づくSOD手法の結果を連続的に,かつ著しく改善できることを実証した。
論文 参考訳(メタデータ) (2021-12-01T17:22:54Z) - Implicit Integration of Superpixel Segmentation into Fully Convolutional
Networks [11.696069523681178]
スーパーピクセル方式をCNNに暗黙的に統合する方法を提案する。
提案手法では,下地層に画素を階層的にグループ化し,スーパーピクセルを生成する。
本手法は,セマンティックセグメンテーション,スーパーピクセルセグメンテーション,モノクル深度推定などのタスクで評価する。
論文 参考訳(メタデータ) (2021-03-05T02:20:26Z) - Superpixel Segmentation Based on Spatially Constrained Subspace
Clustering [57.76302397774641]
独立意味情報を持つ各代表領域を部分空間とみなし,部分空間クラスタリング問題としてスーパーピクセルセグメンテーションを定式化する。
従来のサブスペースクラスタリングとスーパーピクセルセグメンテーションの簡単な統合は,画素の空間相関のために効果的に機能しないことを示す。
本稿では,空間隣接画素に類似の属性を付加してスーパーピクセルにクラスタリング可能な,凸局所性制約付きサブスペースクラスタリングモデルを提案する。
論文 参考訳(メタデータ) (2020-12-11T06:18:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。