論文の概要: Where Does Texture Evidence Live in SAM? Features, Proposal Masks, and Texture Segmentation
- arxiv url: http://arxiv.org/abs/2606.14755v1
- Date: Sun, 07 Jun 2026 19:02:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-16 16:21:32.044922
- Title: Where Does Texture Evidence Live in SAM? Features, Proposal Masks, and Texture Segmentation
- Title(参考訳): SAMにおけるテクスチャの証拠はどこにあるのか? 特徴,提案マスク,テクスチャセグメンテーション
- Authors: Nadav Orenstein, Aviad Cohen Zada, Shai Avidan, Gal Oren,
- Abstract要約: テクスチャセグメンテーションは、意味のある領域は、オブジェクトのアイデンティティではなく、物質的または反復的な外観によって定義されるため、基礎セグメンテーションを強調する。
SAMはテクスチャ定義のパーティションでデフォルトで失敗することが多いが、この失敗は曖昧である。
我々は、適応前に凍ったSAMにすでにテクスチャ関連証拠が保存されているか尋ねる。
- 参考スコア(独自算出の注目度): 13.414225469091724
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Texture segmentation stresses foundation segmentation because meaningful regions are defined by material or repeated appearance rather than object identity. Segment Anything Models (SAMs) often fail by default on such texture-defined partitions, but this failure is ambiguous: the texture evidence may be absent, missing from the proposal bank, or present but selected or assembled incorrectly by an object-centric readout. We ask what texture-relevant evidence is already preserved in frozen SAM before adaptation. We study two frozen evidence spaces: multiscale features, probed with a minimal clustering readout, and the automatic proposal bank, treated as evidence for a supervised consolidation readout. SAM is frozen throughout; we do not fine-tune the backbone or retrain the proposal generator. Across RWTD, STLD, an ADE20K-selected refined-crop complement, and a ControlNet-stitched PTD bridge archive, frozen SAM is not a texture segmenter by default, but its failures are not simple texture blindness. Coarse frozen features preserve texture organization, and proposal banks often contain texture-aligned masks or fragments. Natural scenes more often require assembly and commitment over fragments, while cleaner synthetic cases more often reduce to selecting an already coherent proposal. Default mask failure should therefore be decomposed into representation evidence, proposal-bank support, readout mismatch, and commitment failure.
- Abstract(参考訳): テクスチャセグメンテーションは、意味のある領域は、オブジェクトのアイデンティティではなく、物質的または反復的な外観によって定義されるため、基礎セグメンテーションを強調する。
Segment Anything Models (SAM) はしばしばそのようなテクスチャ定義のパーティションでデフォルトで失敗するが、この失敗は曖昧である。
我々は、適応前に凍ったSAMにすでにテクスチャ関連証拠が保存されているか尋ねる。
クラスタリングの最小限の読み出しで探索されたマルチスケール特徴と,教師付き統合読み出しの証拠として扱われる自動提案銀行の2つの凍結エビデンス空間について検討した。
私たちはバックボーンを微調整したり、提案ジェネレータを再トレーニングしたりしません。
RWTD、STLD、ADE20K選択の精巧なクロップ補完、コントロールネットのPTDブリッジアーカイブ、フリーズSAMはデフォルトではテクスチャセグメンタではないが、その失敗は単なるテクスチャブラインドネスではない。
粗い凍結した特徴はテクスチャ組織を保存し、提案銀行はテクスチャに整列したマスクやフラグメントをしばしば含んでいる。
自然な場面では、断片に対する組み立てとコミットメントが要求されることが多いが、よりクリーンな合成ケースでは、すでに一貫性のある提案を選択することが少なくない。
したがって、デフォルトマスクの故障は、表現的証拠、提案銀行のサポート、読み出しミスマッチ、コミットメントの失敗に分解されるべきである。
関連論文リスト
- Do Instance Priors Help Weakly Supervised Semantic Segmentation? [82.75875820720616]
SeSAMは、セグメンテーションモデル(Segment Anything Model、SAM)と弱いラベルを持つフレームワークである。
SeSAMはクラスマスクを接続されたコンポーネントに分解し、オブジェクトスケルトンに沿ってサンプルポイントプロンプトを抽出し、弱いラベルカバレッジを使用してSAMマスクを選択し、擬似ラベルを使用してラベルを反復的に洗練する。
SeSAMは、半教師付き学習フレームワークと統合され、基底構造ラベル、SAMベースの擬似ラベル、高信頼の擬似ラベルのバランスをとる。
論文 参考訳(メタデータ) (2026-04-13T08:29:49Z) - SARe: Structure-Aware Large-Scale 3D Fragment Reassembly [14.2680020647518]
3Dフラグメントの再組み立ては、共通のオブジェクト座標系において、秩序のないフラグメントポイント雲やメッシュの剛性的なポーズを復元することを目的としている。
既存のエンドツーエンドアプローチは、信頼できない接触推論のために障害をカスケードする傾向がある。
本研究では、ユークリッド空間アセンブリ生成のためのSARe-Genと推論時間改善のためのSARe-Refineを用いた生成フレームワークであるStructure-Aware Reassembly(SARe)を提案する。
論文 参考訳(メタデータ) (2026-03-23T06:13:14Z) - StructSAM: Structure- and Spectrum-Preserving Token Merging for Segment Anything Models [57.674757786328236]
StructSAMは、Segment Anything Model(SAM)に適した解像度保存型マージアンマージフレームワークである
また,StructSAMはエンコーダFLOPsを25~30%削減し,mIoU/Diceに少量の低下を認めた。
また、スペクトルグラフ粗大化ビューでは、スコア誘導マージにより、ランダムまたはウィンドウ制限ベースラインと比較して、ラプラシアスペクトル歪みが有界となることを示す。
論文 参考訳(メタデータ) (2026-03-07T18:30:58Z) - S$^3$POT: Contrast-Driven Face Occlusion Segmentation via Self-Supervised Prompt Learning [46.05577414378133]
S$3$POTは、自己教師付き空間的プロンプトによる顔生成を相乗化するためのコントラスト駆動型フレームワークである。
特に、S$3$POTは、参照生成、機能拡張、Prompt Selectionの3つのモジュールで構成されている。
専用のデータセットの実験では、S$3$POTの優れたパフォーマンスと各モジュールの有効性が示されている。
論文 参考訳(メタデータ) (2026-01-31T10:05:13Z) - Pro2SAM: Mask Prompt to SAM with Grid Points for Weakly Supervised Object Localization [54.91271106816616]
本稿では,WSOLタスクのグリッドポイントを持つSAM(Pro2SAM)ネットワークに対して,革新的なマスクプロンプトを提案する。
まず,グローバルトークン変換器(GTFormer)を設計し,フレキシブルマスクプロンプトとして粗粒のフォアグラウンドマップを生成する。
第2に,フォアグラウンドマスクの確率を最大化するために,密度の高いプロンプトとしてグリッドポイントをSAMに配信する。
論文 参考訳(メタデータ) (2025-05-08T02:44:53Z) - From Generalization to Precision: Exploring SAM for Tool Segmentation in
Surgical Environments [7.01085327371458]
セグメンテーションモデルでは, 汚損レベルの高い画像が大幅に過大評価され, 性能が低下する。
我々は,最高の単一マスクを予測として選択した場合のSAMの結果を分析するために,接地型ツールマスクを用いている。
本研究では,様々な強みの合成汚損データを用いて,Endovis18とEndovis17の計器セグメンテーションデータセットを解析した。
論文 参考訳(メタデータ) (2024-02-28T01:33:49Z) - SAM-Deblur: Let Segment Anything Boost Image Deblurring [21.964258084389243]
本稿では,Segment Anything Model (SAM) からの事前知識をデブロア処理に組み込んだ SAM-Deblur フレームワークを提案する。
RealBlurJ、ReloBlur、REDSデータセットの実験結果から、GoProでトレーニングしたNAFNetのPSNRをそれぞれ0.05、0.96、および7.03に改善したことが明らかとなった。
論文 参考訳(メタデータ) (2023-09-05T14:33:56Z) - Detector-Free Structure from Motion [63.5577809314603]
そこで我々は,非秩序な画像から正確なカメラポーズと点雲を復元する新しい構造抽出フレームワークを提案する。
我々のフレームワークはまず、量子化された検出器レスマッチングから粗いSfMモデルを再構成する。
提案手法が既存の検出器ベースのSfMシステムより優れていることを示す実験を行った。
論文 参考訳(メタデータ) (2023-06-27T17:59:39Z) - Self-Supervised Scene De-occlusion [186.89979151728636]
本稿では,隠蔽対象の隠蔽順序を復元し,隠蔽対象の見えない部分を完成させることを目的としたシーン非隠蔽問題について検討する。
そこで本研究では,隠されたシーン構造を監視対象として指示やアモーダルアノテーションを使わずに復元する,新規で統一的なフレームワークを用いて,この問題に対処する試みを行う。
そこで,PCNet-M と PCNet-C をベースとして,プログレッシブ・オーダリング・リカバリ,アモーダル・コンプリーメント,コンテント・コンプリートを通じてシーン・デオクルージョンを実現する新しい推論手法を考案した。
論文 参考訳(メタデータ) (2020-04-06T16:31:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。