論文の概要: Remote SAMsing: From Segment Anything to Segment Everything
- arxiv url: http://arxiv.org/abs/2605.00256v1
- Date: Thu, 30 Apr 2026 21:44:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 17:43:28.769837
- Title: Remote SAMsing: From Segment Anything to Segment Everything
- Title(参考訳): リモートSAMsing: セグメンテーションからセグメンテーションまで
- Authors: Osmar Luiz Ferreira de Carvalho, Osmar Abílio de Carvalho Júnior, Anesmar Olino de Albuquerque, Daniel Guerreiro e Silva,
- Abstract要約: SAM2は自然画像上で高品質なゼロショットセグメンテーションを生成する。
大きなリモートセンシングシーンに適用すると、2つの問題が浮き彫りになる。
SAM2を変更したり、トレーニングデータを必要とすることなく、両方の問題を解決するオープンソースのパイプラインであるRemote SAMsingを提案する。
- 参考スコア(独自算出の注目度): 0.1749935196721634
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: SAM2 produces high-quality zero-shot segmentation on natural images, but applying it to large remote sensing scenes exposes two problems: (1) its mask generator faces an inherent quality-coverage trade-off: strict thresholds yield precise masks but leave most of the image unsegmented, while relaxed thresholds increase coverage at the cost of mask quality; and (2) large images must be tiled, fragmenting objects across tile boundaries. We propose Remote SAMsing, an open-source pipeline that solves both problems without modifying SAM2 or requiring training data. For coverage, a multi-pass algorithm runs SAM2 repeatedly on each tile, painting accepted masks black between passes to simplify the scene for the next iteration, and relaxing quality thresholds only when coverage gains stagnate, ensuring that the most precise masks are always captured first. For spatial consistency, contextual padding and a parameter-free best-match merge reconstruct objects fragmented across tile boundaries. Evaluated on seven scenes (5~cm to 4.78~m GSD), the pipeline raises coverage from 30--68\% (single-pass SAM2) to 91--98\%. Ablation experiments quantify the contribution of each component to coverage and detection quality. Per-class evaluation shows that SAM2 transfers well to discrete RS objects (buildings 95\%, cars 82--93\% Det@0.5) with segment boundaries 3--8$\times$ more precise than SLIC and Felzenszwalb baselines. Tile size functions as an implicit scale parameter: reducing it from $1{,}000$ to 250 raises Det@0.5 from 56\% to 85\%, outperforming SAM2's built-in multi-scale mechanism. The pipeline generalizes to MNF false-color imagery without retraining (99.5\% ASA) and scales to production-sized images: a 1.94 billion pixel Potsdam mosaic achieved 97\% coverage without quality degradation.
- Abstract(参考訳): SAM2は、自然画像に対して高品質なゼロショットセグメンテーションを生成するが、大きなリモートセンシングシーンに適用すると、(1)マスクジェネレータが固有の品質・カバートレードオフに直面している: 厳密なしきい値が正確なマスクを出力するが、ほとんどの画像は非セグメンテーションされ、一方、緩和されたしきい値はマスク品質のコストでカバレッジを増大させ、(2)大きな画像はタイル境界を越えて断片化されなければならない。
SAM2を変更したり、トレーニングデータを必要とすることなく、両方の問題を解決するオープンソースのパイプラインであるRemote SAMsingを提案する。
カバレッジのために、マルチパスアルゴリズムは各タイル上でSAM2を繰り返し実行し、パス間で受け入れられたマスクを黒く塗って次のイテレーションのシーンを単純化し、カバレッジが停滞した場合にのみ品質閾値を緩和し、最も正確なマスクが最初にキャプチャされることを保証する。
空間的整合性のために、コンテキストパディングとパラメータフリーのベストマッチマージはタイルの境界を越えて断片化されたオブジェクトを再構成する。
7つのシーン(5〜cm〜4.78〜m GSD)で評価され、パイプラインは30~68~%(シングルパスSAM2)から91~98~%まで範囲を拡大する。
アブレーション実験は、各コンポーネントのカバレッジと検出品質への貢献を定量化する。
クラスごとの評価では、SAM2 は SLIC や Felzenszwalb のベースラインよりも正確に3~8$\times$ のセグメント境界を持つ離散RSオブジェクト(ビルディング 95\%、車体 82~93\% Det@0.5)によく移行している。
1{,}000$から250に減らすと、Det@0.5が56\%から85\%に上昇し、SAM2の組み込みマルチスケールメカニズムを上回っます。
パイプラインは再トレーニングせずにMNFの偽色画像(99.5\% ASA)に一般化し、プロダクションサイズの画像にスケールする:94億画素のポツダムモザイクは品質劣化なしに97\%のカバレッジを達成した。
関連論文リスト
- Malicious Image Analysis via Vision-Language Segmentation Fusion: Detection, Element, and Location in One-shot [18.80045630689047]
画像に有害なコンテンツが含まれているかどうかを同時に検出するゼロショットパイプラインを導入する。
それぞれの重要な要素を特定し、それらの要素をピクセル精度のマスクでローカライズする。
このシステムは、画像を数秒で処理し、既存のVLMにシームレスにプラグインし、きめ細かな説明可能な悪意のある画像モデレーションのための最初の実用的なツールを構成する。
論文 参考訳(メタデータ) (2025-12-04T09:18:14Z) - UnSAMv2: Self-Supervised Learning Enables Segment Anything at Any Granularity [54.41309926099154]
人間のアノテーションなしでどんな粒度でもセグメンテーションできるUnSAMv2を紹介します。
UnSAMv2は、マスクと粒度のペアを豊富に発見することで、UnSAMの分割・対戦略を拡張している。
粒度を意識した自己教師付き学習手法により,少量のラベル付きデータが視覚基礎モデルの可能性を解き放つことを示す。
論文 参考訳(メタデータ) (2025-11-17T18:58:34Z) - OmniSAM: Omnidirectional Segment Anything Model for UDA in Panoramic Semantic Segmentation [38.730173012619304]
Segment Anything Model 2 (SAM2) は様々なピンホール画像分割タスクにおいて強力なベースモデルとして登場した。
ピンホール(70円×70円)とパノラマ画像(180円×360円)の間には、ユニークな課題がある。
本稿では,パノラマセマンティックセマンティックセグメンテーションにSAM2を適用しようとする新しいOmniSAMフレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-10T09:21:08Z) - Segment Anything without Supervision [65.93211374889196]
高速かつ自動的な全画像分割のためのUnsupervised SAM(UnSAM)を提案する。
UnSAMは、視覚シーンの階層構造を「発見」するために、分割・コンカ戦略を利用する。
教師付きSAMは自己教師付きラベルの恩恵を受けることができることを示す。
論文 参考訳(メタデータ) (2024-06-28T17:47:32Z) - BA-SAM: Scalable Bias-Mode Attention Mask for Segment Anything Model [65.92173280096588]
我々は,Segment Anything Model (SAM)における画像分解能変動の課題に対処する。
SAMはゼロショットの汎用性で知られており、さまざまな画像サイズを持つデータセットに直面するとパフォーマンスが低下する。
我々は、各トークンが隣り合う情報を優先順位付けできるバイアスモードのアテンションマスクを提案する。
論文 参考訳(メタデータ) (2024-01-04T15:34:44Z) - SAM-Deblur: Let Segment Anything Boost Image Deblurring [21.964258084389243]
本稿では,Segment Anything Model (SAM) からの事前知識をデブロア処理に組み込んだ SAM-Deblur フレームワークを提案する。
RealBlurJ、ReloBlur、REDSデータセットの実験結果から、GoProでトレーニングしたNAFNetのPSNRをそれぞれ0.05、0.96、および7.03に改善したことが明らかとなった。
論文 参考訳(メタデータ) (2023-09-05T14:33:56Z) - Segment Anything in High Quality [116.39405160133315]
そこで本研究では,SAM のプロンプト可能な設計,効率,ゼロショットの一般化性を維持しつつ,任意のオブジェクトを正確にセグメント化できる HQ-SAM を提案する。
注意深い設計はSAMの事前訓練されたモデルの重みを再利用し、保存し、最小限の追加パラメータと計算しか導入しない。
ダウンストリームタスクにまたがる10種類のセグメンテーションデータセットでHQ-SAMの有効性を示し,そのうち8つをゼロショット転送プロトコルで評価した。
論文 参考訳(メタデータ) (2023-06-02T14:23:59Z) - Mask Transfiner for High-Quality Instance Segmentation [95.74244714914052]
高品質で効率的なインスタンスセグメンテーションのためのMask Transfinerを提案する。
当社のアプローチでは, エラーが発生しやすい木ノードを検出し, エラーを並列に自己修正する。
私たちのコードとトレーニングされたモデルは、http://vis.xyz/pub/transfiner.comで公開されます。
論文 参考訳(メタデータ) (2021-11-26T18:58:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。