Fugu-MT 論文翻訳(概要): An Empirical Study on the Robustness of the Segment Anything Model (SAM)

論文の概要: An Empirical Study on the Robustness of the Segment Anything Model (SAM)

arxiv url: http://arxiv.org/abs/2305.06422v2
Date: Tue, 23 May 2023 20:50:07 GMT
ステータス: 翻訳完了
システム内更新日: 2023-05-26 01:14:36.622971
Title: An Empirical Study on the Robustness of the Segment Anything Model (SAM)
Title（参考訳）: Segment Anything Model(SAM)のロバスト性に関する実証的研究
Authors: Yuqing Wang, Yun Zhao, Linda Petzold
Abstract要約: Segment Anything Model (SAM) は一般的な画像分割の基礎モデルである。本研究では,多様な実環境下でSAMの包括的ロバストネス調査を行う。実験結果からSAMの性能は摂動画像下では一般的に低下することが示された。プロンプトのテクニックをカスタマイズし、各データセットのユニークな特徴に基づいてドメイン知識を活用することで、モデルの摂動に対するレジリエンスを向上させることができる。
参考スコア（独自算出の注目度）: 12.128991867050487
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: The Segment Anything Model (SAM) is a foundation model for general image segmentation. Although it exhibits impressive performance predominantly on natural images, understanding its robustness against various image perturbations and domains is critical for real-world applications where such challenges frequently arise. In this study we conduct a comprehensive robustness investigation of SAM under diverse real-world conditions. Our experiments encompass a wide range of image perturbations. Our experimental results demonstrate that SAM's performance generally declines under perturbed images, with varying degrees of vulnerability across different perturbations. By customizing prompting techniques and leveraging domain knowledge based on the unique characteristics of each dataset, the model's resilience to these perturbations can be enhanced, addressing dataset-specific challenges. This work sheds light on the limitations and strengths of SAM in real-world applications, promoting the development of more robust and versatile image segmentation solutions.
Abstract（参考訳）: Segment Anything Model (SAM) は一般的な画像分割の基礎モデルである。主に自然画像に印象的な性能を示すが、様々な画像摂動や領域に対する堅牢性を理解することは、そのような課題が頻繁に発生する現実世界のアプリケーションにとって重要である。本研究では,多様な実環境下でSAMの包括的ロバストネス調査を行う。我々の実験は幅広い画像摂動を包含している。実験結果から,samの性能は画像の摂動によって低下し,異なる摂動にまたがる脆弱性の程度が異なることが明らかとなった。プロンプトテクニックをカスタマイズし、各データセットのユニークな特性に基づいてドメイン知識を活用することで、これらの摂動に対するモデルのレジリエンスを高め、データセット固有の課題に対処することができる。この研究は、現実世界のアプリケーションにおけるSAMの限界と強みに光を当て、より堅牢で汎用的な画像分割ソリューションの開発を促進する。

関連論文リスト

Dereflection Any Image with Diffusion Priors and Diversified Data [86.15504914121226]
本稿では、効率的なデータ準備パイプラインと、頑健な反射除去のための一般化可能なモデルを備えた包括的解を提案する。まず、ターゲットシーンでランダムに回転する反射媒体によって生成された横反射除去(DRR)というデータセットを紹介する。第2に、決定論的出力と高速推論のための1ステップ拡散を伴う拡散に基づくフレームワークを提案する。
論文参考訳（メタデータ） (2025-03-21T17:48:14Z)
Segment Any-Quality Images with Generative Latent Space Enhancement [23.05638803781018]
低画質画像のロバスト性を高めるため,GleSAMを提案する。潜伏拡散の概念をSAMベースのセグメンテーションフレームワークに適用する。また,事前学習した拡散モデルとセグメンテーションフレームワークとの互換性を改善するための2つの手法を導入する。
論文参考訳（メタデータ） (2025-03-16T13:58:13Z)
UrbanSAM: Learning Invariance-Inspired Adapters for Segment Anything Models in Urban Construction [51.54946346023673]
都市形態は本質的に複雑で、様々な形状と様々なスケールの不規則な物体がある。 Segment Anything Model (SAM) は複雑なシーンのセグメンテーションにおいて大きな可能性を示している。本研究では,複雑な都市環境の分析に特化して設計されたSAMのカスタマイズ版であるUrbanSAMを提案する。
論文参考訳（メタデータ） (2025-02-21T04:25:19Z)
Quantifying the Limits of Segmentation Foundation Models: Modeling Challenges in Segmenting Tree-Like and Low-Contrast Objects [13.311084447321234]
本研究は,対象樹状度とテクスチュラルセパビリティを定量化するための解釈可能な指標を提案する。慎重に制御された合成実験と実世界のデータセットにおいて、SFMの性能はこれらの要因と顕著に相関していることを示す。モデルでは局所構造をグローバルなテクスチャと誤解釈し、過剰なセグメンテーションや類似した背景からのオブジェクトの識別が困難になる。
論文参考訳（メタデータ） (2024-12-05T15:25:51Z)
Promptable Anomaly Segmentation with SAM Through Self-Perception Tuning [63.55145330447408]
Segment Anything Model (SAM) は、その顕著な一般化能力により、異常セグメンテーションタスクにおいて大きな進歩を遂げている。 SAMを直接適用する既存のメソッドは、しばしばドメインシフトの問題を見落としている。本稿では, SAMの異常セグメンテーションに対する知覚能力を高めることを目的とした, 自己パーセプティノンチューニング(SPT)手法を提案する。
論文参考訳（メタデータ） (2024-11-26T08:33:25Z)
On Efficient Variants of Segment Anything Model: A Survey [63.127753705046]
Segment Anything Model (SAM) は画像分割タスクの基本モデルであり、多様なアプリケーションにまたがる強力な一般化で知られている。これを解決するために、精度を保ちながら効率を高めるために様々なSAM変種が提案されている。この調査は、これらの効率的なSAM変種に関する最初の包括的なレビューを提供する。
論文参考訳（メタデータ） (2024-10-07T11:59:54Z)
RobustSAM: Segment Anything Robustly on Degraded Images [19.767828436963317]
Segment Anything Model (SAM) は画像セグメンテーションにおける変換的アプローチとして登場した。低画質画像におけるSAMの性能を向上させるRobust Segment Anything Model (RobustSAM)を提案する。提案手法は, SAMに基づくダウンストリームタスクにおいて, 単一画像のデハージングやデブロアリングなどの性能を効果的に向上することを目的としている。
論文参考訳（メタデータ） (2024-06-13T23:33:59Z)
Towards Evaluating the Robustness of Visual State Space Models [63.14954591606638]
視覚状態空間モデル(VSSM)は視覚知覚タスクにおいて顕著な性能を示した。しかし、自然と敵対的な摂動の下での頑丈さは依然として重要な懸念事項である。様々な摂動シナリオ下でのVSSMの頑健さを総合的に評価する。
論文参考訳（メタデータ） (2024-06-13T17:59:44Z)
ASAM: Boosting Segment Anything Model with Adversarial Tuning [9.566046692165884]
本稿では, 対角的チューニングにより基礎モデルの性能を増幅する新しい手法であるASAMを紹介する。我々は,自然言語処理における実装の成功に触発された,自然対逆例の可能性を生かした。本手法は, 対向例のフォトリアリズムを維持し, 元のマスクアノテーションとの整合性を確保する。
論文参考訳（メタデータ） (2024-05-01T00:13:05Z)
Rotated Multi-Scale Interaction Network for Referring Remote Sensing Image Segmentation [63.15257949821558]
Referring Remote Sensing Image (RRSIS)は、コンピュータビジョンと自然言語処理を組み合わせた新しい課題である。従来の参照画像(RIS)アプローチは、空中画像に見られる複雑な空間スケールと向きによって妨げられている。本稿ではRMSIN(Rotated Multi-Scale Interaction Network)を紹介する。
論文参考訳（メタデータ） (2023-12-19T08:14:14Z)
Improving the Generalization of Segmentation Foundation Model under Distribution Shift via Weakly Supervised Adaptation [43.759808066264334]
本稿では,アンカー正規化と低ランク微調整を併用した弱教師付き自己学習アーキテクチャを提案する。本研究では, 自然浄化・破損画像, 医用画像, カモフラージュ画像, ロボット画像など, 5種類の下流セグメンテーションタスクの有効性を検証した。
論文参考訳（メタデータ） (2023-12-06T13:59:22Z)
A Survey on Segment Anything Model (SAM): Vision Foundation Model Meets Prompt Engineering [49.732628643634975]
Meta AI Researchが開発したSegment Anything Model (SAM)は、画像とビデオのセグメンテーションのための堅牢なフレームワークを提供する。このサーベイはSAMファミリーの包括的調査を提供し、SAMとSAM 2は粒度と文脈理解の進歩を強調している。
論文参考訳（メタデータ） (2023-05-12T07:21:59Z)
Segment anything, from space? [8.126645790463266]
SAM(Segment Anything Model)は、安価な入力プロンプトに基づいて、入力画像中のオブジェクトをセグメント化することができる。 SAMは通常、目標タスクで訓練された視覚モデルに似た、あるいは時として超えた認識精度を達成した。 SAMの性能が画像のオーバーヘッド問題にまで及んでいるかどうかを考察し、その開発に対するコミュニティの反応を導くのに役立てる。
論文参考訳（メタデータ） (2023-04-25T17:14:36Z)
Robust Single Image Dehazing Based on Consistent and Contrast-Assisted Reconstruction [95.5735805072852]
画像復調モデルのロバスト性を改善するための新しい密度変分学習フレームワークを提案する。具体的には、デハジングネットワークは、一貫性の規則化されたフレームワークの下で最適化されている。我々の手法は最先端のアプローチを大きく上回っている。
論文参考訳（メタデータ） (2022-03-29T08:11:04Z)
A Dataset and Benchmark Towards Multi-Modal Face Anti-Spoofing Under Surveillance Scenarios [15.296568518106763]
AFA(Feature Augment)を用いた注意ベースの顔アンチスプーフィングネットワークを提案し、低品質の顔画像に対するFASを解決します。我々のモデルは,CASIA-SURFデータセットと提案したGREAT-FASD-Sデータセットの最先端性能を実現することができる。
論文参考訳（メタデータ） (2021-03-29T08:14:14Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。