Fugu-MT 論文翻訳(概要): A Survey on Segment Anything Model (SAM): Vision Foundation Model Meets Prompt Engineering

論文の概要: A Survey on Segment Anything Model (SAM): Vision Foundation Model Meets Prompt Engineering

arxiv url: http://arxiv.org/abs/2306.06211v2
Date: Wed, 21 Jun 2023 01:12:29 GMT
ステータス: 翻訳完了
システム内更新日: 2023-06-22 16:56:32.250348
Title: A Survey on Segment Anything Model (SAM): Vision Foundation Model Meets Prompt Engineering
Title（参考訳）: segment anything model (sam: vision foundation model meets prompt engineering) に関する調査
Authors: Chaoning Zhang, Sheng Zheng, Chenghao Li, Yu Qiao, Taegoo Kang, Xinru Shan, Chenshuang Zhang, Caiyan Qin, Francois Rameau, Sung-Ho Bae, Choong Seon Hong
Abstract要約: Meta AI Researchが開発したSegment Any Model(SAM)が注目されている。関連論文やプロジェクトが指数関数的に増加する中、読者がSAMの開発に追いつくことは困難である。この研究はSAMに関する最初の包括的調査を実施している。
参考スコア（独自算出の注目度）: 36.6279727224853
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Segment anything model (SAM) developed by Meta AI Research has recently attracted significant attention. Trained on a large segmentation dataset of over 1 billion masks, SAM is capable of segmenting any object on a certain image. In the original SAM work, the authors turned to zero-short transfer tasks (like edge detection) for evaluating the performance of SAM. Recently, numerous works have attempted to investigate the performance of SAM in various scenarios to recognize and segment objects. Moreover, numerous projects have emerged to show the versatility of SAM as a foundation model by combining it with other models, like Grounding DINO, Stable Diffusion, ChatGPT, etc. With the relevant papers and projects increasing exponentially, it is challenging for the readers to catch up with the development of SAM. To this end, this work conducts the first yet comprehensive survey on SAM. This is an ongoing project and we intend to update the manuscript on a regular basis. Therefore, readers are welcome to contact us if they complete new works related to SAM so that we can include them in our next version.
Abstract（参考訳）: Meta AI Researchが開発したSegment Any Model(SAM)が最近注目を集めている。 10億以上のマスクからなる大きなセグメンテーションデータセットでトレーニングされたsamは、特定のイメージ上の任意のオブジェクトをセグメンテーションすることができる。オリジナルのSAM研究において、著者らはSAMの性能を評価するためにゼロショート転送タスク(エッジ検出など)に切り替えた。近年,多くの研究がSAMの性能を様々なシナリオで検証し,オブジェクトの認識とセグメント化を試みている。さらに、Grounding DINO、Stable Diffusion、ChatGPTといった他のモデルと組み合わせることで、SAMの基盤モデルとしての汎用性を示すプロジェクトも数多く現れています。関連論文やプロジェクトが指数関数的に増加する中、読者がSAMの開発に追いつくことは困難である。この目的のために、この研究はSAMに関する最初の包括的調査を実施している。これは進行中のプロジェクトであり、定期的に原稿を更新するつもりです。したがって、読者は、samに関する新しい作品が完成したら、次のバージョンに含められるように連絡を頂きたいと思います。

関連論文リスト

SAM2 for Image and Video Segmentation: A Comprehensive Survey [0.0]
画像とビデオのセグメンテーションは、医療、農業、産業検査、自動運転など幅広い分野で応用されているコンピュータビジョンの基本的なタスクである。大規模ファンデーションモデルの出現により、SAM2はセグメンテーションタスクに最適化され、複雑なシナリオにおけるパフォーマンスが向上した。本稿では,SAM2の映像・映像セグメンテーションへの応用を体系的に分析し,様々な分野での性能評価を行う。
論文参考訳（メタデータ） (2025-03-17T03:33:36Z)
Inspiring the Next Generation of Segment Anything Models: Comprehensively Evaluate SAM and SAM 2 with Diverse Prompts Towards Context-Dependent Concepts under Different Scenes [63.966251473172036]
基礎モデルSAMはコンピュータビジョンの複数の分野に影響を与えており、そのアップグレード版SAM 2はビデオセグメンテーションの能力を高めている。 SAMは、人、車、道路といったコンテキストに依存しない概念のセグメンテーションにおいて優れたパフォーマンスを示してきたが、視覚的サリエンシ、カモフラージュ、製品欠陥、医学的障害など、より困難なコンテキスト依存(CD)の概念を見落としている。自然, 医療, 産業のシーンにおいて, 11枚のCDのコンセプトを2D, 3D画像, ビデオで徹底的に定量的に評価する。
論文参考訳（メタデータ） (2024-12-02T08:03:56Z)
On Efficient Variants of Segment Anything Model: A Survey [63.127753705046]
Segment Anything Model (SAM) は画像分割タスクの基本モデルであり、多様なアプリケーションにまたがる強力な一般化で知られている。これを解決するために、精度を保ちながら効率を高めるために様々なSAM変種が提案されている。この調査は、これらの効率的なSAM変種に関する最初の包括的なレビューを提供する。
論文参考訳（メタデータ） (2024-10-07T11:59:54Z)
Multi-Scale and Detail-Enhanced Segment Anything Model for Salient Object Detection [58.241593208031816]
Segment Anything Model (SAM) は、強力なセグメンテーションと一般化機能を提供する視覚的基本モデルとして提案されている。実物検出のためのMDSAM(Multi-scale and Detail-enhanced SAM)を提案する。実験により,複数のSODデータセット上でのモデルの優れた性能が示された。
論文参考訳（メタデータ） (2024-08-08T09:09:37Z)
Segment Anything for Videos: A Systematic Survey [52.28931543292431]
最近のファンデーションモデルの波は、コンピュータビジョン(CV)などにおいて大きな成功を収めている。セグメンテーション・アズ・モデル(SAM)はタスクに依存しない視覚基盤モデルを探究する情熱を喚起した。本研究は,基礎モデル時代のビデオに対するSAMの体系的レビューを行う。
論文参考訳（メタデータ） (2024-07-31T02:24:53Z)
AlignSAM: Aligning Segment Anything Model to Open Context via Reinforcement Learning [61.666973416903005]
Segment Anything Model (SAM)は、オープンワールドシナリオにおいて、プロンプトのガイダンスによって、その印象的な一般化機能を実証した。オープンコンテキストにSAMをアライメントするための自動プロンプトのための新しいフレームワークAlignSAMを提案する。
論文参考訳（メタデータ） (2024-06-01T16:21:39Z)
Boosting Segment Anything Model Towards Open-Vocabulary Learning [69.42565443181017]
Segment Anything Model (SAM)は、新しいパラダイムビジョン基盤モデルとして登場した。 SAMは様々な領域で応用や適応を発見できるが、その主な制限はオブジェクトの意味を把握できないことである。我々は,SAMとオープン語彙オブジェクト検出器をエンドツーエンドフレームワークでシームレスに統合するSamborを提案する。
論文参考訳（メタデータ） (2023-12-06T17:19:00Z)
A Comprehensive Survey on Segment Anything Model for Vision and Beyond [7.920790211915402]
幅広いデータに基づいて訓練された基礎モデルと呼ばれる、一般的なモデルのクラスを設計することは緊急である。最近提案されたセグメンテーションモデル(SAM)は、セグメンテーションの境界を破る大きな進歩を遂げた。本稿では,SAMを含む基礎モデルの背景と用語,およびSAMと同種の最先端手法について紹介する。
論文参考訳（メタデータ） (2023-05-14T16:23:22Z)
Segment Anything Is Not Always Perfect: An Investigation of SAM on Different Real-world Applications [31.31905890353516]
最近、Meta AI Researchは、前例のない大規模なセグメンテーションデータセット(SA-1B)で事前訓練された、一般的な、プロンプト可能なセグメンテーションモデル(SAM)にアプローチしている。特に,自然画像,農業,製造業,リモートセンシング,医療などの分野において,SAMの性能に関する興味深い調査を行っている。
論文参考訳（メタデータ） (2023-04-12T10:10:03Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。