論文の概要: Prompt Engineering in Segment Anything Model: Methodologies, Applications, and Emerging Challenges
- arxiv url: http://arxiv.org/abs/2507.09562v1
- Date: Sun, 13 Jul 2025 10:10:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-15 18:48:23.470797
- Title: Prompt Engineering in Segment Anything Model: Methodologies, Applications, and Emerging Challenges
- Title(参考訳): セグメンテーションモデルにおけるプロンプトエンジニアリング:方法論,応用,創発的課題
- Authors: Yidong Jiang,
- Abstract要約: Segment Anything Model (SAM)は、革新的なプロンプトベースのアプローチを通じて画像セグメンテーションに革命をもたらした。
本稿では,SAMとその変種に対する迅速な工学的手法に着目した,最初の総合的な調査について述べる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The Segment Anything Model (SAM) has revolutionized image segmentation through its innovative prompt-based approach, yet the critical role of prompt engineering in its success remains underexplored. This paper presents the first comprehensive survey focusing specifically on prompt engineering techniques for SAM and its variants. We systematically organize and analyze the rapidly growing body of work in this emerging field, covering fundamental methodologies, practical applications, and key challenges. Our review reveals how prompt engineering has evolved from simple geometric inputs to sophisticated multimodal approaches, enabling SAM's adaptation across diverse domains including medical imaging and remote sensing. We identify unique challenges in prompt optimization and discuss promising research directions. This survey fills an important gap in the literature by providing a structured framework for understanding and advancing prompt engineering in foundation models for segmentation.
- Abstract(参考訳): SAM(Segment Anything Model)は、革新的なプロンプトベースのアプローチを通じて画像セグメンテーションに革命をもたらしたが、その成功におけるプロンプトエンジニアリングの重要な役割は未解明のままである。
本稿では,SAMとその変種に対する迅速な工学的手法に着目した,最初の総合的な調査について述べる。
我々は、この新興分野で急速に成長している仕事の体系的組織化と分析を行い、基本的な方法論、実践的応用、そして重要な課題について論じる。
我々のレビューでは、単純な幾何学的入力から高度なマルチモーダルアプローチへの迅速なエンジニアリングの進化が明らかになり、SAMは医療画像やリモートセンシングを含む様々な領域に適応できるようになった。
我々は,迅速な最適化におけるユニークな課題を特定し,有望な研究方向性について議論する。
本調査は,セグメンテーションの基礎モデルにおける素早い工学の理解と促進のための構造化された枠組みを提供することにより,文献における重要なギャップを埋めるものである。
関連論文リスト
- A Survey of Context Engineering for Large Language Models [31.68644305980195]
この調査では、シンプルなプロンプト設計を超越する形式的な規律であるContext Engineeringを紹介します。
まず、コンテキスト検索と生成、コンテキスト処理、コンテキスト管理といった基本的なコンポーネントについて検討する。
次に、これらのコンポーネントがいかにアーキテクチャ的に統合され、洗練されたシステム実装を作成するかを探る。
論文 参考訳(メタデータ) (2025-07-17T17:50:36Z) - Vision Generalist Model: A Survey [87.49797517847132]
本稿では、ビジョンジェネラリストモデルの概要を概観し、その分野におけるその特性と能力について考察する。
関連ドメインへの簡単な探索を行い、相互接続と潜在的なシナジーに光を当てます。
論文 参考訳(メタデータ) (2025-06-11T17:23:41Z) - Large Language Model Agent: A Survey on Methodology, Applications and Challenges [88.3032929492409]
大きな言語モデル(LLM)エージェントは、目標駆動の振る舞いと動的適応能力を持ち、人工知能への重要な経路を示す可能性がある。
本調査は, LLMエージェントシステムを方法論中心の分類法により体系的に分解する。
私たちの作業は、エージェントの構築方法、コラボレーション方法、時間の経過とともにどのように進化するか、という、統一されたアーキテクチャの視点を提供します。
論文 参考訳(メタデータ) (2025-03-27T12:50:17Z) - Multimodal Chain-of-Thought Reasoning: A Comprehensive Survey [124.23247710880008]
マルチモーダルCoT (MCoT) 推論は近年大きな研究の注目を集めている。
既存のMCoT研究は、画像、ビデオ、音声、オーディオ、3D、構造化データの課題に対処する様々な手法を設計している。
我々はMCoT推論に関する最初の体系的な調査を行い、関連する基礎概念と定義を解明する。
論文 参考訳(メタデータ) (2025-03-16T18:39:13Z) - The Prompt Canvas: A Literature-Based Practitioner Guide for Creating Effective Prompts in Large Language Models [0.0]
本稿では,既存の方法論を包括的に構築し,実践者のための包括的概要を構築するためのフレームワークの構築について論じる。
本稿では,プロンプト・キャンバス(Prompt Canvas)について述べる。
論文 参考訳(メタデータ) (2024-12-06T15:35:18Z) - From Linguistic Giants to Sensory Maestros: A Survey on Cross-Modal Reasoning with Large Language Models [56.9134620424985]
クロスモーダル推論(CMR)は、より高度な人工知能システムへの進化における重要な能力として、ますます認識されている。
CMRタスクに取り組むためにLLM(Large Language Models)をデプロイする最近のトレンドは、その有効性を高めるためのアプローチの新たな主流となっている。
本調査では,LLMを用いてCMRで適用された現在の方法論を,詳細な3階層分類に分類する。
論文 参考訳(メタデータ) (2024-09-19T02:51:54Z) - Segment Anything for Videos: A Systematic Survey [52.28931543292431]
最近のファンデーションモデルの波は、コンピュータビジョン(CV)などにおいて大きな成功を収めている。
セグメンテーション・アズ・モデル(SAM)はタスクに依存しない視覚基盤モデルを探究する情熱を喚起した。
本研究は,基礎モデル時代のビデオに対するSAMの体系的レビューを行う。
論文 参考訳(メタデータ) (2024-07-31T02:24:53Z) - A Systematic Survey of Prompt Engineering in Large Language Models: Techniques and Applications [11.568575664316143]
本稿では,応用分野別に分類した,最近のプロンプト工学の進歩について概説する。
本稿では、プロンプト手法、その応用、関連するモデル、利用したデータセットについて詳述する。
この体系的な分析は、この急速に発展している分野をよりよく理解し、オープンな課題と迅速なエンジニアリングの機会を照明することによって将来の研究を促進する。
論文 参考訳(メタデータ) (2024-02-05T19:49:13Z) - A Survey on Segment Anything Model (SAM): Vision Foundation Model Meets Prompt Engineering [49.732628643634975]
Meta AI Researchが開発したSegment Anything Model (SAM)は、画像とビデオのセグメンテーションのための堅牢なフレームワークを提供する。
このサーベイはSAMファミリーの包括的調査を提供し、SAMとSAM 2は粒度と文脈理解の進歩を強調している。
論文 参考訳(メタデータ) (2023-05-12T07:21:59Z) - Evolutionary Multitask Optimization: a Methodological Overview,
Challenges and Future Research Directions [8.14509634354919]
一つの探索プロセスを実行することで、複数の最適化問題を同時に解くという文脈でマルチタスクを考える。
進化的マルチタスクの新たなパラダイムは、進化的計算から引き出されたインスピレーションの概念を用いて、マルチタスク最適化のシナリオに取り組む。
論文 参考訳(メタデータ) (2021-02-04T11:48:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。