Fugu-MT 論文翻訳(概要): FS-SAM2: Adapting Segment Anything Model 2 for Few-Shot Semantic Segmentation via Low-Rank Adaptation

論文の概要: FS-SAM2: Adapting Segment Anything Model 2 for Few-Shot Semantic Segmentation via Low-Rank Adaptation

arxiv url: http://arxiv.org/abs/2509.12105v1
Date: Mon, 15 Sep 2025 16:32:31 GMT
ステータス: 翻訳完了
システム内更新日: 2025-09-16 17:26:23.400435
Title: FS-SAM2: Adapting Segment Anything Model 2 for Few-Shot Semantic Segmentation via Low-Rank Adaptation
Title（参考訳）: FS-SAM2:低ランク適応によるFew-Shot Semantic Segmentationのためのセグメンテーションモデル2の適応
Authors: Bernardo Forni, Gabriele Lombardi, Federico Pozzi, Mirco Planamente,
Abstract要約: SAM2(FS-SAM2)に基づくFew-Shotセグメンテーション手法を提案する。標準データセットで典型的に見られる多様な画像を扱うために,Low-Rank Adaptation (LoRA) を元のモジュールに適用する。 PASCAL-5$i$, COCO-20$i$, FSS-1000データセット上でFS-SAM2を評価する。
参考スコア（独自算出の注目度）: 1.223288032755885
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Few-shot semantic segmentation has recently attracted great attention. The goal is to develop a model capable of segmenting unseen classes using only a few annotated samples. Most existing approaches adapt a pre-trained model by training from scratch an additional module. Achieving optimal performance with these approaches requires extensive training on large-scale datasets. The Segment Anything Model 2 (SAM2) is a foundational model for zero-shot image and video segmentation with a modular design. In this paper, we propose a Few-Shot segmentation method based on SAM2 (FS-SAM2), where SAM2's video capabilities are directly repurposed for the few-shot task. Moreover, we apply a Low-Rank Adaptation (LoRA) to the original modules in order to handle the diverse images typically found in standard datasets, unlike the temporally connected frames used in SAM2's pre-training. With this approach, only a small number of parameters is meta-trained, which effectively adapts SAM2 while benefiting from its impressive segmentation performance. Our method supports any K-shot configuration. We evaluate FS-SAM2 on the PASCAL-5$^i$, COCO-20$^i$ and FSS-1000 datasets, achieving remarkable results and demonstrating excellent computational efficiency during inference. Code is available at https://github.com/fornib/FS-SAM2
Abstract（参考訳）: セマンティックセグメンテーションは近年注目されている。ゴールは、いくつかのアノテーション付きサンプルを使用して、目に見えないクラスをセグメント化できるモデルを開発することである。既存のアプローチのほとんどは、追加モジュールをスクラッチからトレーニングすることで、事前トレーニングされたモデルを適用する。これらのアプローチで最適なパフォーマンスを達成するには、大規模なデータセットの広範なトレーニングが必要である。 Segment Anything Model 2 (SAM2) はゼロショット画像とビデオセグメンテーションの基本モデルである。本稿では,SAM2(FS-SAM2)に基づくFew-Shotセグメンテーション手法を提案する。さらに、SAM2の事前トレーニングで使用される時間的に接続されたフレームとは異なり、標準データセットで典型的に見られる多様な画像を扱うために、ローランド適応(LoRA)を元のモジュールに適用する。このアプローチでは,少数のパラメータのみをメタトレーニングし,SAM2を効果的に適用すると同時に,セグメンテーション性能も向上する。我々の方法はどんなKショット構成もサポートします。本研究では, PASCAL-5$^i$, COCO-20$^i$, FSS-1000データセット上でFS-SAM2を評価し, 予測において優れた計算効率を示す。コードはhttps://github.com/fornib/FS-SAM2で公開されている。

論文の概要: FS-SAM2: Adapting Segment Anything Model 2 for Few-Shot Semantic Segmentation via Low-Rank Adaptation

関連論文リスト