論文の概要: Take a Peek: Efficient Encoder Adaptation for Few-Shot Semantic Segmentation via LoRA
- arxiv url: http://arxiv.org/abs/2512.10521v1
- Date: Thu, 11 Dec 2025 10:47:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-12 16:15:42.327605
- Title: Take a Peek: Efficient Encoder Adaptation for Few-Shot Semantic Segmentation via LoRA
- Title(参考訳): LoRAによるFew-Shot Semantic Segmentationのための効率的なエンコーダ適応
- Authors: Pasquale De Marinis, Gennaro Vessio, Giovanna Castellano,
- Abstract要約: Few-shot semantic segmentation (FSS) は、小さなサポートセットのみを使用して、クエリイメージに新しいクラスをセグメントすることを目的としている。
我々は、FSSとクロスドメインFSSの両方のエンコーダ適応性を向上させる方法であるtextitTake a Peek (TaP)を紹介した。
- 参考スコア(独自算出の注目度): 10.406945969691781
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Few-shot semantic segmentation (FSS) aims to segment novel classes in query images using only a small annotated support set. While prior research has mainly focused on improving decoders, the encoder's limited ability to extract meaningful features for unseen classes remains a key bottleneck. In this work, we introduce \textit{Take a Peek} (TaP), a simple yet effective method that enhances encoder adaptability for both FSS and cross-domain FSS (CD-FSS). TaP leverages Low-Rank Adaptation (LoRA) to fine-tune the encoder on the support set with minimal computational overhead, enabling fast adaptation to novel classes while mitigating catastrophic forgetting. Our method is model-agnostic and can be seamlessly integrated into existing FSS pipelines. Extensive experiments across multiple benchmarks--including COCO $20^i$, Pascal $5^i$, and cross-domain datasets such as DeepGlobe, ISIC, and Chest X-ray--demonstrate that TaP consistently improves segmentation performance across diverse models and shot settings. Notably, TaP delivers significant gains in complex multi-class scenarios, highlighting its practical effectiveness in realistic settings. A rank sensitivity analysis also shows that strong performance can be achieved even with low-rank adaptations, ensuring computational efficiency. By addressing a critical limitation in FSS--the encoder's generalization to novel classes--TaP paves the way toward more robust, efficient, and generalizable segmentation systems. The code is available at https://github.com/pasqualedem/TakeAPeek.
- Abstract(参考訳): Few-shot semantic segmentation (FSS) は、小さなアノテーション付きサポートセットのみを使用して、クエリイメージに新しいクラスをセグメントすることを目的としている。
従来の研究は主にデコーダの改善に重点を置いてきたが、エンコーダの未確認クラスの意味のある特徴を抽出する能力は依然として重要なボトルネックである。
本研究では,FSS とクロスドメイン FSS (CD-FSS) の両方に対するエンコーダ適応性を向上する,単純かつ効果的な方法である \textit{Take a Peek} (TaP) を紹介する。
TaPはLoRA(Lo-Rank Adaptation)を利用して、最小の計算オーバーヘッドでサポートセットのエンコーダを微調整し、破滅的な忘れを軽減しつつ、新しいクラスへの高速な適応を可能にする。
提案手法はモデルに依存しないため,既存のFSSパイプラインにシームレスに統合できる。
COCO 20^i$、Pascal 5,^i$、DeepGlobe、ISIC、Chest X-rayといったクロスドメインデータセットを含む複数のベンチマークにわたる大規模な実験により、TaPはさまざまなモデルやショット設定のセグメンテーション性能を一貫して改善している。
特に、TaPは複雑なマルチクラスシナリオにおいて大きな利益をもたらし、現実的な設定における実用性を強調している。
ランク感度解析により、低ランク適応でも高い性能が得られ、計算効率が保証される。
エンコーダの新しいクラスへの一般化は、より堅牢で効率的で一般化可能なセグメンテーションシステムへの道を開く。
コードはhttps://github.com/pasqualedem/TakeAPeek.comで入手できる。
関連論文リスト
- Rethinking Autoregressive Models for Lossless Image Compression via Hierarchical Parallelism and Progressive Adaptation [75.58269386927076]
自己回帰(AR)モデルは、しばしば計算コストの禁止のために非現実的に除外される。
この研究は、階層的並列性とプログレッシブ適応に基づくフレームワークを導入して、このパラダイムを再考する。
各種データセット(自然,衛星,医療)の実験により,本手法が新たな最先端圧縮を実現することを確認した。
論文 参考訳(メタデータ) (2025-11-14T06:27:58Z) - GLiClass: Generalist Lightweight Model for Sequence Classification Tasks [49.2639069781367]
本稿では,シーケンス分類タスクにGLiNERアーキテクチャを適用する新しい手法であるGLiClassを提案する。
提案手法は,ゼロショットおよび少数ショット学習シナリオに必要な柔軟性を維持しつつ,埋め込み方式に匹敵する高い精度と効率を実現する。
論文 参考訳(メタデータ) (2025-08-11T06:22:25Z) - Rethinking Few-shot 3D Point Cloud Semantic Segmentation [62.80639841429669]
本稿では,FS-PCSによる3Dポイント・クラウドセマンティックセマンティックセグメンテーションについて再検討する。
我々は、最先端の2つの重要な問題、前景の漏洩とスパースポイントの分布に焦点をあてる。
これらの問題に対処するために、新しいベンチマークを構築するための標準化されたFS-PCS設定を導入する。
論文 参考訳(メタデータ) (2024-03-01T15:14:47Z) - Adaptive FSS: A Novel Few-Shot Segmentation Framework via Prototype
Enhancement [6.197356908000006]
Few-Shot (FSS) は、いくつかの注釈付き画像を用いて、新しいクラスセグメンテーションタスクを達成することを目的としている。
本稿では,既存のFSSモデルを新しいクラスに効率的に適応できるアダプタ機構,すなわちAdaptive FSSに基づく新しいフレームワークを提案する。
我々のアプローチは、エンコーダの層間にPAMを挿入するだけで、異なるバックボーンを持つ多様なFSSメソッドと互換性がある。
論文 参考訳(メタデータ) (2023-12-25T14:03:38Z) - Learning What Not to Segment: A New Perspective on Few-Shot Segmentation [63.910211095033596]
近年では、FSS ( few-shot segmentation) が広く開発されている。
本稿では,問題を緩和するための新鮮で直接的な知見を提案する。
提案されたアプローチのユニークな性質を踏まえて、より現実的で挑戦的な設定にまで拡張する。
論文 参考訳(メタデータ) (2022-03-15T03:08:27Z) - Large-scale Optimization of Partial AUC in a Range of False Positive
Rates [51.12047280149546]
ROC曲線 (AUC) の下の領域は、機械学習において最も広く使われている分類モデルのパフォーマンス指標の1つである。
近年の封筒平滑化技術に基づく効率的な近似勾配降下法を開発した。
提案アルゴリズムは,効率のよい解法を欠くランク付けされた範囲損失の和を最小化するためにも利用できる。
論文 参考訳(メタデータ) (2022-03-03T03:46:18Z) - Prior Guided Feature Enrichment Network for Few-Shot Segmentation [64.91560451900125]
最先端のセマンティックセグメンテーション手法は、良い結果を得るために十分なラベル付きデータを必要とする。
少数のラベル付きサポートサンプルを持つ新しいクラスに迅速に適応するモデルを学習することで,この問題に対処するためのショットセグメンテーションが提案されている。
これらのフレームワークは、高レベルのセマンティック情報の不適切な使用により、目に見えないクラスにおける一般化能力の低下という課題に直面している。
論文 参考訳(メタデータ) (2020-08-04T10:41:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。