論文の概要: DistillFSS: Synthesizing Few-Shot Knowledge into a Lightweight Segmentation Model
- arxiv url: http://arxiv.org/abs/2512.05613v1
- Date: Fri, 05 Dec 2025 10:54:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-13 22:40:56.998066
- Title: DistillFSS: Synthesizing Few-Shot Knowledge into a Lightweight Segmentation Model
- Title(参考訳): DistillFSS: 軽量セグメンテーションモデルにFew-Shot知識を合成する
- Authors: Pasquale De Marinis, Pieter M. Blok, Uzay Kaymak, Rogier Brussee, Gennaro Vessio, Giovanna Castellano,
- Abstract要約: Cross-Domain Few-Shot Semantics (CD-FSS) は未知のクラスを未知の領域に分割する。
モデルパラメータに直接サポートセットの知識を組み込むフレームワークであるDistillFSSを提案する。
学生ネットワーク内の専用レイヤに数ショットの推論を内部化することにより、DistillFSSはテスト時にイメージをサポートする必要をなくすことができる。
- 参考スコア(独自算出の注目度): 8.487765630753048
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Cross-Domain Few-Shot Semantic Segmentation (CD-FSS) seeks to segment unknown classes in unseen domains using only a few annotated examples. This setting is inherently challenging: source and target domains exhibit substantial distribution shifts, label spaces are disjoint, and support images are scarce--making standard episodic methods unreliable and computationally demanding at test time. To address these constraints, we propose DistillFSS, a framework that embeds support-set knowledge directly into a model's parameters through a teacher--student distillation process. By internalizing few-shot reasoning into a dedicated layer within the student network, DistillFSS eliminates the need for support images at test time, enabling fast, lightweight inference, while allowing efficient extension to novel classes in unseen domains through rapid teacher-driven specialization. Combined with fine-tuning, the approach scales efficiently to large support sets and significantly reduces computational overhead. To evaluate the framework under realistic conditions, we introduce a new CD-FSS benchmark spanning medical imaging, industrial inspection, and remote sensing, with disjoint label spaces and variable support sizes. Experiments show that DistillFSS matches or surpasses state-of-the-art baselines, particularly in multi-class and multi-shot scenarios, while offering substantial efficiency gains. The code is available at https://github.com/pasqualedem/DistillFSS.
- Abstract(参考訳): Cross-Domain Few-Shot Semantic Segmentation (CD-FSS) は、いくつかの注釈付き例を使って未知のクラスを未知の領域に分割しようと試みている。
ソースドメインとターゲットドメインは実質的な分散シフトを示し、ラベル空間は分離され、サポートイメージは不足している。
このような制約に対処するため,教師による蒸留プロセスを通じて,サポートセットの知識を直接モデルのパラメータに組み込むフレームワークであるDistillFSSを提案する。
学生ネットワーク内の専用レイヤに数ショットの推論を内包することで、DistillFSSはテスト時のイメージサポートの必要性を排除し、高速で軽量な推論を可能にし、教師主導の迅速な特殊化を通じて、目に見えない領域の新規クラスへの効率的な拡張を可能にした。
微調整と組み合わせて、大規模なサポートセットに効率よくスケールし、計算オーバーヘッドを大幅に削減する。
本手法を現実的な条件下で評価するために,医療画像,産業検査,リモートセンシングにまたがる新しいCD-FSSベンチマークを導入する。
実験の結果、DistillFSSは最先端のベースライン、特にマルチクラスやマルチショットのシナリオと一致し、大幅な効率向上を提供することがわかった。
コードはhttps://github.com/pasqualedem/DistillFSSで公開されている。
関連論文リスト
- Take a Peek: Efficient Encoder Adaptation for Few-Shot Semantic Segmentation via LoRA [10.406945969691781]
Few-shot semantic segmentation (FSS) は、小さなサポートセットのみを使用して、クエリイメージに新しいクラスをセグメントすることを目的としている。
我々は、FSSとクロスドメインFSSの両方のエンコーダ適応性を向上させる方法であるtextitTake a Peek (TaP)を紹介した。
論文 参考訳(メタデータ) (2025-12-11T10:47:01Z) - Multiple Stochastic Prompt Tuning for Few-shot Adaptation under Extreme Domain Shift [14.85375816073596]
クラス毎に複数の学習可能なプロンプトを導入し,分布シフトによる視覚表現の多様なモードをキャプチャする。
これらのプロンプトは学習可能なガウス分布としてモデル化され、プロンプトパラメータ空間の効率的な探索を可能にする。
実験と最先端手法との比較により,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2025-06-04T13:18:04Z) - Adapting In-Domain Few-Shot Segmentation to New Domains without Retraining [53.963279865355105]
クロスドメイン小ショットセグメンテーション(CD-FSS)は、新しいドメインで新しいクラスのオブジェクトをセグメンテーションすることを目的としている。
多くのCD-FSSメソッドは、様々なドメイン一般化手法を用いて、ドメイン内FSSモデルを再設計し、再訓練する。
そこで,本研究では,FSSモデルを対象ドメインに適応させ,少数ショットラベル付きサポートサンプルからドメイン特性を学習する手法を提案する。
論文 参考訳(メタデータ) (2025-04-30T08:16:33Z) - TAVP: Task-Adaptive Visual Prompt for Cross-domain Few-shot Segmentation [40.49924427388922]
本稿では,CD-FSS(Cross-dominan Few-shot segmentation)のためのタスク適応型自動視覚プロンプトフレームワークを提案する。
クラスドメインタスク適応オートプロンプト(CDTAP)モジュールを組み込んで、クラスドメインの特徴抽出を可能にし、高品質で学習可能なビジュアルプロンプトを生成する。
本モデルでは,1ショット設定では1.3%,5ショット設定では11.76%の精度向上を実現し,最先端のCD-FSS手法よりも優れていた。
論文 参考訳(メタデータ) (2024-09-09T07:43:58Z) - Adapt Before Comparison: A New Perspective on Cross-Domain Few-Shot Segmentation [0.0]
クロスドメイン小ショットセグメンテーション (CD-FSS) が登場した。
テスト時間タスク適応がCD-FSSの成功の鍵であることを示す。
テスト時にラベル付きサンプル以外の画像は使用しないが,CD-FSSでは新たな最先端性能を実現している。
論文 参考訳(メタデータ) (2024-02-27T15:43:53Z) - Cap2Aug: Caption guided Image to Image data Augmentation [41.53127698828463]
Cap2Augは、画像キャプションをテキストプロンプトとして使用する画像から画像への拡散モデルに基づくデータ拡張戦略である。
限られた訓練画像からキャプションを生成し,これらのキャプションを用いて画像間安定拡散モデルを用いてトレーニング画像を編集する。
この戦略は、トレーニング画像に似た画像の拡張バージョンを生成するが、サンプル全体にわたって意味的な多様性を提供する。
論文 参考訳(メタデータ) (2022-12-11T04:37:43Z) - Disentangled Feature Representation for Few-shot Image Classification [64.40410801469106]
そこで本研究では,DFRと呼ばれる新しいDistangled Feature Representationフレームワークを提案する。
DFRは、分類枝によってモデル化される識別的特徴を、変動枝のクラス非関連成分から適応的に分離することができる。
一般的に、一般的な深層数ショット学習手法のほとんどが分類ブランチとしてプラグインできるため、DFRは様々な数ショットタスクのパフォーマンスを向上させることができる。
論文 参考訳(メタデータ) (2021-09-26T09:53:11Z) - Generalized Few-shot Semantic Segmentation [68.69434831359669]
本稿では,GFS-Seg(Generalized Few-Shot Semantic)と呼ばれる新しいベンチマークを導入する。
GFS-セグにおいて、先行する最先端の一般化が不足していることを示す最初の研究である。
本研究では,1)支援サンプルから共起前の知識を活用すること,2)各クエリ画像の内容に基づいて条件付き情報に動的に拡張することにより,性能を著しく向上するコンテキスト認識型プロトタイプ学習(CAPL)を提案する。
論文 参考訳(メタデータ) (2020-10-11T10:13:21Z) - Region Comparison Network for Interpretable Few-shot Image
Classification [97.97902360117368]
新しいクラスのモデルをトレーニングするために、ラベル付きサンプルの限られた数だけを効果的に活用するための画像分類が提案されている。
本研究では,領域比較ネットワーク (RCN) と呼ばれる距離学習に基づく手法を提案する。
また,タスクのレベルからカテゴリへの解釈可能性の一般化も提案する。
論文 参考訳(メタデータ) (2020-09-08T07:29:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。