論文の概要: Training-Free Fine-Grained Semantic Segmentations in Low Data Regimes: A FungiTastic Baseline
- arxiv url: http://arxiv.org/abs/2605.22492v1
- Date: Thu, 21 May 2026 13:44:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-22 16:35:42.281409
- Title: Training-Free Fine-Grained Semantic Segmentations in Low Data Regimes: A FungiTastic Baseline
- Title(参考訳): 低データレジームにおける無訓練微粒セマンティックセマンティックセマンティックセグメンテーション:ファンギタスティックベースライン
- Authors: Sebastian Cavada, Francesco Pelosin, Lapo Faggi,
- Abstract要約: 微粒なセマンティックセグメンテーションは、視覚的に類似したクラス間の正確な局所化と識別の両方を必要とする。
FungiTasticでは、この問題は長い尾の分布と画像取得条件の強い変動によってさらに複雑になる。
分類からセグメンテーションを分離する学習自由な2段階フレームワークを提案する。
- 参考スコア(独自算出の注目度): 2.4388965927178767
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Fine-grained semantic segmentation requires both precise localization and discrimination between visually similar classes. In FungiTastic, this problem is further complicated by a long-tailed distribution and strong variation in image acquisition conditions. We propose a training-free two-stage framework that decouples segmentation from classification. SAM3 first produces class-agnostic mushroom masks using macro-taxonomic prompts, and DINOv3 then assigns fine-grained labels through prototype matching in the embedding space. To improve this stage, we apply a simple transformation of the DINOv3 feature space that improves prototype-based classification. Compared with class-specific prompting, our approach is more scalable and keeps the segmentation cost low. We report results from one-shot to few-hundred-shot regimes, providing, to the best of our knowledge, the first baseline for fine-grained semantic segmentation in low-data settings.
- Abstract(参考訳): 微粒なセマンティックセグメンテーションは、視覚的に類似したクラス間の正確な局所化と識別の両方を必要とする。
FungiTasticでは、この問題は長い尾の分布と画像取得条件の強い変動によってさらに複雑になる。
分類からセグメンテーションを分離する学習自由な2段階フレームワークを提案する。
SAM3はまずマクロタコノミクスプロンプトを用いてクラス非依存のキノコマスクを生産し、その後DINOv3は埋め込み空間のプロトタイプマッチングを通じてきめ細かいラベルを割り当てる。
この段階を改善するために、プロトタイプベースの分類を改善するDINOv3特徴空間の簡単な変換を適用する。
クラス固有のプロンプトと比較して、我々のアプローチはよりスケーラブルであり、セグメンテーションコストを低く保ちます。
我々は、一発から数発のレギュレーションの結果を報告し、私たちの知る限り、低データのセマンティックセマンティックセグメンテーションのための最初のベースラインを提供する。
関連論文リスト
- Binary-Gaussian: Compact and Progressive Representation for 3D Gaussian Segmentation [83.90109373769614]
3D Gaussian Splatting (3D-GS)は効率的な3D表現として登場し、セグメンテーションのようなセグメンテーションタスクのための有望な基盤となっている。
本稿では,各特徴を2進数対決定写像によって1つの整数に圧縮する,ガウス単位のカテゴリ表現のための粗大なバイナリ符号化方式を提案する。
さらに,個別のサブタスクに分割し,クラス間の衝突を減らし,きめ細かいセグメンテーション能力を向上させるプログレッシブトレーニング戦略を設計する。
論文 参考訳(メタデータ) (2025-11-30T15:51:30Z) - Center-guided Classifier for Semantic Segmentation of Remote Sensing Images [2.803715177543843]
CenterSegはリモートセンシング画像のセマンティックセグメンテーションのための新しい分類器である。
複数のプロトタイプ、グラスマン多様体の直接監督、解釈可能性戦略の問題を解決する。
優れたパフォーマンスに加えて、CenterSegにはシンプルさ、軽量さ、互換性、解釈可能性という利点がある。
論文 参考訳(メタデータ) (2025-03-21T09:21:37Z) - SSA-Seg: Semantic and Spatial Adaptive Pixel-level Classifier for Semantic Segmentation [11.176993272867396]
本稿ではセマンティック・空間適応(SSA-Seg)を提案し,セマンティックセグメンテーションの課題に対処する。
具体的には、固定されたプロトタイプから得られた粗いマスクを用いて、テスト画像のセマンティック領域と空間領域の中心に向けて固定されたプロトタイプを調整する。
その結果,提案したSSA-Segは,計算コストを最小限に抑えながら,ベースラインモデルのセグメンテーション性能を著しく向上させることがわかった。
論文 参考訳(メタデータ) (2024-05-10T15:14:23Z) - Rethinking Few-shot 3D Point Cloud Semantic Segmentation [62.80639841429669]
本稿では,FS-PCSによる3Dポイント・クラウドセマンティックセマンティックセグメンテーションについて再検討する。
我々は、最先端の2つの重要な問題、前景の漏洩とスパースポイントの分布に焦点をあてる。
これらの問題に対処するために、新しいベンチマークを構築するための標準化されたFS-PCS設定を導入する。
論文 参考訳(メタデータ) (2024-03-01T15:14:47Z) - Class-Imbalanced Semi-Supervised Learning for Large-Scale Point Cloud
Semantic Segmentation via Decoupling Optimization [64.36097398869774]
半教師付き学習(SSL)は大規模3Dシーン理解のための活発な研究課題である。
既存のSSLベースのメソッドは、クラス不均衡とポイントクラウドデータのロングテール分布による厳しいトレーニングバイアスに悩まされている。
本稿では,特徴表現学習と分類器を別の最適化方法で切り離してバイアス決定境界を効果的にシフトする,新しいデカップリング最適化フレームワークを提案する。
論文 参考訳(メタデータ) (2024-01-13T04:16:40Z) - Understanding Imbalanced Semantic Segmentation Through Neural Collapse [81.89121711426951]
セマンティックセグメンテーションは自然に文脈的相関とクラス間の不均衡分布をもたらすことを示す。
機能中心にレギュレータを導入し、ネットワークが魅力ある構造に近い機能を学ぶことを奨励する。
我々の手法は、ScanNet200テストリーダーボードで1位にランクインし、新しい記録を樹立する。
論文 参考訳(メタデータ) (2023-01-03T13:51:51Z) - Prediction Calibration for Generalized Few-shot Semantic Segmentation [101.69940565204816]
汎用Few-shot Semantic (GFSS) は、各画像ピクセルを、豊富なトレーニング例を持つベースクラスか、クラスごとにわずかに(例: 1-5)のトレーニングイメージを持つ新しいクラスのいずれかに分割することを目的としている。
我々は、融合したマルチレベル機能を用いて、分類器の最終予測をガイドするクロスアテンションモジュールを構築する。
私たちのPCNは、最先端の代替品よりも大きなマージンで優れています。
論文 参考訳(メタデータ) (2022-10-15T13:30:12Z) - Semi-Supervised Semantic Segmentation with Pixel-Level Contrastive
Learning from a Class-wise Memory Bank [5.967279020820772]
本稿では,コントラスト学習に基づく新しい表現学習モジュールを提案する。
このモジュールはセグメンテーションネットワークを強制し、同じクラスのサンプルに対して同様のピクセルレベルの特徴表現を生成する。
エンドツーエンドのトレーニングでは、ラベル付きデータとラベルなしデータの両方の機能は、メモリバンクの同じクラスのサンプルに最適化される。
論文 参考訳(メタデータ) (2021-04-27T18:19:33Z) - Self-Supervised Tuning for Few-Shot Segmentation [82.32143982269892]
Few-shotのセグメンテーションは、アノテートされたサンプルがほとんどない各画像ピクセルにカテゴリラベルを割り当てることを目的としている。
既存のメタラーニング手法では, 画像から抽出した視覚的特徴を埋め込み空間に埋め込むと, カテゴリー別識別記述子の生成に失敗する傾向にある。
本稿では,複数のエピソードにまたがる潜在特徴の分布を,自己分割方式に基づいて動的に調整する適応型フレームワークチューニングを提案する。
論文 参考訳(メタデータ) (2020-04-12T03:53:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。