論文の概要: Stochastic-based Patch Filtering for Few-Shot Learning
- arxiv url: http://arxiv.org/abs/2508.10066v1
- Date: Wed, 13 Aug 2025 11:05:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-15 22:24:48.06566
- Title: Stochastic-based Patch Filtering for Few-Shot Learning
- Title(参考訳): Few-Shot Learningのための確率型パッチフィルタリング
- Authors: Javier Rodenas, Eduardo Aguilar, Petia Radeva,
- Abstract要約: 食品画像は、その視覚的複雑さと可変性のために、数ショットの学習モデルに固有の課題を示す。
本稿では,Few-Shot Learning (SPFF) のためのパッチフィルタを提案する。
我々は,SPFFが非関連パッチのフィルタリングに成功しながら,クラス固有の食品の特徴が最も顕著なパッチに効果的に焦点を絞っていることを実証した。
- 参考スコア(独自算出の注目度): 4.603545241878002
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Food images present unique challenges for few-shot learning models due to their visual complexity and variability. For instance, a pasta dish might appear with various garnishes on different plates and in diverse lighting conditions and camera perspectives. This problem leads to losing focus on the most important elements when comparing the query with support images, resulting in misclassification. To address this issue, we propose Stochastic-based Patch Filtering for Few-Shot Learning (SPFF) to attend to the patch embeddings that show greater correlation with the class representation. The key concept of SPFF involves the stochastic filtering of patch embeddings, where patches less similar to the class-aware embedding are more likely to be discarded. With patch embedding filtered according to the probability of appearance, we use a similarity matrix that quantifies the relationship between the query image and its respective support images. Through a qualitative analysis, we demonstrate that SPFF effectively focuses on patches where class-specific food features are most prominent while successfully filtering out non-relevant patches. We validate our approach through extensive experiments on few-shot classification benchmarks: Food-101, VireoFood-172 and UECFood-256, outperforming the existing SoA methods.
- Abstract(参考訳): 食品画像は、その視覚的複雑さと可変性のために、数ショットの学習モデルに固有の課題を示す。
例えば、パスタ料理は、様々な皿に様々なガーニッシュを施し、様々な照明条件やカメラの視点で現れることがある。
この問題は、クエリとサポートイメージを比較する際に最も重要な要素に焦点が当てられなくなり、結果として誤分類が発生します。
この問題に対処するため,Few-Shot Learning (SPFF) のための確率型パッチフィルタリングを提案する。
SPFFの鍵となる概念は、パッチ埋め込みの確率的フィルタリングである。
出現確率に応じてフィルタされたパッチ埋め込みでは、クエリ画像と各サポート画像の関係を定量化する類似度行列を用いる。
質的分析により,SPFFはクラス固有の食品の特徴が最も顕著なパッチを効果的に重視し,非関連パッチのフィルタリングに成功していることを示す。
本稿では,食品101,VireoFood-172,UECFood-256の2種類の分類ベンチマークによる大規模な評価を行い,既存のSoA法と比較した。
関連論文リスト
- Slot Attention-based Feature Filtering for Few-Shot Learning [4.603545241878002]
Slot Attention-based Feature Filtering for Few-Shot Learning (SAFF)
SAFFはスロットアテンションとパッチ・エム・ベディングを使って弱い特徴をフィルタリングする。
我々は, CIFAR-FS, FC100, miniImageNet, tieredIma geNetなど, 数発の学習ベンチマークを用いた広範囲な実験により, 本手法の有効性を検証した。
論文 参考訳(メタデータ) (2025-08-13T10:55:05Z) - Class-relevant Patch Embedding Selection for Few-Shot Image Classification [10.102079949259043]
クラス関連パッチの埋め込みを選択する新しい方法を提案する。
我々の戦略は、クラス非関連パッチ埋め込みの影響を効果的に軽減し、事前訓練されたモデルの性能を向上させる。
論文 参考訳(メタデータ) (2024-05-06T02:13:32Z) - Learning to Rank Patches for Unbiased Image Redundancy Reduction [80.93989115541966]
画像は、隣接する領域の画素が空間的に相関しているため、空間的冗長性に悩まされる。
既存のアプローチでは、意味の少ない画像領域を減らし、この制限を克服しようとしている。
本稿では,Learning to Rank Patchesと呼ばれる画像冗長性低減のための自己教師型フレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-31T13:12:41Z) - Feature-Suppressed Contrast for Self-Supervised Food Pre-training [22.48308786497061]
ビュー間の相互情報を低減するためにFeaSC(FeaSC)を提案する。
FeaSCはレスポンシブ・アウェア・スキームを使用して、教師なしの方法で健全な特徴をローカライズする。
プラグアンドプレイモジュールとして、提案手法は、BYOLとSimSiamを1.70%$sim$ 6.69%の分類精度で改善する。
論文 参考訳(メタデータ) (2023-08-07T03:27:04Z) - Masked Images Are Counterfactual Samples for Robust Fine-tuning [77.82348472169335]
微調整の深層学習モデルは、分布内(ID)性能と分布外(OOD)堅牢性の間のトレードオフにつながる可能性がある。
そこで本研究では,マスク付き画像を対物サンプルとして用いて,ファインチューニングモデルのロバスト性を向上させる新しいファインチューニング手法を提案する。
論文 参考訳(メタデータ) (2023-03-06T11:51:28Z) - Cap2Aug: Caption guided Image to Image data Augmentation [41.53127698828463]
Cap2Augは、画像キャプションをテキストプロンプトとして使用する画像から画像への拡散モデルに基づくデータ拡張戦略である。
限られた訓練画像からキャプションを生成し,これらのキャプションを用いて画像間安定拡散モデルを用いてトレーニング画像を編集する。
この戦略は、トレーニング画像に似た画像の拡張バージョンを生成するが、サンプル全体にわたって意味的な多様性を提供する。
論文 参考訳(メタデータ) (2022-12-11T04:37:43Z) - Probabilistic Deep Metric Learning for Hyperspectral Image
Classification [91.5747859691553]
本稿では,ハイパースペクトル画像分類のための確率論的深度学習フレームワークを提案する。
ハイパースペクトルセンサーが捉えた画像に対して、各ピクセルのカテゴリを予測することを目的としている。
我々のフレームワークは、既存のハイパースペクトル画像分類法に容易に適用できる。
論文 参考訳(メタデータ) (2022-11-15T17:57:12Z) - Exploring Negatives in Contrastive Learning for Unpaired Image-to-Image
Translation [12.754320302262533]
我々は、パッチをスペーシングし、ランキング付けすることで、アンペア画像から画像への変換(PUT)のための新しい負のプルーニング技術を導入する。
提案アルゴリズムは効率的で柔軟で,対応するパッチ間で本質的な情報を安定的に学習することができる。
論文 参考訳(メタデータ) (2022-04-23T08:31:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。