論文の概要: Fine-Grained Few Shot Learning with Foreground Object Transformation
- arxiv url: http://arxiv.org/abs/2109.05719v1
- Date: Mon, 13 Sep 2021 05:58:20 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-15 09:36:29.201408
- Title: Fine-Grained Few Shot Learning with Foreground Object Transformation
- Title(参考訳): 前景オブジェクト変換によるファイングラインドショット学習
- Authors: Chaofei Wang, Shiji Song, Qisen Yang, Xiang Li, Gao Huang
- Abstract要約: 本稿では,フォアグラウンド・オブジェクト・トランスフォーメーション(FOT)という新しい手法を提案する。
FOTは、前景オブジェクト抽出器と姿勢変換発生器とから構成される。
データ拡張法として、FOTは既存のいくつかのショット学習アルゴリズムに便利に適用できる。
- 参考スコア(独自算出の注目度): 30.565391933560782
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Traditional fine-grained image classification generally requires abundant
labeled samples to deal with the low inter-class variance but high intra-class
variance problem. However, in many scenarios we may have limited samples for
some novel sub-categories, leading to the fine-grained few shot learning
(FG-FSL) setting. To address this challenging task, we propose a novel method
named foreground object transformation (FOT), which is composed of a foreground
object extractor and a posture transformation generator. The former aims to
remove image background, which tends to increase the difficulty of fine-grained
image classification as it amplifies the intra-class variance while reduces
inter-class variance. The latter transforms the posture of the foreground
object to generate additional samples for the novel sub-category. As a data
augmentation method, FOT can be conveniently applied to any existing few shot
learning algorithm and greatly improve its performance on FG-FSL tasks. In
particular, in combination with FOT, simple fine-tuning baseline methods can be
competitive with the state-of-the-art methods both in inductive setting and
transductive setting. Moreover, FOT can further boost the performances of
latest excellent methods and bring them up to the new state-of-the-art. In
addition, we also show the effectiveness of FOT on general FSL tasks.
- Abstract(参考訳): 従来のきめ細かい画像分類では、クラス間のばらつきは低いがクラス間のばらつきは高い。
しかし、多くのシナリオでは、いくつかの新しいサブカテゴリのサンプルが限られており、FG-FSLの設定がきめ細かいものになっている。
この課題に対処するため,フォアグラウンドオブジェクト抽出器と姿勢変換生成器を組み合わせた,フォアグラウンドオブジェクト変換(FOT)と呼ばれる新しい手法を提案する。
前者は画像背景を除去することを目的としており、クラス間のばらつきを低減しつつクラス内のばらつきを増幅することにより、きめ細かい画像分類の難しさを高める傾向がある。
後者は、前景オブジェクトの姿勢を変換して、新規サブカテゴリの追加サンプルを生成する。
データ拡張法として、FOTは既存のいくつかのショット学習アルゴリズムに便利に適用でき、FG-FSLタスクの性能を大幅に向上させることができる。
特に、FOTと組み合わせることで、単純な微調整のベースライン法は、インダクティブ・セッティングとトランスダクティブ・セッティングの両方において最先端の手法と競合することができる。
さらに、FOTは最新の優れたメソッドのパフォーマンスをさらに向上させ、それらを新しい最先端に引き上げることができる。
また、一般的なFSLタスクにおけるFOTの有効性を示す。
関連論文リスト
- Enhance Image Classification via Inter-Class Image Mixup with Diffusion Model [80.61157097223058]
画像分類性能を高めるための一般的な戦略は、T2Iモデルによって生成された合成画像でトレーニングセットを増強することである。
本研究では,既存のデータ拡張技術の欠点について検討する。
Diff-Mixと呼ばれる革新的なクラス間データ拡張手法を導入する。
論文 参考訳(メタデータ) (2024-03-28T17:23:45Z) - Diversified in-domain synthesis with efficient fine-tuning for few-shot
classification [64.86872227580866]
画像分類は,クラスごとのラベル付き例の小さなセットのみを用いて,画像分類器の学習を目的としている。
合成データを用いた数ショット学習における一般化問題に対処する新しいアプローチである DisEF を提案する。
提案手法を10種類のベンチマークで検証し,ベースラインを一貫して上回り,数ショット分類のための新しい最先端の手法を確立した。
論文 参考訳(メタデータ) (2023-12-05T17:18:09Z) - Exploring Efficient Few-shot Adaptation for Vision Transformers [70.91692521825405]
そこで本稿では,Few-shot LearningタスクにおけるVTの微調整を容易にするトランスフォーマーチューニング(eTT)手法を提案する。
新しく発表されたAttentive Prefix Tuning(APT)とDomain Residual Adapter(DRA)の主な新機能
我々は,我々のモデルの有効性を示す広範囲な実験を行った。
論文 参考訳(メタデータ) (2023-01-06T08:42:05Z) - Boosting Few-shot Fine-grained Recognition with Background Suppression
and Foreground Alignment [53.401889855278704]
FS-FGR (Few-shot Fine-fine Recognition) は、限られたサンプルの助けを借りて、新しいきめ細かなカテゴリを認識することを目的としている。
本研究では,背景アクティベーション抑制 (BAS) モジュール,フォアグラウンドオブジェクトアライメント (FOA) モジュール,および局所的局所的(L2L) 類似度測定器からなる2段階の背景アライメントとフォアグラウンドアライメントフレームワークを提案する。
複数のベンチマークで行った実験により,提案手法は既存の最先端技術よりも大きなマージンで優れていることが示された。
論文 参考訳(メタデータ) (2022-10-04T07:54:40Z) - Ortho-Shot: Low Displacement Rank Regularization with Data Augmentation
for Few-Shot Learning [23.465747123791772]
少数の分類において、第一の目的は、新しいクラスをうまく一般化する表現を学ぶことである。
オルソショット(Ortho-Shot)と呼ばれる効率的な低変位ランク(LDR)正規化戦略を提案する。
論文 参考訳(メタデータ) (2021-10-18T14:58:36Z) - A Compositional Feature Embedding and Similarity Metric for
Ultra-Fine-Grained Visual Categorization [16.843126268445726]
きめ細かい視覚分類(FGVC)は、クラス間の差異が小さいオブジェクトを分類することを目的としている。
本稿では,超微細な視覚分類のための新しい構成的特徴埋め込みと類似度指標(CECS)を提案する。
最近のベンチマーク手法を用いた2つの超FGVCデータセットと1つのFGVCデータセットの実験結果から,提案手法が最先端性能を実現することを一貫して示している。
論文 参考訳(メタデータ) (2021-09-25T15:05:25Z) - Exploring Complementary Strengths of Invariant and Equivariant
Representations for Few-Shot Learning [96.75889543560497]
多くの現実世界では、多数のラベル付きサンプルの収集は不可能です。
少ないショット学習はこの問題に対処するための主要なアプローチであり、目的は限られた数のサンプルの存在下で新しいカテゴリに迅速に適応することです。
幾何学的変換の一般集合に対する等分散と不変性を同時に強制する新しい訓練機構を提案する。
論文 参考訳(メタデータ) (2021-03-01T21:14:33Z) - TOAN: Target-Oriented Alignment Network for Fine-Grained Image
Categorization with Few Labeled Samples [25.68199820110267]
本稿では,対象のクエリイメージとサポートクラスとの関係を詳細に把握するために,TOAN(Target-Oriented Alignment Network)を提案する。
各サポート画像の特徴は、埋め込み特徴空間内のクエリ特徴と一致するように変換され、各カテゴリ内での差異を明示的に低減する。
論文 参考訳(メタデータ) (2020-05-28T07:48:44Z) - AdarGCN: Adaptive Aggregation GCN for Few-Shot Learning [112.95742995816367]
FSFSLと呼ばれる新しい数発のスナップショット・ラーニング・セッティングを提案する。
FSFSLでは、ソースクラスとターゲットクラスの両方に限られたトレーニングサンプルがある。
また,無関係な画像を削除するためのグラフ畳み込みネットワーク (GCN) ベースのラベルデノイング (LDN) 手法を提案する。
論文 参考訳(メタデータ) (2020-02-28T10:34:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。