論文の概要: Few-shot Image Classification based on Gradual Machine Learning
- arxiv url: http://arxiv.org/abs/2307.15524v1
- Date: Fri, 28 Jul 2023 12:30:41 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-31 12:35:23.538402
- Title: Few-shot Image Classification based on Gradual Machine Learning
- Title(参考訳): 段階的機械学習に基づくマイナショット画像分類
- Authors: Na Chen, Xianming Kuang, Feiyu Liu, Kehao Wang and Qun Chen
- Abstract要約: 少ないショット画像分類は、ラベル付きサンプルのみを使用してラベル付きイメージを正確に分類することを目的としている。
段階的機械学習(GML)の非i.dパラダイムに基づく新しいアプローチを提案する。
提案手法は精度でSOTAの性能を1-5%向上させることができることを示す。
- 参考スコア(独自算出の注目度): 6.935034849731568
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Few-shot image classification aims to accurately classify unlabeled images
using only a few labeled samples. The state-of-the-art solutions are built by
deep learning, which focuses on designing increasingly complex deep backbones.
Unfortunately, the task remains very challenging due to the difficulty of
transferring the knowledge learned in training classes to new ones. In this
paper, we propose a novel approach based on the non-i.i.d paradigm of gradual
machine learning (GML). It begins with only a few labeled observations, and
then gradually labels target images in the increasing order of hardness by
iterative factor inference in a factor graph. Specifically, our proposed
solution extracts indicative feature representations by deep backbones, and
then constructs both unary and binary factors based on the extracted features
to facilitate gradual learning. The unary factors are constructed based on
class center distance in an embedding space, while the binary factors are
constructed based on k-nearest neighborhood. We have empirically validated the
performance of the proposed approach on benchmark datasets by a comparative
study. Our extensive experiments demonstrate that the proposed approach can
improve the SOTA performance by 1-5% in terms of accuracy. More notably, it is
more robust than the existing deep models in that its performance can
consistently improve as the size of query set increases while the performance
of deep models remains essentially flat or even becomes worse.
- Abstract(参考訳): 少ないショット画像分類は、ラベル付きサンプルのみを使用してラベル付きイメージを正確に分類することを目的としている。
最先端のソリューションは、ますます複雑な深いバックボーンの設計に焦点を当てたディープラーニングによって構築される。
残念ながら、トレーニングクラスで学んだ知識を新しいものに移すことが難しいため、タスクは非常に難しいままです。
本稿では、段階的機械学習(GML)の非i.dパラダイムに基づく新しいアプローチを提案する。
わずかにラベル付けされた観測結果から始まり、因子グラフの反復係数推論によって、目標画像を徐々に硬度順にラベル付けする。
具体的には,提案手法は深部骨による表現的特徴表現を抽出し,抽出した特徴に基づいて一意的特徴と二元的要因の両方を構築し,段階的学習を容易にする。
単項因子は埋め込み空間内のクラス中心距離に基づいて構成され、二項因子はk-ネアレスト近傍に基づいて構成される。
比較研究により,提案手法のベンチマークデータセットにおける性能を実証的に検証した。
提案手法は精度でSOTAの性能を1-5%向上できることを示す。
さらに注目すべきは、既存のディープモデルよりも堅牢であり、クエリセットのサイズが増大する一方、ディープモデルのパフォーマンスが本質的にフラットになるか、さらに悪化するにつれて、そのパフォーマンスが一貫して向上する。
関連論文リスト
- Evaluation of Confidence-based Ensembling in Deep Learning Image
Classification [0.6445605125467573]
Conf-EnsembleはBoostingに適応して、モデルエラーではなくモデルの信頼性に基づいたアンサンブルを生成する。
我々は、イメージNetデータセットを用いて、画像分類のより複雑なタスクにおいて、Conf-Ensembleアプローチを評価する。
論文 参考訳(メタデータ) (2023-03-03T16:29:22Z) - Fine-Grained Visual Classification using Self Assessment Classifier [12.596520707449027]
識別的特徴の抽出は、きめ細かい視覚的分類タスクにおいて重要な役割を担っている。
本稿では,画像とトップkの予測クラスを同時に活用する自己評価手法を提案する。
本手法は,CUB200-2011,Stanford Dog,FGVC Aircraft のデータセットに対して,最新の結果が得られることを示す。
論文 参考訳(メタデータ) (2022-05-21T07:41:27Z) - CAD: Co-Adapting Discriminative Features for Improved Few-Shot
Classification [11.894289991529496]
少数のラベル付きサンプルを与えられた未確認のクラスに適応できるモデルを学ぶことを目的としている。
最近のアプローチでは、特徴抽出器を事前訓練し、その後、エピソードなメタラーニングのための微調整を行う。
本研究は, 複数ショットの分類において, 横断的および再重み付き識別機能を実現するための戦略を提案する。
論文 参考訳(メタデータ) (2022-03-25T06:14:51Z) - Learning What Not to Segment: A New Perspective on Few-Shot Segmentation [63.910211095033596]
近年では、FSS ( few-shot segmentation) が広く開発されている。
本稿では,問題を緩和するための新鮮で直接的な知見を提案する。
提案されたアプローチのユニークな性質を踏まえて、より現実的で挑戦的な設定にまで拡張する。
論文 参考訳(メタデータ) (2022-03-15T03:08:27Z) - A Contrastive Distillation Approach for Incremental Semantic
Segmentation in Aerial Images [15.75291664088815]
現在のディープニューラルアーキテクチャに関する大きな問題は、破滅的な忘れこととして知られている。
我々は、任意の入力を拡張バージョンと比較する、対照的な正則化を提案する。
私たちは、Potsdamデータセットにおけるソリューションの有効性を示し、各テストにおけるインクリメンタルベースラインよりも優れています。
論文 参考訳(メタデータ) (2021-12-07T16:44:45Z) - Distribution Alignment: A Unified Framework for Long-tail Visual
Recognition [52.36728157779307]
長尾視覚認識のための分散アライメント戦略を提案する。
次に,二段階学習における一般化された再重み付け法を導入して,事前のクラスバランスをとる。
提案手法は, 4つの認識タスクすべてにおいて, 単純で統一されたフレームワークを用いて最先端の結果を得る。
論文 参考訳(メタデータ) (2021-03-30T14:09:53Z) - Revisiting Deep Local Descriptor for Improved Few-Shot Classification [56.74552164206737]
textbfDense textbfClassification と textbfAttentive textbfPooling を利用して埋め込みの質を向上させる方法を示す。
広範に使われているグローバル平均プール (GAP) の代わりに, 注意深いプールを施し, 特徴マップをプールすることを提案する。
論文 参考訳(メタデータ) (2021-03-30T00:48:28Z) - Few-shot Action Recognition with Prototype-centered Attentive Learning [88.10852114988829]
2つの新しい構成要素からなるプロトタイプ中心型注意学習(pal)モデル。
まず,従来のクエリ中心学習目標を補完するために,プロトタイプ中心のコントラスト学習損失を導入する。
第二に、PALは注意深いハイブリッド学習機構を統合しており、アウトレーヤの負の影響を最小限に抑えることができる。
論文 参考訳(メタデータ) (2021-01-20T11:48:12Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z) - Distilling Localization for Self-Supervised Representation Learning [82.79808902674282]
コントラスト学習は教師なし表現学習に革命をもたらした。
現在のコントラストモデルでは、前景オブジェクトのローカライズには効果がない。
本稿では,背景変化を学習するためのデータ駆動型手法を提案する。
論文 参考訳(メタデータ) (2020-04-14T16:29:42Z) - Reinforced active learning for image segmentation [34.096237671643145]
深部強化学習(RL)に基づく意味的セグメンテーションのための新しいアクティブラーニング戦略を提案する。
エージェントは、ラベルなしデータのプールからラベル付けされる小さな情報領域(画像全体とは対照的に)のサブセットを選択するポリシーを学ぶ。
本手法では, 意味的セグメンテーション問題の大規模性質に適応して, 能動的学習のための深部Q-network (DQN) の定式化を新たに提案する。
論文 参考訳(メタデータ) (2020-02-16T14:03:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。