論文の概要: Partner-Assisted Learning for Few-Shot Image Classification
- arxiv url: http://arxiv.org/abs/2109.07607v1
- Date: Wed, 15 Sep 2021 22:46:19 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-18 05:06:13.445977
- Title: Partner-Assisted Learning for Few-Shot Image Classification
- Title(参考訳): ファウショット画像分類のためのパートナー支援学習
- Authors: Jiawei Ma, Hanchen Xie, Guangxing Han, Shih-Fu Chang, Aram Galstyan,
Wael Abd-Almageed
- Abstract要約: 人間の視覚能力を模倣し、徹底的な人間のアノテーションを必要とせずに効果的なモデルを学ぶために、わずかなショットラーニングが研究されている。
本稿では,新しいクラスのプロトタイプをラベル付きサンプルから推定できるように,要素表現を得るためのトレーニング戦略の設計に焦点をあてる。
本稿では,まずパートナーエンコーダのペアワイド類似性をモデル化し,ソフトアンカーとして機能する特徴を抽出し,その出力をソフトアンカーと整列させ,分類性能を最大化しようとする2段階トレーニング手法を提案する。
- 参考スコア(独自算出の注目度): 54.66864961784989
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Few-shot Learning has been studied to mimic human visual capabilities and
learn effective models without the need of exhaustive human annotation. Even
though the idea of meta-learning for adaptation has dominated the few-shot
learning methods, how to train a feature extractor is still a challenge. In
this paper, we focus on the design of training strategy to obtain an elemental
representation such that the prototype of each novel class can be estimated
from a few labeled samples. We propose a two-stage training scheme,
Partner-Assisted Learning (PAL), which first trains a partner encoder to model
pair-wise similarities and extract features serving as soft-anchors, and then
trains a main encoder by aligning its outputs with soft-anchors while
attempting to maximize classification performance. Two alignment constraints
from logit-level and feature-level are designed individually. For each few-shot
task, we perform prototype classification. Our method consistently outperforms
the state-of-the-art method on four benchmarks. Detailed ablation studies of
PAL are provided to justify the selection of each component involved in
training.
- Abstract(参考訳): 人間の視覚能力を模倣し、徹底的な人間の注釈を必要とせずに効果的なモデルを学ぶために、わずかなショット学習が研究されている。
適応のためのメタ学習のアイデアが、数少ない学習方法を支配しているが、機能抽出器のトレーニングは依然として課題である。
本稿では,いくつかのラベル付きサンプルから各新規クラスのプロトタイプを推定できるように,要素表現を得るためのトレーニング戦略の設計に着目する。
まず,パートナーエンコーダをペアワイズ類似性をモデル化し,ソフトアンカーとして機能する特徴を抽出し,その出力をソフトアンカーと整合させ,分類性能を最大化しながらメインエンコーダを訓練するパートナ支援学習(pal)を提案する。
ログレベルとフィーチャーレベルの2つのアライメント制約を個別に設計する。
少数のタスク毎にプロトタイプの分類を行う。
提案手法は,4つのベンチマークにおいて常に最先端の手法より優れる。
PALの詳細なアブレーション研究は、トレーニングに関わる各コンポーネントの選択を正当化するために提供される。
関連論文リスト
- Preview-based Category Contrastive Learning for Knowledge Distillation [53.551002781828146]
知識蒸留(PCKD)のための新しい予見型カテゴリーコントラスト学習法を提案する。
まず、インスタンスレベルの特徴対応と、インスタンスの特徴とカテゴリ中心の関係の両方の構造的知識を蒸留する。
カテゴリ表現を明示的に最適化し、インスタンスとカテゴリの表現を明確に関連付けることができる。
論文 参考訳(メタデータ) (2024-10-18T03:31:00Z) - Pre-Trained Vision-Language Models as Partial Annotators [40.89255396643592]
事前学習された視覚言語モデルは、画像と自然言語の統一表現をモデル化するために大量のデータを学習する。
本稿では,事前学習型モデルアプリケーションのための「事前学習型-弱教師付き学習」パラダイムについて検討し,画像分類タスクの実験を行う。
論文 参考訳(メタデータ) (2024-05-23T17:17:27Z) - REST: REtrieve & Self-Train for generative action recognition [54.90704746573636]
本稿では,ビデオ・アクション認識のための事前学習型生成ビジョン・アンド・ランゲージ(V&L)基礎モデルを提案する。
動作クラスを生成するための生成モデルの直接微調整は、過度な過度なオーバーフィッティングに苦しむことを示す。
2つの主要なコンポーネントからなるトレーニングフレームワークであるRESTを紹介します。
論文 参考訳(メタデータ) (2022-09-29T17:57:01Z) - Few-Shot Classification with Contrastive Learning [10.236150550121163]
両段階に比較学習をシームレスに統合する,新しいコントラスト学習ベースのフレームワークを提案する。
メタトレーニングの段階において,同エピソードの2つの異なる視点から最寄りのセントロイド分類を行うための,クロスビュー・エピソード・トレーニング機構を提案する。
これらの2つの戦略は、ビュー間のバイアスを克服し、表現の転送可能性を促進するようモデルに強制する。
論文 参考訳(メタデータ) (2022-09-17T02:39:09Z) - Curriculum Meta-Learning for Few-shot Classification [1.5039745292757671]
本稿では,最新のメタ学習技術に適用可能なカリキュラム学習フレームワークの適応性を提案する。
数発の画像分類タスクにおけるMAMLアルゴリズムによる実験は,カリキュラムの学習フレームワークにおいて有意な効果を示した。
論文 参考訳(メタデータ) (2021-12-06T10:29:23Z) - Trainable Class Prototypes for Few-Shot Learning [5.481942307939029]
本稿では,メタトレーニングとタスクトレーニングの枠組みにおいて,距離測定のためのトレーニング可能なプロトタイプを提案する。
また, エピソードなメタトレーニングがもたらした欠点を避けるために, 自己教師型学習に基づく非エピソードなメタトレーニングを採用する。
本手法は,標準的な数ショットの視覚的分類データセット上で,多数の確立された数ショットタスクにおいて,最先端の性能を実現する。
論文 参考訳(メタデータ) (2021-06-21T04:19:56Z) - Few-shot Action Recognition with Prototype-centered Attentive Learning [88.10852114988829]
2つの新しい構成要素からなるプロトタイプ中心型注意学習(pal)モデル。
まず,従来のクエリ中心学習目標を補完するために,プロトタイプ中心のコントラスト学習損失を導入する。
第二に、PALは注意深いハイブリッド学習機構を統合しており、アウトレーヤの負の影響を最小限に抑えることができる。
論文 参考訳(メタデータ) (2021-01-20T11:48:12Z) - Few-shot Classification via Adaptive Attention [93.06105498633492]
ごく少数の参照サンプルに基づいて,クエリサンプル表現を最適化し,高速に適応する新しい数ショット学習手法を提案する。
実験で実証したように,提案モデルでは,様々なベンチマーク数ショット分類と微粒化認識データセットを用いて,最先端の分類結果を達成している。
論文 参考訳(メタデータ) (2020-08-06T05:52:59Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。