論文の概要: Learning Instance and Task-Aware Dynamic Kernels for Few Shot Learning
- arxiv url: http://arxiv.org/abs/2112.03494v1
- Date: Tue, 7 Dec 2021 04:52:36 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-09 01:17:34.662358
- Title: Learning Instance and Task-Aware Dynamic Kernels for Few Shot Learning
- Title(参考訳): ショット学習のための学習インスタンスとタスク対応動的カーネル
- Authors: Rongkai Ma, Pengfei Fang, Gil Avraham, Yan Zuo, Tom Drummond, Mehrtash
Harandi
- Abstract要約: 我々は、手前のタスクの関数として畳み込みネットワークの動的カーネルを学習し、より高速な一般化を可能にする。
実験により,本モデルでは,数発の分類および検出タスクの性能向上を実証的に示す。
- 参考スコア(独自算出の注目度): 32.3217883750605
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Learning and generalizing to novel concepts with few samples (Few-Shot
Learning) is still an essential challenge to real-world applications. A
principle way of achieving few-shot learning is to realize a model that can
rapidly adapt to the context of a given task. Dynamic networks have been shown
capable of learning content-adaptive parameters efficiently, making them
suitable for few-shot learning. In this paper, we propose to learn the dynamic
kernels of a convolution network as a function of the task at hand, enabling
faster generalization. To this end, we obtain our dynamic kernels based on the
entire task and each sample and develop a mechanism further conditioning on
each individual channel and position independently. This results in dynamic
kernels that simultaneously attend to the global information whilst also
considering minuscule details available. We empirically show that our model
improves performance on few-shot classification and detection tasks, achieving
a tangible improvement over several baseline models. This includes
state-of-the-art results on 4 few-shot classification benchmarks:
mini-ImageNet, tiered-ImageNet, CUB and FC100 and competitive results on a
few-shot detection dataset: MS COCO-PASCAL-VOC.
- Abstract(参考訳): サンプルが少ない新しい概念(Few-Shot Learning)を学習し、一般化することは、現実世界のアプリケーションにとって依然として重要な課題である。
最小ショット学習を実現する基本的な方法は、与えられたタスクのコンテキストに迅速に適応できるモデルを実現することである。
動的ネットワークは、コンテンツ適応パラメータを効率的に学習し、数ショットの学習に適していることが示されている。
本稿では,畳み込みネットワークの動的カーネルをタスクの関数として学習し,より高速な一般化を実現することを提案する。
この目的のために,タスク全体と各サンプルに基づいて動的カーネルを取得し,各チャネルと位置を独立に条件付けする機構を開発する。
この結果、動的カーネルは、利用可能な最小の詳細を考慮しながら、グローバル情報に同時に出席する。
本研究では,いくつかのベースラインモデルに対して有意な改善を達成し,少数ショット分類および検出タスクの性能向上を実証的に示す。
これには、mini-ImageNet、tyred-ImageNet、CUB、FC100という4つの数ショット分類ベンチマークの最先端結果と、数ショット検出データセットであるMS COCO-PASCAL-VOCの競合結果が含まれる。
関連論文リスト
- AggSS: An Aggregated Self-Supervised Approach for Class-Incremental Learning [17.155759991260094]
本稿では,自己指導型学習,特に画像回転が様々なクラス増分学習パラダイムに与える影響について検討する。
AggSS戦略を通じて学習する本質的なオブジェクト特徴に対するディープニューラルネットワークの注目度の変化を観察する。
AggSSは、任意のクラス増分学習フレームワークにシームレスに組み込むことができるプラグイン・アンド・プレイモジュールとして機能する。
論文 参考訳(メタデータ) (2024-08-08T10:16:02Z) - Intra-task Mutual Attention based Vision Transformer for Few-Shot Learning [12.5354658533836]
人間は、ほんのわずかの例に晒された後に、新しい、目に見えない画像を正確に分類する能力を持っている。
人工ニューラルネットワークモデルでは、限られたサンプルを持つ2つのイメージを区別する最も関連性の高い特徴を決定することが課題である。
本稿では,サポートとクエリサンプルをパッチに分割するタスク内相互注意手法を提案する。
論文 参考訳(メタデータ) (2024-05-06T02:02:57Z) - An Efficient General-Purpose Modular Vision Model via Multi-Task
Heterogeneous Training [79.78201886156513]
本稿では、複数の視覚タスクを実行でき、他の下流タスクに効率的に適応できるモデルを提案する。
提案手法は,単一タスク状態モデルに匹敵する結果を達成し,下流タスクの強力な一般化を実証する。
論文 参考訳(メタデータ) (2023-06-29T17:59:57Z) - USER: Unified Semantic Enhancement with Momentum Contrast for Image-Text
Retrieval [115.28586222748478]
Image-Text Retrieval (ITR) は、与えられたクエリに意味のあるターゲットインスタンスを、他のモダリティから検索することを目的としている。
既存のアプローチは通常、2つの大きな制限に悩まされる。
論文 参考訳(メタデータ) (2023-01-17T12:42:58Z) - Meta-Learning with Self-Improving Momentum Target [72.98879709228981]
メタラーナーの性能を向上させるために,SiMT(Self-improving Momentum Target)を提案する。
SiMTはメタラーナーの時間アンサンブルから適応してターゲットモデルを生成する。
我々は、SiMTが幅広いメタ学習手法と組み合わせることで、大きなパフォーマンス向上をもたらすことを示す。
論文 参考訳(メタデータ) (2022-10-11T06:45:15Z) - Dynamic Kernel Selection for Improved Generalization and Memory
Efficiency in Meta-learning [9.176056742068813]
圧縮CNNモデルを設計するためのタスク固有の動的カーネル選択戦略であるMetaDOCKを提案する。
提案手法は,各タスクごとにネットワークのすべてのカーネルが必要なわけではない,という仮説に基づいている。
提案手法を用いて得られた大容量CNNモデルの同一推定予算に対して,従来のCNNモデルよりも常に優れた性能を示すことを示す。
論文 参考訳(メタデータ) (2022-06-03T17:09:26Z) - Continual Object Detection via Prototypical Task Correlation Guided
Gating Mechanism [120.1998866178014]
pRotOtypeal taSk corrElaTion guided gaTingAnism (ROSETTA)による連続物体検出のためのフレキシブルなフレームワークを提案する。
具体的には、統一されたフレームワークはすべてのタスクで共有され、タスク対応ゲートは特定のタスクのサブモデルを自動的に選択するために導入されます。
COCO-VOC、KITTI-Kitchen、VOCのクラスインクリメンタル検出、および4つのタスクの逐次学習の実験により、ROSETTAが最先端のパフォーマンスを得ることが示された。
論文 参考訳(メタデータ) (2022-05-06T07:31:28Z) - Dynamic Relevance Learning for Few-Shot Object Detection [6.550840743803705]
動的グラフ畳み込みネットワーク(GCN)を構築するために,すべてのサポート画像とクエリ画像上の関心領域(RoI)の関係を利用した動的関連学習モデルを提案する。
提案モデルでは,より一般化された特徴の学習の有効性を示す総合的な性能が得られた。
論文 参考訳(メタデータ) (2021-08-04T18:29:42Z) - Learning to Continuously Optimize Wireless Resource In Episodically
Dynamic Environment [55.91291559442884]
この研究は、データ駆動型手法が動的環境で継続的に学習し、最適化できる方法論を開発する。
本稿では,無線システム学習のモデリングプロセスに連続学習の概念を構築することを提案する。
我々の設計は、異なるデータサンプル間で「一定の公正性を保証する」新しいmin-maxの定式化に基づいている。
論文 参考訳(メタデータ) (2020-11-16T08:24:34Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。