論文の概要: Divergent Search for Few-Shot Image Classification
- arxiv url: http://arxiv.org/abs/2004.07903v1
- Date: Thu, 16 Apr 2020 19:47:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-12 20:43:50.349342
- Title: Divergent Search for Few-Shot Image Classification
- Title(参考訳): 少数ショット画像分類のためのダイバージェント探索
- Authors: Jeremy Tan and Bernhard Kainz
- Abstract要約: データの遅延が無く、対象のタスクが事前認識されていない場合、分岐探索は幅広いスキルを学ぶための戦略を提供する。
Omniglot と Mini-ImageNet を用いた画像分類手法を提案する。
- 参考スコア(独自算出の注目度): 4.532939633825531
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: When data is unlabelled and the target task is not known a priori, divergent
search offers a strategy for learning a wide range of skills. Having such a
repertoire allows a system to adapt to new, unforeseen tasks. Unlabelled image
data is plentiful, but it is not always known which features will be required
for downstream tasks. We propose a method for divergent search in the few-shot
image classification setting and evaluate with Omniglot and Mini-ImageNet. This
high-dimensional behavior space includes all possible ways of partitioning the
data. To manage divergent search in this space, we rely on a meta-learning
framework to integrate useful features from diverse tasks into a single model.
The final layer of this model is used as an index into the `archive' of all
past behaviors. We search for regions in the behavior space that the current
archive cannot reach. As expected, divergent search is outperformed by models
with a strong bias toward the evaluation tasks. But it is able to match and
sometimes exceed the performance of models that have a weak bias toward the
target task or none at all. This demonstrates that divergent search is a viable
approach, even in high-dimensional behavior spaces.
- Abstract(参考訳): データがラベル解除され、対象タスクが事前に分かっていない場合、ダイバージェント検索は幅広いスキルを学ぶための戦略を提供する。
このようなレパートリーを持つことで、システムは新しい予期せぬタスクに適応できる。
ラベルなしの画像データは豊富だが、ダウンストリームタスクにどの機能が必要とされるかは必ずしも分かっていない。
本稿では,小画像分類設定における発散探索法を提案し,omniglotとmini-imagenetを用いて評価する。
この高次元の振る舞い空間は、データを分割するあらゆる可能な方法を含んでいる。
この領域で分岐探索を管理するために、多様なタスクから有用な機能を単一のモデルに統合するメタラーニングフレームワークを利用する。
このモデルの最終的なレイヤは、過去のすべての振る舞いの‘archive’へのインデックスとして使用される。
我々は,現在のアーカイブが到達できない行動空間内の領域を探索する。
予想通り、分岐探索は、評価タスクに対する強いバイアスを持つモデルにより性能が向上する。
しかし、対象とするタスクに対してバイアスが弱いモデルのパフォーマンスをマッチさせ、時には超えます。
これは、高次元の挙動空間においても、発散探索が実現可能なアプローチであることを示している。
関連論文リスト
- Few-Shot Anomaly Detection via Category-Agnostic Registration Learning [65.64252994254268]
既存のほとんどの異常検出方法は、各カテゴリに専用のモデルを必要とする。
この記事では、新しい数ショットAD(FSAD)フレームワークを提案する。
これは新しいカテゴリーのモデル微調整を必要としない最初のFSAD法である。
論文 参考訳(メタデータ) (2024-06-13T05:01:13Z) - Incremental Generalized Category Discovery [26.028970894707204]
インクリメンタル一般化カテゴリー発見(IGCD)の課題を探る
これは、以前に見られたカテゴリから画像を正しく分類できるモデルを開発することを目的としている、挑戦的なカテゴリインクリメンタルな学習環境である。
本稿では,非パラメトリック分類と効率的な画像サンプリングを組み合わせたIGCDの新しい手法を提案する。
論文 参考訳(メタデータ) (2023-04-27T16:27:11Z) - Granularity-aware Adaptation for Image Retrieval over Multiple Tasks [30.505620321478688]
Grappaは、強い事前訓練されたモデルから始まり、複数の検索タスクに同時に取り組むように適応するアプローチである。
我々は、全てのアダプタ集合を、融合層を学習することにより、全ての検索タスクに適した単一の統一モデルに再構成する。
6つの異種検索タスクからなるベンチマークの結果,教師なしのGrappaモデルでは,最先端の自己教師型学習モデルのゼロショット性能が向上することが示された。
論文 参考訳(メタデータ) (2022-10-05T13:31:52Z) - Dynamic Relevance Learning for Few-Shot Object Detection [6.550840743803705]
動的グラフ畳み込みネットワーク(GCN)を構築するために,すべてのサポート画像とクエリ画像上の関心領域(RoI)の関係を利用した動的関連学習モデルを提案する。
提案モデルでは,より一般化された特徴の学習の有効性を示す総合的な性能が得られた。
論文 参考訳(メタデータ) (2021-08-04T18:29:42Z) - On the Unreasonable Effectiveness of Centroids in Image Retrieval [0.1933681537640272]
本稿では,トレーニングと検索の両方において,平均セントロイド表現を用いることを提案する。
各クラスは単一の埋め込み – クラスセントロイド – で表現されるため、検索時間とストレージ要件の両方が大幅に削減される。
論文 参考訳(メタデータ) (2021-04-28T08:57:57Z) - Closing the Generalization Gap in One-Shot Object Detection [92.82028853413516]
強力な数ショット検出モデルの鍵は、高度なメトリック学習アプローチではなく、カテゴリの数をスケールすることにある。
将来的なデータアノテーションの取り組みは、より広範なデータセットに集中し、より多くのカテゴリにアノテートする必要がある。
論文 参考訳(メタデータ) (2020-11-09T09:31:17Z) - Tasks Integrated Networks: Joint Detection and Retrieval for Image
Search [99.49021025124405]
多くの現実世界の探索シナリオ(例えばビデオ監視)では、オブジェクトは正確に検出または注釈付けされることはめったにない。
まず、エンド・ツー・エンド統合ネット(I-Net)を紹介します。
さらに,2つの新しいコントリビューションを行うDC-I-Netという改良されたI-Netを提案する。
論文 参考訳(メタデータ) (2020-09-03T03:57:50Z) - MTL-NAS: Task-Agnostic Neural Architecture Search towards
General-Purpose Multi-Task Learning [71.90902837008278]
汎用マルチタスク学習(GP-MTL)にニューラルアーキテクチャサーチ(NAS)を導入することを提案する。
異なるタスクの組み合わせに対応するため、GP-MTLネットワークを単一タスクのバックボーンに分割する。
また,探索されたアーキテクチャ間の性能ギャップを埋める単一ショット勾配に基づく探索アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-03-31T09:49:14Z) - Task-Adaptive Clustering for Semi-Supervised Few-Shot Classification [23.913195015484696]
未確認のタスクを、少量の新しいトレーニングデータだけで処理することを目的としている。
しかし、数ショットの学習者が準備(メタトレーニング)する際には、大量のラベル付きデータが必要である。
そこで本研究では,トレーニングデータの大部分がラベル付けされていない半教師付き環境下で動作可能な,数発の学習者を提案する。
論文 参考訳(メタデータ) (2020-03-18T13:50:19Z) - StarNet: towards Weakly Supervised Few-Shot Object Detection [87.80771067891418]
本稿では、終端から終端までの識別可能な非パラメトリック星モデル検出と分類ヘッドを特徴とする数ショットモデルであるStarNetを紹介する。
このヘッドを通じて、バックボーンは画像レベルのラベルのみを使用してメタトレーニングされ、これまで目に見えないいくつかのテストタスクのカテゴリを共同でローカライズおよび分類するための優れた機能を生成する。
数発の検知器であるため、StarNetは事前トレーニングや新しいクラス適応のためのバウンディングボックスアノテーションを一切必要としない。
論文 参考訳(メタデータ) (2020-03-15T11:35:28Z) - Evolving Losses for Unsupervised Video Representation Learning [91.2683362199263]
大規模未ラベル映像データから映像表現を学習する新しい手法を提案する。
提案した教師なし表現学習では,単一のRGBネットワークが実現し,従来の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-02-26T16:56:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。