論文の概要: MAML is a Noisy Contrastive Learner
- arxiv url: http://arxiv.org/abs/2106.15367v1
- Date: Tue, 29 Jun 2021 12:52:26 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-30 22:37:46.953429
- Title: MAML is a Noisy Contrastive Learner
- Title(参考訳): MAMLはノイズの多いコントラスト学習者である
- Authors: Chia-Hsiang Kao, Wei-Chen Chiu and Pin-Yu Chen
- Abstract要約: モデルに依存しないメタラーニング(MAML)は、今日では最も人気があり広く採用されているメタラーニングアルゴリズムの1つである。
我々は、MAMLの動作メカニズムに対する新たな視点を提供し、以下に示すように、MAMLは、教師付きコントラスト目的関数を用いたメタラーナーに類似している。
このような干渉を軽減するため, 単純だが効果的な手法であるゼロ化手法を提案する。
- 参考スコア(独自算出の注目度): 72.04430033118426
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Model-agnostic meta-learning (MAML) is one of the most popular and
widely-adopted meta-learning algorithms nowadays, which achieves remarkable
success in various learning problems. Yet, with the unique design of nested
inner-loop and outer-loop updates which respectively govern the task-specific
and meta-model-centric learning, the underlying learning objective of MAML
still remains implicit and thus impedes a more straightforward understanding of
it. In this paper, we provide a new perspective to the working mechanism of
MAML and discover that: MAML is analogous to a meta-learner using a supervised
contrastive objective function, where the query features are pulled towards the
support features of the same class and against those of different classes, in
which such contrastiveness is experimentally verified via an analysis based on
the cosine similarity. Moreover, our analysis reveals that the vanilla MAML
algorithm has an undesirable interference term originating from the random
initialization and the cross-task interaction. We therefore propose a simple
but effective technique, zeroing trick, to alleviate such interference, where
the extensive experiments are then conducted on both miniImagenet and Omniglot
datasets to demonstrate the consistent improvement brought by our proposed
technique thus well validating its effectiveness.
- Abstract(参考訳): モデルに依存しないメタラーニング(MAML)は、近年最も人気があり広く採用されているメタラーニングアルゴリズムの1つである。
しかし、タスク固有の学習とメタモデル中心の学習をそれぞれ管理するネストしたインナーループと外ループのユニークな設計により、MAMLの基盤となる学習目的は依然として暗黙的なままであり、それによってより直接的な理解を妨げる。
本稿では,MAMLの動作機構に対する新たな視点を提供する。MAMLは,教師付きコントラスト対象関数を用いたメタラーナに類似しており,クエリ特徴が同一クラスのサポート特徴と異なるクラスのサポート特徴に向けられ,このようなコントラスト性はコサイン類似性に基づく分析によって実験的に検証される。
さらに,バニラmamlアルゴリズムはランダム初期化とクロスタスク相互作用から生じる望ましくない干渉項を持つことを明らかにした。
そこで,本手法がもたらす一貫した改善を実証するため,MiniImagenetとOmniglotのデータセット上で広範囲な実験を行い,その効果を十分に検証する。
関連論文リスト
- A New First-Order Meta-Learning Algorithm with Convergence Guarantees [37.85411810113886]
グラディエントベースのメタ学習、特にMAMLは、この目標を達成するための実行可能なソリューションとして現れています。
MAMLが遭遇する問題の1つは、メタグラディエントを計算するのに必要な計算とメモリの負荷である。
我々は、他の一階変種とは異なり、MAMLの目的の定常点に収束することを証明した新しい一階変種を提案する。
論文 参考訳(メタデータ) (2024-09-05T16:37:26Z) - Understanding Masked Autoencoders From a Local Contrastive Perspective [80.57196495601826]
Masked AutoEncoder (MAE)は、シンプルだが効果的なマスキングと再構築戦略によって、自己指導型学習の分野に革命をもたらした。
そこで我々は,MaEの再構成的側面とコントラスト的側面の両方を解析するために,ローカルコントラストMAEと呼ばれる新しい経験的枠組みを導入する。
論文 参考訳(メタデータ) (2023-10-03T12:08:15Z) - Model-Agnostic Multitask Fine-tuning for Few-shot Vision-Language
Transfer Learning [59.38343286807997]
未知タスクの視覚言語モデルのためのモデル非依存型マルチタスクファインチューニング(MAMF)を提案する。
モデルに依存しないメタラーニング(MAML)と比較して、MAMFは二段階最適化を捨て、一階勾配のみを使用する。
MAMFは5つのベンチマークデータセット上で、数ショットの転送学習において古典的な微調整法よりも一貫して優れていることを示す。
論文 参考訳(メタデータ) (2022-03-09T17:26:53Z) - Multi-Task Learning on Networks [0.0]
マルチタスク学習コンテキストで発生する多目的最適化問題は、特定の特徴を持ち、アドホックな方法を必要とする。
この論文では、入力空間の解は、関数評価に含まれる知識をカプセル化した確率分布として表現される。
確率分布のこの空間では、ワッサーシュタイン距離によって与えられる計量が与えられ、モデルが目的関数に直接依存しないような新しいアルゴリズムMOEA/WSTを設計することができる。
論文 参考訳(メタデータ) (2021-12-07T09:13:10Z) - How Fine-Tuning Allows for Effective Meta-Learning [50.17896588738377]
MAMLライクなアルゴリズムから派生した表現を解析するための理論的フレームワークを提案する。
我々は,勾配降下による微調整により得られる最良予測器のリスク境界を提示し,アルゴリズムが共有構造を有効活用できることを実証する。
この分離の結果、マイニングベースのメソッド、例えばmamlは、少数ショット学習における"frozen representation"目標を持つメソッドよりも優れている。
論文 参考訳(メタデータ) (2021-05-05T17:56:00Z) - On Fast Adversarial Robustness Adaptation in Model-Agnostic
Meta-Learning [100.14809391594109]
モデルに依存しないメタラーニング(MAML)は、数発の学習において最も成功したメタラーニング手法の1つである。
メタモデルの一般化力にもかかわらず、マルチショット学習においてMDLがいかに敵対的堅牢性を維持することができるかは明らかではない。
本稿では,ラベルなしデータ拡張,高速な攻撃生成,計算量軽微な微調整を可能にする,汎用的かつ最適化が容易なロバストネス正規化メタラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-20T22:03:04Z) - B-SMALL: A Bayesian Neural Network approach to Sparse Model-Agnostic
Meta-Learning [2.9189409618561966]
本稿では,b-smallアルゴリズムと呼ぶベイズ型ニューラルネットワークに基づくmamlアルゴリズムを提案する。
分類タスクと回帰タスクを用いたB-MAMLのパフォーマンスを実証し、MDLを用いたスパーシファイングBNNのトレーニングがモデルのパラメータフットプリントを実際に改善することを強調した。
論文 参考訳(メタデータ) (2021-01-01T09:19:48Z) - Theoretical Convergence of Multi-Step Model-Agnostic Meta-Learning [63.64636047748605]
一般的なマルチステップMAMLアルゴリズムに対して収束保証を提供するための新しい理論フレームワークを開発する。
特に,本研究の結果は,収束を保証するためには,内部段階のステップを逆比例して$N$の内段ステップを選択する必要があることを示唆している。
論文 参考訳(メタデータ) (2020-02-18T19:17:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。