論文の概要: Synthetic Sample Selection for Generalized Zero-Shot Learning
- arxiv url: http://arxiv.org/abs/2304.02846v1
- Date: Thu, 6 Apr 2023 03:22:43 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-07 15:24:40.704391
- Title: Synthetic Sample Selection for Generalized Zero-Shot Learning
- Title(参考訳): 一般化ゼロショット学習のための合成サンプル選択
- Authors: Shreyank N Gowda
- Abstract要約: Generalized Zero-Shot Learning (GZSL) はコンピュータビジョンにおいて重要な研究領域となっている。
本稿では,強化学習を用いた合成特徴選択のための新しい手法を提案する。
- 参考スコア(独自算出の注目度): 4.264192013842096
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generalized Zero-Shot Learning (GZSL) has emerged as a pivotal research
domain in computer vision, owing to its capability to recognize objects that
have not been seen during training. Despite the significant progress achieved
by generative techniques in converting traditional GZSL to fully supervised
learning, they tend to generate a large number of synthetic features that are
often redundant, thereby increasing training time and decreasing accuracy. To
address this issue, this paper proposes a novel approach for synthetic feature
selection using reinforcement learning. In particular, we propose a
transformer-based selector that is trained through proximal policy optimization
(PPO) to select synthetic features based on the validation classification
accuracy of the seen classes, which serves as a reward. The proposed method is
model-agnostic and data-agnostic, making it applicable to both images and
videos and versatile for diverse applications. Our experimental results
demonstrate the superiority of our approach over existing feature-generating
methods, yielding improved overall performance on multiple benchmarks.
- Abstract(参考訳): Generalized Zero-Shot Learning (GZSL)は、コンピュータビジョンにおける重要な研究領域として登場した。
従来のGZSLを完全な教師付き学習に変換するための生成技術によって達成された大きな進歩にもかかわらず、それらはしばしば冗長な多くの合成特徴を生成し、訓練時間を増やし、精度を低下させる傾向にある。
本稿では,強化学習を用いた合成特徴選択のための新しい手法を提案する。
特に,近似ポリシー最適化(PPO)によってトレーニングされたトランスフォーマーベースのセレクタを提案し,その評価精度に基づいて合成特徴を抽出し,報奨として機能する。
提案手法は,画像とビデオの両方に適用可能であり,多様なアプリケーションに適用可能である。
実験の結果,既存の機能生成手法よりも優れた手法が示され,複数のベンチマークで全体的な性能が向上した。
関連論文リスト
- LC-Protonets: Multi-label Few-shot learning for world music audio tagging [65.72891334156706]
ラベル結合型プロトタイプネットワーク(LC-Protonets)を導入し,複数ラベルの複数ショット分類の問題に対処する。
LC-Protonetsは、限られたトレーニング項目に存在するラベルのパワーセットから、ラベルの組み合わせごとに1つのプロトタイプを生成する。
本手法は,様々な文化をカバーし,現代音楽と伝統音楽の両方を含む,多様な音楽データセットにまたがる自動音声タグ付けに適用する。
論文 参考訳(メタデータ) (2024-09-17T15:13:07Z) - Dynamic Policy-Driven Adaptive Multi-Instance Learning for Whole Slide
Image Classification [26.896926631411652]
マルチインスタンスラーニング (MIL) は, バッグや疑似バッグを用いた病理組織像全体(WSI)解析において, 優れた性能を示した。
既存のMILベースの技術は、少なくとも1つ以上の問題に悩まされている: 1) 多数のインスタンスに対して高いストレージと集中的な事前処理を必要とすること(サンプリング)、2) バッグラベルを予測するための限られた知識を持つ潜在的な過剰適合(機能表現)、3) 擬似バグカウントと事前バイアスはモデルの堅牢性と一般化可能性(意思決定)に影響を与える。
論文 参考訳(メタデータ) (2024-03-09T04:43:24Z) - SEER-ZSL: Semantic Encoder-Enhanced Representations for Generalized
Zero-Shot Learning [0.7420433640907689]
一般化ゼロショット学習(GZSL)は、見知らぬクラスから知識を伝達することで、目に見えないクラスを認識する。
本稿では,一般化ギャップに対処するための二重戦略を提案する。
論文 参考訳(メタデータ) (2023-12-20T15:18:51Z) - End-to-End Meta-Bayesian Optimisation with Transformer Neural Processes [52.818579746354665]
本稿では,ニューラルネットワークを一般化し,トランスフォーマーアーキテクチャを用いて獲得関数を学習する,エンド・ツー・エンドの差別化可能な最初のメタBOフレームワークを提案する。
我々は、この強化学習(RL)によるエンドツーエンドのフレームワークを、ラベル付き取得データの欠如に対処できるようにします。
論文 参考訳(メタデータ) (2023-05-25T10:58:46Z) - DoE2Vec: Deep-learning Based Features for Exploratory Landscape Analysis [0.0]
本研究では,地形特性を最適化するための変分オートエンコーダ(VAE)に基づく手法であるDoE2Vecを提案する。
古典的な探索的景観解析(ELA)法とは異なり,本手法では特徴工学は必要としない。
検証のために、潜伏再構成の品質を検査し、異なる実験を用いて潜伏表現を解析する。
論文 参考訳(メタデータ) (2023-03-31T09:38:44Z) - Learning Common Rationale to Improve Self-Supervised Representation for
Fine-Grained Visual Recognition Problems [61.11799513362704]
我々は、インスタンスやクラスでよく見られる差別的手がかりを識別するための、追加のスクリーニングメカニズムの学習を提案する。
SSL目標から誘導されるGradCAMを単純に利用することで、共通な有理性検出器が学習可能であることを示す。
論文 参考訳(メタデータ) (2023-03-03T02:07:40Z) - ProFormer: Learning Data-efficient Representations of Body Movement with
Prototype-based Feature Augmentation and Visual Transformers [31.908276711898548]
身体からのデータ効率の高い認識法は、画像のような配列として構造化された骨格配列をますます活用している。
我々は、このパラダイムをトランスフォーマーネットワークの観点から見て、初めて、骨格運動のデータ効率の高いエンコーダとして視覚トランスフォーマーを探索する。
私たちのパイプラインでは、画像のような表現としてキャストされたボディポーズシーケンスをパッチ埋め込みに変換し、深いメトリック学習に最適化されたビジュアルトランスフォーマーバックボーンに渡します。
論文 参考訳(メタデータ) (2022-02-23T11:11:54Z) - Guiding Generative Language Models for Data Augmentation in Few-Shot
Text Classification [59.698811329287174]
我々は、GPT-2を用いて、分類性能を向上させるために、人工訓練インスタンスを生成する。
実験の結果,少数のラベルインスタンスでGPT-2を微調整すると,一貫した分類精度が向上することがわかった。
論文 参考訳(メタデータ) (2021-11-17T12:10:03Z) - Exploring Complementary Strengths of Invariant and Equivariant
Representations for Few-Shot Learning [96.75889543560497]
多くの現実世界では、多数のラベル付きサンプルの収集は不可能です。
少ないショット学習はこの問題に対処するための主要なアプローチであり、目的は限られた数のサンプルの存在下で新しいカテゴリに迅速に適応することです。
幾何学的変換の一般集合に対する等分散と不変性を同時に強制する新しい訓練機構を提案する。
論文 参考訳(メタデータ) (2021-03-01T21:14:33Z) - Trajectory-wise Multiple Choice Learning for Dynamics Generalization in
Reinforcement Learning [137.39196753245105]
本稿では,動的一般化のためのマルチヘッドダイナミックスモデルを学習するモデルベース強化学習アルゴリズムを提案する。
文脈学習は,過去の経験から得られる動的情報からコンテキスト潜在ベクトルにエンコードする。
提案手法は,最先端のRL法と比較して,様々な制御タスクにおいて優れたゼロショット一般化性能を示す。
論文 参考訳(メタデータ) (2020-10-26T03:20:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。