論文の概要: Incentivizing Generative Zero-Shot Learning via Outcome-Reward Reinforcement Learning with Visual Cues
- arxiv url: http://arxiv.org/abs/2603.21138v1
- Date: Sun, 22 Mar 2026 09:28:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-24 19:11:39.254586
- Title: Incentivizing Generative Zero-Shot Learning via Outcome-Reward Reinforcement Learning with Visual Cues
- Title(参考訳): 視覚的キューを用いたアウトカム・リワード強化学習による生成ゼロショット学習のインセンティブ
- Authors: Wenjin Hou, Xiaoxiao Sun, Hehe Fan,
- Abstract要約: 生成型ZSLのための視覚的手がかりを備えた帰納的強化学習フレームワークであるRLVCを提案する。
RLVCは、結果に基づく報酬を使用して生成モデルを更新し、タスク関連特徴の合成を奨励する。
3つの一般的なZSLベンチマークの実験と分析は、RLVCが最先端の結果を4.7%のアップで達成していることを示している。
- 参考スコア(独自算出の注目度): 26.99746943267178
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advances in zero-shot learning (ZSL) have demonstrated the potential of generative models. Typically, generative ZSL synthesizes visual features conditioned on semantic prototypes to model the data distribution of unseen classes, followed by training a classifier on the synthesized data. However, the synthesized features often remain task-agnostic, leading to degraded performance. Moreover, inferring a faithful distribution from semantic prototypes alone is insufficient for classes that are semantically similar but visually distinct. To address these and advance ZSL, we propose RLVC, an outcome-reward reinforcement learning RL framework with visual cues for generative ZSL. At its core, RL empowers the generative model to self-evolve, implicitly enhancing its generation capability. In particular, RLVC updates the generative model using an outcome-based reward, encouraging the synthesis of task-relevant features. Furthermore, we introduce class-wise visual cues that (i) align synthesized features with visual prototypes and (ii) stabilize the RL training updates. For the training process, we present a novel cold-start strategy. Comprehensive experiments and analyses on three prevalent ZSL benchmarks demonstrate that RLVC achieves state-of-the-art results with a 4.7% gain.
- Abstract(参考訳): ゼロショット学習(ZSL)の最近の進歩は、生成モデルの可能性を示している。
通常、生成的ZSLはセマンティックプロトタイプで条件付けられた視覚的特徴を合成し、未確認クラスのデータ分布をモデル化し、その後、合成されたデータに基づいて分類器を訓練する。
しかし、合成された機能はタスクに依存しないことが多く、性能が劣化する。
さらに、セマンティックプロトタイプのみから忠実な分布を推定することは、セマンティックに類似しているが視覚的に異なるクラスには不十分である。
そこで本研究では,ZSL生成のための視覚的手がかりを備えた結果逆強化学習フレームワークであるRLVCを提案する。
中心となるRLは、生成モデルを自己進化させ、その生成能力を暗黙的に強化する。
特に、RLVCは結果に基づく報酬を用いて生成モデルを更新し、タスク関連特徴の合成を奨励する。
さらに、クラスワイド・ビジュアル・キューを導入します。
(i)合成された特徴を視覚的プロトタイプと整合させ、
(ii)RLトレーニング更新を安定させる。
トレーニングプロセスでは,新しいコールドスタート戦略を提案する。
3つのZSLベンチマークに関する総合的な実験と分析は、RLVCが最先端の結果を4.7%のアップで達成していることを示している。
関連論文リスト
- SSL4RL: Revisiting Self-supervised Learning as Intrinsic Reward for Visual-Language Reasoning [88.9014727048442]
SSL4RLは、自己教師付き学習タスクをRLベースの微調整のための検証可能な報酬の源として活用する、新しいフレームワークである。
提案手法では,イメージローテーションの予測やマスク付きパッチの再構築といったSSLの目的を,高密度で自動的な報酬信号に変換する。
実験の結果、SSL4RLは視覚中心の推論ベンチマークと視覚言語推論ベンチマークの両方のパフォーマンスを大幅に改善することが示された。
論文 参考訳(メタデータ) (2025-10-18T09:22:40Z) - TTS-VAR: A Test-Time Scaling Framework for Visual Auto-Regressive Generation [48.61855865678161]
視覚的自己回帰(VAR)モデルのための、最初の一般的なテスト時間スケーリングフレームワークを提示する。
クラスタリングに基づく多様性探索と再サンプリングに基づく潜在的選択を提案する。
強力なVARモデルであるInfinityの実験は、注目すべき8.7%のGenEvalスコアの改善を示している。
論文 参考訳(メタデータ) (2025-07-24T16:04:55Z) - GenZSL: Generative Zero-Shot Learning Via Inductive Variational Autoencoder [56.573203512455706]
我々はGenZSLと呼ばれる生成ゼロショット学習のための帰納的変分オートエンコーダを提案する。
我々のGenZSLは、弱いクラスセマンティックベクターを使用して、類似したクラスから新しいクラスサンプルを誘導することで動作します。
3つの人気のあるベンチマークデータセットで実施された実験は、我々のGenZSLの優位性と可能性を示している。
論文 参考訳(メタデータ) (2025-05-17T07:24:13Z) - Meta-Learned Attribute Self-Interaction Network for Continual and
Generalized Zero-Shot Learning [46.6282595346048]
ゼロショット学習(ZSL)は、トレーニング中のカテゴリーを見えないものに一般化するための有望なアプローチである。
連続的なZSLのためのMAIN(Meta-learned Attribute Self-Interaction Network)を提案する。
メタラーニングと属性エンコーダの逆正則化を用いて学習した属性をペアリングすることで、未知のクラス属性を活用することなく、最先端の成果を達成できる。
論文 参考訳(メタデータ) (2023-12-02T16:23:01Z) - Continual Zero-Shot Learning through Semantically Guided Generative
Random Walks [56.65465792750822]
生成モデルを利用して、学習中に見えない情報が提供されない連続ゼロショット学習の課題に対処する。
本稿では,新しい意味誘導型生成ランダムウォーク(GRW)損失を用いた学習アルゴリズムを提案する。
提案アルゴリズムは,AWA1,AWA2,CUB,SUNデータセットの最先端性能を達成し,既存のCZSL手法を3~7%上回る結果を得た。
論文 参考訳(メタデータ) (2023-08-23T18:10:12Z) - Synthetic Sample Selection for Generalized Zero-Shot Learning [4.264192013842096]
Generalized Zero-Shot Learning (GZSL) はコンピュータビジョンにおいて重要な研究領域となっている。
本稿では,強化学習を用いた合成特徴選択のための新しい手法を提案する。
論文 参考訳(メタデータ) (2023-04-06T03:22:43Z) - Efficient Gaussian Process Model on Class-Imbalanced Datasets for
Generalized Zero-Shot Learning [37.00463358780726]
本稿では,潜在機能埋め込みを学習するニューラルネットワークモデルと,未確認クラスの潜在機能プロトタイプを予測するガウスプロセス(GP)回帰モデルを提案する。
我々のモデルは、クラス不均衡なトレーニングデータの影響を緩和する単純なトレーニング戦略により、効率的に訓練される。
論文 参考訳(メタデータ) (2022-10-11T04:57:20Z) - Zero-Shot Logit Adjustment [89.68803484284408]
Generalized Zero-Shot Learning (GZSL) は意味記述に基づく学習技術である。
本稿では,分類器の改良を無視しつつ,ジェネレータの効果を高める新しい世代ベース手法を提案する。
実験により,提案手法が基本生成器と組み合わせた場合の最先端化を実現し,様々なゼロショット学習フレームワークを改良できることが実証された。
論文 参考訳(メタデータ) (2022-04-25T17:54:55Z) - Meta-Learned Attribute Self-Gating for Continual Generalized Zero-Shot
Learning [82.07273754143547]
トレーニング中に見られないカテゴリにモデルを一般化するためのメタ連続ゼロショット学習(MCZSL)アプローチを提案する。
属性の自己決定とスケールしたクラス正規化をメタラーニングベースのトレーニングと組み合わせることで、最先端の成果を上回ることができるのです。
論文 参考訳(メタデータ) (2021-02-23T18:36:14Z) - Generative Replay-based Continual Zero-Shot Learning [7.909034037183046]
再生再生型連続ZSL(GRCZSL)を開発した。
提案手法は従来のZSLにストリーミングデータから学び、以前のタスクの経験を忘れることなく新しい知識を得ることができる。
GRZSL法は,実世界の問題設定をシミュレートした連続学習の単一ヘッド設定のために開発された。
論文 参考訳(メタデータ) (2021-01-22T00:03:34Z) - CRL: Class Representative Learning for Image Classification [5.11566193457943]
本稿では,ZSLの影響を受けやすいクラス代表学習モデル(CRL)を提案する。
CRLモデルでは、まず、畳み込みニューラルネットワーク(CNN)から抽出された特徴を集約することにより、データセットのクラスを表現するクラス代表を構築する。
提案したCRLモデルは,ZSLおよびモバイル深層学習における最先端の研究と比較して,優れた性能を示した。
論文 参考訳(メタデータ) (2020-02-16T17:02:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。