論文の概要: CRC-RL: A Novel Visual Feature Representation Architecture for
Unsupervised Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2301.13473v1
- Date: Tue, 31 Jan 2023 08:41:18 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-01 17:16:30.995160
- Title: CRC-RL: A Novel Visual Feature Representation Architecture for
Unsupervised Reinforcement Learning
- Title(参考訳): CRC-RL:教師なし強化学習のための新しい視覚特徴表現アーキテクチャ
- Authors: Darshita Jain, Anima Majumder, Samrat Dutta and Swagat Kumar
- Abstract要約: 改良された視覚的特徴を学習するために,CRC損失と呼ばれる不均一な損失関数を用いた新しいアーキテクチャを提案する。
提案したアーキテクチャはCRC-RLと呼ばれ、Deep Mind Controlスイート環境における既存の最先端手法よりも優れている。
- 参考スコア(独自算出の注目度): 7.4010632660248765
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper addresses the problem of visual feature representation learning
with an aim to improve the performance of end-to-end reinforcement learning
(RL) models. Specifically, a novel architecture is proposed that uses a
heterogeneous loss function, called CRC loss, to learn improved visual features
which can then be used for policy learning in RL. The CRC-loss function is a
combination of three individual loss functions, namely, contrastive,
reconstruction and consistency loss. The feature representation is learned in
parallel to the policy learning while sharing the weight updates through a
Siamese Twin encoder model. This encoder model is augmented with a decoder
network and a feature projection network to facilitate computation of the above
loss components. Through empirical analysis involving latent feature
visualization, an attempt is made to provide an insight into the role played by
this loss function in learning new action-dependent features and how they are
linked to the complexity of the problems being solved. The proposed
architecture, called CRC-RL, is shown to outperform the existing
state-of-the-art methods on the challenging Deep mind control suite
environments by a significant margin thereby creating a new benchmark in this
field.
- Abstract(参考訳): 本稿では、エンドツーエンド強化学習(RL)モデルの性能向上を目的とした視覚特徴表現学習の課題に対処する。
具体的には,crcロスと呼ばれる不均質な損失関数を用いて,rlのポリシ学習に使用できる視覚機能の改善を学習する,新しいアーキテクチャを提案する。
CRC-loss関数は3つの個別損失関数、すなわちコントラスト、再構成、一貫性損失の組み合わせである。
特徴表現はポリシー学習と並行して学習され、シャム双対エンコーダモデルを通じて重みの更新を共有する。
このエンコーダモデルは、上記の損失成分の計算を容易にするためにデコーダネットワークと特徴投影ネットワークとで拡張される。
潜在的特徴可視化を含む経験的分析を通じて、新しい行動依存的特徴の学習においてこの損失関数が果たす役割と、それらが解決される問題の複雑さとどのように関連しているかを考察する。
提案したアーキテクチャはCRC-RLと呼ばれ、Deep Mind Control Suite環境における既存の最先端の手法をかなりのマージンで上回り、この分野の新しいベンチマークを作成する。
関連論文リスト
- Fast and Efficient Local Search for Genetic Programming Based Loss
Function Learning [12.581217671500887]
本稿では,タスクとモデルに依存しない損失関数学習のためのメタラーニングフレームワークを提案する。
その結果, 学習した損失関数は, 収束性, サンプル効率, グラフ化, コンピュータビジョン, 自然言語処理問題に対する推論性能の向上をもたらすことがわかった。
論文 参考訳(メタデータ) (2024-03-01T02:20:04Z) - A Neuromorphic Architecture for Reinforcement Learning from Real-Valued
Observations [0.34410212782758043]
強化学習(RL)は複雑な環境における意思決定のための強力なフレームワークを提供する。
本稿では,実測値を用いてRL問題を解くための新しいスパイキングニューラルネットワーク(SNN)アーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-07-06T12:33:34Z) - Class Anchor Margin Loss for Content-Based Image Retrieval [97.81742911657497]
距離学習パラダイムに該当する新しいレペラ・トラクタ損失を提案するが、ペアを生成する必要がなく、直接L2メトリックに最適化する。
CBIRタスクにおいて,畳み込みアーキテクチャと変圧器アーキテクチャの両方を用いて,少数ショットおよびフルセットトレーニングの文脈で提案した目的を評価する。
論文 参考訳(メタデータ) (2023-06-01T12:53:10Z) - Bridging Component Learning with Degradation Modelling for Blind Image
Super-Resolution [69.11604249813304]
視覚障害者のためのコンポーネント分解・協調最適化ネットワーク(CDCN)を提案する。
CDCNは入力LR画像を特徴空間の構造と詳細成分に分解する。
本稿では,HR画像の細部と構造復元過程を協調的に監督する,劣化駆動型学習戦略を提案する。
論文 参考訳(メタデータ) (2022-12-03T14:53:56Z) - Learning Detail-Structure Alternative Optimization for Blind
Super-Resolution [69.11604249813304]
そこで我々は,ブラインドSRに先立ってカーネルを曖昧にすることなく,再帰的な詳細構造代替最適化を実現する,有効かつカーネルフリーなネットワークDSSRを提案する。
DSSRでは、細部構造変調モジュール(DSMM)が構築され、画像の詳細と構造の相互作用と協調を利用する。
本手法は既存の手法に対して最先端の手法を実現する。
論文 参考訳(メタデータ) (2022-12-03T14:44:17Z) - Learning Deep Representations via Contrastive Learning for Instance
Retrieval [11.736450745549792]
本稿では、インスタンス識別に基づくコントラスト学習(CL)を用いて、この問題に取り組むための最初の試みを行う。
本研究では、事前学習されたCLモデルと微調整されたCLモデルから識別表現を導出する能力を探求することにより、この問題に対処する。
論文 参考訳(メタデータ) (2022-09-28T04:36:34Z) - SIRe-Networks: Skip Connections over Interlaced Multi-Task Learning and
Residual Connections for Structure Preserving Object Classification [28.02302915971059]
本稿では、オブジェクト分類タスクにおける消失勾配を低減するために、SIReを定義したインターレース型マルチタスク学習戦略を提案する。
提案手法は、自動エンコーダを介して入力画像構造を保存することにより、畳み込みニューラルネットワーク(CNN)を直接改善する。
提案手法を検証するため、SIRe戦略を介して単純なCNNと有名なネットワークの様々な実装を拡張し、CIFAR100データセットで広範囲にテストする。
論文 参考訳(メタデータ) (2021-10-06T13:54:49Z) - Visual Alignment Constraint for Continuous Sign Language Recognition [74.26707067455837]
ビジョンベースの継続的署名言語認識は、画像シーケンスから未分割ジェスチャーを認識することを目的とする。
本研究は,最近のCTCに基づくCSLRにおける過剰適合問題を再考し,特徴抽出器の訓練不足によるものである。
視覚アライメント制約(vac)により、よりアライメントの監督により特徴抽出器を強化する。
論文 参考訳(メタデータ) (2021-04-06T07:24:58Z) - Hierarchical Deep CNN Feature Set-Based Representation Learning for
Robust Cross-Resolution Face Recognition [59.29808528182607]
クロスリゾリューション顔認識(CRFR)は、インテリジェントな監視およびバイオメトリックフォレンジックにおいて重要である。
既存の浅層学習と深層学習に基づく手法は、HR-LR対を共同特徴空間にマッピングすることに焦点を当てている。
本研究では,多レベル深層畳み込みニューラルネットワーク(CNN)の機能を完全に活用し,堅牢なCRFRを実現することを目的とする。
論文 参考訳(メタデータ) (2021-03-25T14:03:42Z) - Progressive Self-Guided Loss for Salient Object Detection [102.35488902433896]
画像中の深層学習に基づくサラエント物体検出を容易にするプログレッシブ自己誘導損失関数を提案する。
我々のフレームワークは適応的に集約されたマルチスケール機能を利用して、健全な物体の探索と検出を効果的に行う。
論文 参考訳(メタデータ) (2021-01-07T07:33:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。