論文の概要: SimSR: Simple Distance-based State Representation for Deep Reinforcement
Learning
- arxiv url: http://arxiv.org/abs/2112.15303v1
- Date: Fri, 31 Dec 2021 04:39:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-03 13:53:49.626534
- Title: SimSR: Simple Distance-based State Representation for Deep Reinforcement
Learning
- Title(参考訳): SimSR: 深層強化学習のための簡易距離ベース状態表現
- Authors: Hongyu Zang, Xin Li, Mingzhong Wang
- Abstract要約: 本研究は, 深部強化学習手法を用いた画像ベース観測から, 頑健で一般化可能な状態表現の学習方法について検討する。
SimSR(Simple State Representation, SimSR)演算子を設計し, 実測値との比較により, 近似順序で同等の機能を実現する。
我々のモデルは一般により良い性能を達成し、より良い堅牢性と優れた一般化を持つ。
- 参考スコア(独自算出の注目度): 14.626797887000901
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This work explores how to learn robust and generalizable state representation
from image-based observations with deep reinforcement learning methods.
Addressing the computational complexity, stringent assumptions, and
representation collapse challenges in the existing work of bisimulation metric,
we devise Simple State Representation (SimSR) operator, which achieves
equivalent functionality while reducing the complexity by an order in
comparison with bisimulation metric. SimSR enables us to design a
stochastic-approximation-based method that can practically learn the mapping
functions (encoders) from observations to latent representation space. Besides
the theoretical analysis, we experimented and compared our work with recent
state-of-the-art solutions in visual MuJoCo tasks. The results show that our
model generally achieves better performance and has better robustness and good
generalization.
- Abstract(参考訳): 本研究は, 深部強化学習手法を用いた画像ベース観測から, 頑健で一般化可能な状態表現の学習方法について検討する。
計算複雑性, 厳密な仮定, ビシミュレーション・メトリックの既存の作業における表現崩壊問題に対処するため, ビシミュレーション・メトリックと比較して複雑性を減少させながら, 同等の機能を実現するSimple State Representation (SimSR) 演算子を考案した。
SimSRにより、観測から潜在表現空間へマッピング関数(エンコーダ)を実際に学習できる確率近似に基づく手法を設計できる。
理論的解析の他に、視覚的 MuJoCo タスクにおける最近の最先端ソリューションを実験して比較した。
その結果,モデルの性能は向上し,ロバスト性や一般化性も向上した。
関連論文リスト
- On Discriminative Probabilistic Modeling for Self-Supervised Representation Learning [85.75164588939185]
複数モーダルな)自己教師付き表現学習のための連続領域における識別確率モデル問題について検討する。
我々は、自己教師付き表現学習における現在のInfoNCEに基づくコントラスト損失の制限を明らかにするために一般化誤差解析を行う。
論文 参考訳(メタデータ) (2024-10-11T18:02:46Z) - Intrinsic Dynamics-Driven Generalizable Scene Representations for Vision-Oriented Decision-Making Applications [0.21051221444478305]
シーン表現の能力をいかに向上させるかは、ビジョン指向の意思決定アプリケーションにおいて重要な問題である。
視覚強化学習におけるシーケンスモデルを用いた固有ダイナミクス駆動表現学習法を提案する。
論文 参考訳(メタデータ) (2024-05-30T06:31:03Z) - Sequential Action-Induced Invariant Representation for Reinforcement
Learning [1.2046159151610263]
視覚的障害を伴う高次元観察からタスク関連状態表現を正確に学習する方法は、視覚的強化学習において難しい問題である。
本稿では,逐次動作の制御信号に従うコンポーネントのみを保持するために,補助学習者によってエンコーダを最適化した逐次行動誘発不変表現(SAR)法を提案する。
論文 参考訳(メタデータ) (2023-09-22T05:31:55Z) - ICF-SRSR: Invertible scale-Conditional Function for Self-Supervised
Real-world Single Image Super-Resolution [60.90817228730133]
単一画像超解像(SISR)は、与えられた低解像度(LR)画像を高解像度(HR)にアップサンプリングすることを目的とした課題である。
近年のアプローチは、単純化されたダウンサンプリング演算子によって劣化したシミュレーションLR画像に基づいて訓練されている。
Invertible Scale-Conditional Function (ICF) を提案する。これは入力画像をスケールし、異なるスケール条件で元の入力を復元する。
論文 参考訳(メタデータ) (2023-07-24T12:42:45Z) - Image Transformation Sequence Retrieval with General Reinforcement
Learning [6.423239719448169]
本稿では,画像変換シークエンス検索(ITSR)タスクを提案する。このタスクでは,モデルがそれぞれ,ソースとして機能する2つの画像間の変換シーケンスを検索しなければならない。
本稿では,モンテカルロ木探索 (MCTS) のようなモデルに基づく強化学習とディープニューラルネットワークを組み合わせたTHRの解を提案する。
本実験は,提案手法を教師あり訓練と比較した,合成領域と実領域のベンチマークを提供する。
論文 参考訳(メタデータ) (2023-07-13T08:56:20Z) - Sample Efficient Deep Reinforcement Learning via Local Planning [21.420851589712626]
本研究は,シミュレータを用いた試料効率深部強化学習(RL)に焦点を当てる。
本稿では,この特性を利用した不確実性優先ローカルプランニング(UFLP)というアルゴリズムフレームワークを提案する。
本研究では,この簡単な手法により,難解な探索作業において,いくつかのベースラインRLアルゴリズムのサンプルコストを劇的に向上させることができることを示す。
論文 参考訳(メタデータ) (2023-01-29T23:17:26Z) - An Empirical Investigation of Representation Learning for Imitation [76.48784376425911]
視覚、強化学習、NLPにおける最近の研究は、補助的な表現学習の目的が、高価なタスク固有の大量のデータの必要性を減らすことを示している。
本稿では,表現学習アルゴリズムを構築するためのモジュラーフレームワークを提案する。
論文 参考訳(メタデータ) (2022-05-16T11:23:42Z) - How Fine-Tuning Allows for Effective Meta-Learning [50.17896588738377]
MAMLライクなアルゴリズムから派生した表現を解析するための理論的フレームワークを提案する。
我々は,勾配降下による微調整により得られる最良予測器のリスク境界を提示し,アルゴリズムが共有構造を有効活用できることを実証する。
この分離の結果、マイニングベースのメソッド、例えばmamlは、少数ショット学習における"frozen representation"目標を持つメソッドよりも優れている。
論文 参考訳(メタデータ) (2021-05-05T17:56:00Z) - Model-free Representation Learning and Exploration in Low-rank MDPs [64.72023662543363]
低位mdpに対して,最初のモデルフリー表現学習アルゴリズムを提案する。
主要なアルゴリズムの貢献は新しいミニマックス表現の学習の目的です。
結果は複雑な環境にスケールする一般的な関数近似を収容できます。
論文 参考訳(メタデータ) (2021-02-14T00:06:54Z) - Image Matching across Wide Baselines: From Paper to Practice [80.9424750998559]
局所的な特徴とロバストな推定アルゴリズムの包括的なベンチマークを導入する。
パイプラインのモジュール構造は、さまざまなメソッドの容易な統合、構成、組み合わせを可能にします。
適切な設定で、古典的な解決策は依然として芸術の知覚された状態を上回る可能性があることを示す。
論文 参考訳(メタデータ) (2020-03-03T15:20:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。