Fugu-MT 論文翻訳(概要): Symmetry Detection in Trajectory Data for More Meaningful Reinforcement Learning Representations

論文の概要: Symmetry Detection in Trajectory Data for More Meaningful Reinforcement Learning Representations

arxiv url: http://arxiv.org/abs/2211.16381v1
Date: Tue, 29 Nov 2022 17:00:26 GMT
ステータス: 翻訳完了
システム内更新日: 2022-11-30 15:37:14.687160
Title: Symmetry Detection in Trajectory Data for More Meaningful Reinforcement Learning Representations
Title（参考訳）: より有意義な強化学習表現のための軌道データの対称性検出
Authors: Marissa D'Alonzo and Rebecca Russell
Abstract要約: 本稿では,RL対称性を生の軌跡データから直接検出する手法を提案する。本研究では, 環境物理とRL政策の双方の基礎となる対称性を推定できる2つのシミュレーションRL事例について実験を行った。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Knowledge of the symmetries of reinforcement learning (RL) systems can be used to create compressed and semantically meaningful representations of a low-level state space. We present a method of automatically detecting RL symmetries directly from raw trajectory data without requiring active control of the system. Our method generates candidate symmetries and trains a recurrent neural network (RNN) to discriminate between the original trajectories and the transformed trajectories for each candidate symmetry. The RNN discriminator's accuracy for each candidate reveals how symmetric the system is under that transformation. This information can be used to create high-level representations that are invariant to all symmetries on a dataset level and to communicate properties of the RL behavior to users. We show in experiments on two simulated RL use cases (a pusher robot and a UAV flying in wind) that our method can determine the symmetries underlying both the environment physics and the trained RL policy.
Abstract（参考訳）: 強化学習(RL)システムの対称性の知識は、低レベル状態空間の圧縮された意味論的意味のある表現を作成するのに利用できる。本稿では,システムのアクティブな制御を必要とせず,原軌道データから直接rl対称性を検出する手法を提案する。本手法は, 候補対称性を生成し, リカレントニューラルネットワーク(rnn)を訓練し, 候補対称性ごとに元の軌道と変換された軌道を判別する。各候補に対するRNN判別器の精度は、その変換の下でシステムがどのように対称であるかを明らかにする。この情報は、データセットレベルですべての対称性に不変な高レベル表現を作成し、rl動作の特性をユーザに伝えるために使うことができる。本研究では, 風上を飛ぶ推進ロボットとUAVの2つの実例を用いて, 環境物理と訓練されたRL政策の両方の基礎となる対称性を判定する実験を行った。

関連論文リスト

Private Training & Data Generation by Clustering Embeddings [74.00687214400021]
差分プライバシー(DP)は、個々のデータを保護するための堅牢なフレームワークを提供する。本稿では,DP合成画像埋め込み生成のための新しい原理的手法を提案する。経験的に、合成的に生成された埋め込みに基づいて訓練された単純な2層ニューラルネットワークは、最先端(SOTA)分類の精度を達成する。
論文参考訳（メタデータ） (2025-06-20T00:17:14Z)
Learning Infinitesimal Generators of Continuous Symmetries from Data [15.42275880523356]
1-パラメータ群で定義された変換に基づく新しい対称性学習アルゴリズムを提案する。この手法は最小限の帰納バイアスに基づいて構築され、リー群に根付いた一般的な対称性だけでなく、非線形発生器由来の対称性にまで拡張される。
論文参考訳（メタデータ） (2024-10-29T08:28:23Z)
Symmetry Discovery for Different Data Types [52.2614860099811]
等価ニューラルネットワークは、そのアーキテクチャに対称性を取り入れ、より高度な一般化性能を実現する。本稿では,タスクの入出力マッピングを近似したトレーニングニューラルネットワークによる対称性発見手法であるLieSDを提案する。我々は,2体問題,慣性行列予測のモーメント,トップクォークタグ付けといった課題におけるLieSDの性能を検証した。
論文参考訳（メタデータ） (2024-10-13T13:39:39Z)
The Empirical Impact of Neural Parameter Symmetries, or Lack Thereof [50.49582712378289]
ニューラル・ネットワーク・アーキテクチャの導入により,ニューラル・パラメータ・対称性の影響について検討する。我々は,パラメータ空間対称性を低減するために,標準的なニューラルネットワークを改良する2つの手法を開発した。実験により,パラメータ対称性の経験的影響に関する興味深い観察がいくつか示された。
論文参考訳（メタデータ） (2024-05-30T16:32:31Z)
Enhancing lattice kinetic schemes for fluid dynamics with Lattice-Equivariant Neural Networks [79.16635054977068]
我々はLattice-Equivariant Neural Networks (LENNs)と呼ばれる新しい同変ニューラルネットワークのクラスを提案する。我々の手法は、ニューラルネットワークに基づく代理モデルLattice Boltzmann衝突作用素の学習を目的とした、最近導入されたフレームワーク内で開発されている。本研究は,実世界のシミュレーションにおける機械学習強化Lattice Boltzmann CFDの実用化に向けて展開する。
論文参考訳（メタデータ） (2024-05-22T17:23:15Z)
Learning Radio Environments by Differentiable Ray Tracing [56.40113938833999]
本稿では, 材料特性, 散乱, アンテナパターンの微分パラメトリゼーションによって補う, 勾配式キャリブレーション法を提案する。提案手法は,MIMO(分散マルチインプットマルチインプット・マルチアウトプット・チャネル・サウンドア)を用いて,合成データと実世界の屋内チャネル計測の両方を用いて検証した。
論文参考訳（メタデータ） (2023-11-30T13:50:21Z)
Oracle-Preserving Latent Flows [58.720142291102135]
我々はラベル付きデータセット全体にわたって複数の非自明な連続対称性を同時に発見するための方法論を開発する。対称性変換と対応するジェネレータは、特別に構築された損失関数で訓練された完全連結ニューラルネットワークでモデル化される。この研究における2つの新しい要素は、縮小次元の潜在空間の使用と、高次元のオラクルに関して不変な変換への一般化である。
論文参考訳（メタデータ） (2023-02-02T00:13:32Z)
Semi-Supervised Offline Reinforcement Learning with Action-Free Trajectories [37.14064734165109]
自然エージェントは、サイズ、品質、種類の異なる複数のデータソースから学習することができる。オフライン強化学習(RL)の文脈でこれを研究し、実際に動機付けされた半教師付き環境を導入する。
論文参考訳（メタデータ） (2022-10-12T18:22:23Z)
LieGG: Studying Learned Lie Group Generators [1.5293427903448025]
ニューラルネットワークに組み込まれた対称性は、データを保存して学習することで、幅広いタスクに対して非常に有益であるように思える。本稿では,ニューラルネットワークが学習した対称性を抽出し,ネットワークの不変度を評価する手法を提案する。
論文参考訳（メタデータ） (2022-10-09T20:42:37Z)
Learning to Learn with Generative Models of Neural Network Checkpoints [71.06722933442956]
ニューラルネットワークのチェックポイントのデータセットを構築し,パラメータの生成モデルをトレーニングする。提案手法は,幅広い損失プロンプトに対するパラメータの生成に成功している。我々は、教師付きおよび強化学習における異なるニューラルネットワークアーキテクチャとタスクに本手法を適用した。
論文参考訳（メタデータ） (2022-09-26T17:59:58Z)
Koopman Q-learning: Offline Reinforcement Learning via Symmetries of Dynamics [29.219095364935885]
オフライン強化学習は、大規模なデータセットを活用して、環境とのインタラクションなしにポリシーをトレーニングする。現在のアルゴリズムは、トレーニングデータセットに過度に適合し、環境のアウト・オブ・ディストリビューションの一般化にデプロイすると、パフォーマンスが悪くなります。我々は、システムの基盤となる力学の対称性を推測できるクープマン潜在表現を学習する。我々は,D4RL,Metaworld,Robosuiteなどのオフライン強化学習タスクとデータセットをベンチマークで評価した。
論文参考訳（メタデータ） (2021-11-02T04:32:18Z)
Detecting Symmetries with Neural Networks [0.0]
ニューラルネットワークの埋め込み層における構造を広範囲に活用する。我々は、対称性が存在するかどうかを特定し、入力中の対称性の軌道を特定する。この例では、グラフの観点で新しいデータ表現を示す。
論文参考訳（メタデータ） (2020-03-30T17:58:24Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。