論文の概要: Task-Oriented Koopman-Based Control with Contrastive Encoder
- arxiv url: http://arxiv.org/abs/2309.16077v1
- Date: Thu, 28 Sep 2023 00:27:07 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-29 18:25:21.890864
- Title: Task-Oriented Koopman-Based Control with Contrastive Encoder
- Title(参考訳): コントラストエンコーダを用いたタスク指向koopman制御
- Authors: Xubo Lyu, Hanyang Hu, Seth Siriya, Ye Pu, Mo Chen
- Abstract要約: エンドツーエンドの強化学習とコントラストエンコーダを利用したタスク指向のクープマン制御を提案する。
タスクコストをコントローラ学習の主目的として優先順位付けすることにより、よく同定されたモデルにおけるコントローラ設計の信頼性を低下させる。
- 参考スコア(独自算出の注目度): 6.159077473731295
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present task-oriented Koopman-based control that utilizes end-to-end
reinforcement learning and contrastive encoder to simultaneously learn the
Koopman latent embedding, operator and associated linear controller within an
iterative loop. By prioritizing the task cost as main objective for controller
learning, we reduce the reliance of controller design on a well-identified
model, which extends Koopman control beyond low-dimensional systems to
high-dimensional, complex nonlinear systems, including pixel-based scenarios.
- Abstract(参考訳): タスク指向のKoopman-based controlは、エンドツーエンドの強化学習とコントラストエンコーダを利用して、反復ループ内でKoopmanの潜在埋め込み、演算子および関連する線形コントローラを同時に学習する。
タスクコストをコントローラ学習の主目的として優先順位付けすることにより、コプマン制御を低次元システムを超えて高次元の複雑な非線形システムへと拡張する、よく同定されたモデルにおけるコントローラ設計への依存を減らす。
関連論文リスト
- RoboKoop: Efficient Control Conditioned Representations from Visual Input in Robotics using Koopman Operator [14.77553682217217]
本研究では,高次元潜在空間におけるエージェントの視覚データから効率的な線形化視覚表現を学習するコントラストスペクトル・クープマン埋め込みネットワークを提案する。
本手法は、時間とともに勾配力学の安定性と制御を向上し、既存の手法よりも大幅に優れている。
論文 参考訳(メタデータ) (2024-09-04T22:14:59Z) - Nonparametric Control-Koopman Operator Learning: Flexible and Scalable Models for Prediction and Control [2.7784144651669704]
非線形制御-アフィン系のクープマン演算子表現を学習するための非パラメトリックフレームワークを提案する。
また、ランダムなプロジェクションを活用することにより、制御クープマン作用素推定器のスケーラビリティも向上する。
予測タスクと制御タスクの両方において,新しいcKORアプローチの有効性を実証した。
論文 参考訳(メタデータ) (2024-05-12T15:46:52Z) - Multi-Scale Control Signal-Aware Transformer for Motion Synthesis
without Phase [72.01862340497314]
マルチスケール制御信号認識変換器(MCS-T)を提案する。
MCS-Tは補助情報を用いてメソッドが生成した動作に匹敵する動作をうまく生成できる。
論文 参考訳(メタデータ) (2023-03-03T02:56:44Z) - Leveraging Sequentiality in Reinforcement Learning from a Single
Demonstration [68.94506047556412]
本稿では,複雑なロボットタスクの制御ポリシーを1つの実演で学習するために,シーケンシャルなバイアスを活用することを提案する。
本研究は, ヒューマノイド移動やスタンドアップなど, 模擬課題のいくつかを, 前例のないサンプル効率で解くことができることを示す。
論文 参考訳(メタデータ) (2022-11-09T10:28:40Z) - Deep Koopman Operator with Control for Nonlinear Systems [44.472875714432504]
そこで我々は,Koopman組込み関数とKoopman Operatorを学習するためのエンドツーエンドのディープラーニングフレームワークを提案する。
まず、ニューラルネットワークを用いて埋め込み関数とクープマン演算子をパラメータ化し、Kステップ損失関数でエンドツーエンドに学習する。
次に,制御入力の非線形性をモデル化するために,非線形状態依存制御項を符号化する補助制御ネットワークを設計する。
論文 参考訳(メタデータ) (2022-02-16T11:40:36Z) - End-to-End Learning of Keypoint Representations for Continuous Control
from Images [84.8536730437934]
教師なしの事前学習、デコーダ、追加の損失を必要とせずに、エンドツーエンドで効率的なキーポイント表現を学習できることが示される。
提案アーキテクチャは,ソフトアクター・クリティカルエージェントに直接座標を供給するキーポイント抽出器で構成されている。
論文 参考訳(メタデータ) (2021-06-15T09:17:06Z) - Learning of Long-Horizon Sparse-Reward Robotic Manipulator Tasks with
Base Controllers [26.807673929816026]
本稿では,1つ以上の従来型ベースコントローラを用いた長軸スパース・リワードタスクの学習手法を提案する。
提案アルゴリズムは,既存のベースコントローラを探索,価値学習,ポリシー更新の段階に組み込む。
我々の方法は、既存の産業用ロボット操作システムを利用して、より柔軟でインテリジェントなコントローラを構築する可能性を秘めている。
論文 参考訳(メタデータ) (2020-11-24T14:23:57Z) - Learning a Contact-Adaptive Controller for Robust, Efficient Legged
Locomotion [95.1825179206694]
四足歩行ロボットのためのロバストコントローラを合成するフレームワークを提案する。
高レベルコントローラは、環境の変化に応じてプリミティブのセットを選択することを学習する。
確立された制御方法を使用してプリミティブを堅牢に実行する低レベルコントローラ。
論文 参考訳(メタデータ) (2020-09-21T16:49:26Z) - Data-driven Koopman Operators for Model-based Shared Control of
Human-Machine Systems [66.65503164312705]
本稿では,データ駆動型共有制御アルゴリズムを提案する。
ユーザのインタラクションに関するダイナミクスと情報は、Koopman演算子を使用して観察から学習される。
モデルに基づく共有制御は、自然な学習やユーザのみの制御パラダイムと比較して、タスクとコントロールのメトリクスを著しく改善する。
論文 参考訳(メタデータ) (2020-06-12T14:14:07Z) - Improving Input-Output Linearizing Controllers for Bipedal Robots via
Reinforcement Learning [85.13138591433635]
入力出力線形化コントローラの主な欠点は、正確な力学モデルが必要であり、入力制約を考慮できないことである。
本稿では,強化学習技術を用いた二足歩行ロボット制御の具体例について,両課題に対処する。
論文 参考訳(メタデータ) (2020-04-15T18:15:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。