Fugu-MT 論文翻訳(概要): Task-Oriented Koopman-Based Control with Contrastive Encoder

論文の概要: Task-Oriented Koopman-Based Control with Contrastive Encoder

arxiv url: http://arxiv.org/abs/2309.16077v1
Date: Thu, 28 Sep 2023 00:27:07 GMT
ステータス: 翻訳完了
システム内更新日: 2023-09-29 18:25:21.890864
Title: Task-Oriented Koopman-Based Control with Contrastive Encoder
Title（参考訳）: コントラストエンコーダを用いたタスク指向koopman制御
Authors: Xubo Lyu, Hanyang Hu, Seth Siriya, Ye Pu, Mo Chen
Abstract要約: エンドツーエンドの強化学習とコントラストエンコーダを利用したタスク指向のクープマン制御を提案する。タスクコストをコントローラ学習の主目的として優先順位付けすることにより、よく同定されたモデルにおけるコントローラ設計の信頼性を低下させる。
参考スコア（独自算出の注目度）: 6.159077473731295
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We present task-oriented Koopman-based control that utilizes end-to-end reinforcement learning and contrastive encoder to simultaneously learn the Koopman latent embedding, operator and associated linear controller within an iterative loop. By prioritizing the task cost as main objective for controller learning, we reduce the reliance of controller design on a well-identified model, which extends Koopman control beyond low-dimensional systems to high-dimensional, complex nonlinear systems, including pixel-based scenarios.
Abstract（参考訳）: タスク指向のKoopman-based controlは、エンドツーエンドの強化学習とコントラストエンコーダを利用して、反復ループ内でKoopmanの潜在埋め込み、演算子および関連する線形コントローラを同時に学習する。タスクコストをコントローラ学習の主目的として優先順位付けすることにより、コプマン制御を低次元システムを超えて高次元の複雑な非線形システムへと拡張する、よく同定されたモデルにおけるコントローラ設計への依存を減らす。

関連論文リスト

RoboKoop: Efficient Control Conditioned Representations from Visual Input in Robotics using Koopman Operator [14.77553682217217]
本研究では,高次元潜在空間におけるエージェントの視覚データから効率的な線形化視覚表現を学習するコントラストスペクトル・クープマン埋め込みネットワークを提案する。本手法は、時間とともに勾配力学の安定性と制御を向上し、既存の手法よりも大幅に優れている。
論文参考訳（メタデータ） (2024-09-04T22:14:59Z)
Nonparametric Control-Koopman Operator Learning: Flexible and Scalable Models for Prediction and Control [2.7784144651669704]
非線形制御-アフィン系のクープマン演算子表現を学習するための非パラメトリックフレームワークを提案する。また、ランダムなプロジェクションを活用することにより、制御クープマン作用素推定器のスケーラビリティも向上する。予測タスクと制御タスクの両方において,新しいcKORアプローチの有効性を実証した。
論文参考訳（メタデータ） (2024-05-12T15:46:52Z)
Multi-Scale Control Signal-Aware Transformer for Motion Synthesis without Phase [72.01862340497314]
マルチスケール制御信号認識変換器(MCS-T)を提案する。 MCS-Tは補助情報を用いてメソッドが生成した動作に匹敵する動作をうまく生成できる。
論文参考訳（メタデータ） (2023-03-03T02:56:44Z)
Leveraging Sequentiality in Reinforcement Learning from a Single Demonstration [68.94506047556412]
本稿では,複雑なロボットタスクの制御ポリシーを1つの実演で学習するために,シーケンシャルなバイアスを活用することを提案する。本研究は, ヒューマノイド移動やスタンドアップなど, 模擬課題のいくつかを, 前例のないサンプル効率で解くことができることを示す。
論文参考訳（メタデータ） (2022-11-09T10:28:40Z)
Deep Koopman Operator with Control for Nonlinear Systems [44.472875714432504]
そこで我々は,Koopman組込み関数とKoopman Operatorを学習するためのエンドツーエンドのディープラーニングフレームワークを提案する。まず、ニューラルネットワークを用いて埋め込み関数とクープマン演算子をパラメータ化し、Kステップ損失関数でエンドツーエンドに学習する。次に,制御入力の非線形性をモデル化するために,非線形状態依存制御項を符号化する補助制御ネットワークを設計する。
論文参考訳（メタデータ） (2022-02-16T11:40:36Z)
Towards Data-driven LQR with KoopmanizingFlows [8.133902705930327]
本稿では,線形時間不変モデル(LTI)を連続時間非自律非線形力学のクラスで学習するための新しいフレームワークを提案する。我々は、有意な持ち上げ座標を同時に学習しながら、制御において線形なクープマン作用素の有限表現を学習する。
論文参考訳（メタデータ） (2022-01-27T17:02:03Z)
End-to-End Learning of Keypoint Representations for Continuous Control from Images [84.8536730437934]
教師なしの事前学習、デコーダ、追加の損失を必要とせずに、エンドツーエンドで効率的なキーポイント表現を学習できることが示される。提案アーキテクチャは,ソフトアクター・クリティカルエージェントに直接座標を供給するキーポイント抽出器で構成されている。
論文参考訳（メタデータ） (2021-06-15T09:17:06Z)
Learning of Long-Horizon Sparse-Reward Robotic Manipulator Tasks with Base Controllers [26.807673929816026]
本稿では,1つ以上の従来型ベースコントローラを用いた長軸スパース・リワードタスクの学習手法を提案する。提案アルゴリズムは,既存のベースコントローラを探索,価値学習,ポリシー更新の段階に組み込む。我々の方法は、既存の産業用ロボット操作システムを利用して、より柔軟でインテリジェントなコントローラを構築する可能性を秘めている。
論文参考訳（メタデータ） (2020-11-24T14:23:57Z)
Learning a Contact-Adaptive Controller for Robust, Efficient Legged Locomotion [95.1825179206694]
四足歩行ロボットのためのロバストコントローラを合成するフレームワークを提案する。高レベルコントローラは、環境の変化に応じてプリミティブのセットを選択することを学習する。確立された制御方法を使用してプリミティブを堅牢に実行する低レベルコントローラ。
論文参考訳（メタデータ） (2020-09-21T16:49:26Z)
Data-driven Koopman Operators for Model-based Shared Control of Human-Machine Systems [66.65503164312705]
本稿では,データ駆動型共有制御アルゴリズムを提案する。ユーザのインタラクションに関するダイナミクスと情報は、Koopman演算子を使用して観察から学習される。モデルに基づく共有制御は、自然な学習やユーザのみの制御パラダイムと比較して、タスクとコントロールのメトリクスを著しく改善する。
論文参考訳（メタデータ） (2020-06-12T14:14:07Z)
Improving Input-Output Linearizing Controllers for Bipedal Robots via Reinforcement Learning [85.13138591433635]
入力出力線形化コントローラの主な欠点は、正確な力学モデルが必要であり、入力制約を考慮できないことである。本稿では,強化学習技術を用いた二足歩行ロボット制御の具体例について,両課題に対処する。
論文参考訳（メタデータ） (2020-04-15T18:15:49Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。