論文の概要: Data-driven Koopman Operators for Model-based Shared Control of
Human-Machine Systems
- arxiv url: http://arxiv.org/abs/2006.07210v1
- Date: Fri, 12 Jun 2020 14:14:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-22 04:44:55.456743
- Title: Data-driven Koopman Operators for Model-based Shared Control of
Human-Machine Systems
- Title(参考訳): ヒューマンマシンシステムのモデルベース共有制御のためのデータ駆動koopman演算子
- Authors: Alexander Broad, Ian Abraham, Todd Murphey, Brenna Argall
- Abstract要約: 本稿では,データ駆動型共有制御アルゴリズムを提案する。
ユーザのインタラクションに関するダイナミクスと情報は、Koopman演算子を使用して観察から学習される。
モデルに基づく共有制御は、自然な学習やユーザのみの制御パラダイムと比較して、タスクとコントロールのメトリクスを著しく改善する。
- 参考スコア(独自算出の注目度): 66.65503164312705
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a data-driven shared control algorithm that can be used to improve
a human operator's control of complex dynamic machines and achieve tasks that
would otherwise be challenging, or impossible, for the user on their own. Our
method assumes no a priori knowledge of the system dynamics. Instead, both the
dynamics and information about the user's interaction are learned from
observation through the use of a Koopman operator. Using the learned model, we
define an optimization problem to compute the autonomous partner's control
policy. Finally, we dynamically allocate control authority to each partner
based on a comparison of the user input and the autonomously generated control.
We refer to this idea as model-based shared control (MbSC). We evaluate the
efficacy of our approach with two human subjects studies consisting of 32 total
participants (16 subjects in each study). The first study imposes a linear
constraint on the modeling and autonomous policy generation algorithms. The
second study explores the more general, nonlinear variant. Overall, we find
that model-based shared control significantly improves task and control metrics
when compared to a natural learning, or user only, control paradigm. Our
experiments suggest that models learned via the Koopman operator generalize
across users, indicating that it is not necessary to collect data from each
individual user before providing assistance with MbSC. We also demonstrate the
data-efficiency of MbSC and consequently, it's usefulness in online learning
paradigms. Finally, we find that the nonlinear variant has a greater impact on
a user's ability to successfully achieve a defined task than the linear
variant.
- Abstract(参考訳): 複雑な動的マシンに対する人間の操作者の制御を改善し、それ以外はユーザ自身で難しい、あるいは不可能であるタスクを達成するために使用できるデータ駆動共有制御アルゴリズムを提案する。
本手法はシステムダイナミクスの事前知識を仮定しない。
代わりに、ユーザのインタラクションに関するダイナミクスと情報の両方が、koopmanオペレータの使用による観察から学習される。
学習モデルを用いて,自律パートナーの制御方針を計算するための最適化問題を定義する。
最後に、ユーザ入力と自律的に生成された制御の比較に基づいて、制御権限を各パートナーに動的に割り当てる。
このアイデアをモデルベース共有制御(MbSC)と呼ぶ。
被験者32名(各被験者16名)からなる2つの被験者を対象に,アプローチの有効性を評価した。
最初の研究では、モデリングと自律政策生成アルゴリズムに線形制約を課している。
第2の研究では、より一般的な非線形変種を探求する。
全体として、モデルに基づく共有制御は、自然な学習やユーザのみの制御パラダイムと比較して、タスクとコントロールのメトリクスを著しく改善する。
実験の結果,koopmanオペレータによって学習されたモデルがユーザをまたがって一般化し,mbscに支援を提供する前に個々のユーザからデータを収集する必要はないことが示唆された。
また、mbscのデータ効率を実証し、オンライン学習パラダイムにおける有用性を示す。
最後に、非線形変種は、線形変種よりも決定されたタスクをうまく達成できるユーザの能力に大きな影響を与えることを発見した。
関連論文リスト
- Nonparametric Control-Koopman Operator Learning: Flexible and Scalable Models for Prediction and Control [2.7784144651669704]
非線形制御-アフィン系のクープマン演算子表現を学習するための非パラメトリックフレームワークを提案する。
また、ランダムなプロジェクションを活用することにより、制御クープマン作用素推定器のスケーラビリティも向上する。
予測タスクと制御タスクの両方において,新しいcKORアプローチの有効性を実証した。
論文 参考訳(メタデータ) (2024-05-12T15:46:52Z) - Physics-informed reinforcement learning via probabilistic co-adjustment
functions [3.6787556334630334]
両手法の利点を組み合わせた新しい手法として,コクリグ調整 (CKA) とリッジ回帰調整 (RRA) を導入する。
本手法は,GPプリエントと統合した自己回帰AR1コクリグモデルに基づく。
論文 参考訳(メタデータ) (2023-09-11T12:10:19Z) - Model Predictive Control with Self-supervised Representation Learning [13.225264876433528]
本稿では,TD-MPCフレームワーク内での再構成機能の利用を提案する。
提案した損失項の追加は、状態ベースタスクと画像ベースタスクの両方のパフォーマンス改善につながる。
論文 参考訳(メタデータ) (2023-04-14T16:02:04Z) - Denoised MDPs: Learning World Models Better Than the World Itself [94.74665254213588]
本研究は,野生の情報を制御可能性と報酬との関係に基づく4つのタイプに分類し,制御性および報酬関連性の両方に有用な情報を定式化する。
DeepMind Control Suite と RoboDesk の変種に関する実験では、生の観測のみを用いた場合よりも、認知された世界モデルの優れた性能が示されている。
論文 参考訳(メタデータ) (2022-06-30T17:59:49Z) - Model Predictive Control for Fluid Human-to-Robot Handovers [50.72520769938633]
人間の快適さを考慮に入れた計画運動は、人間ロボットのハンドオーバプロセスの一部ではない。
本稿では,効率的なモデル予測制御フレームワークを用いてスムーズな動きを生成することを提案する。
ユーザ数名の多様なオブジェクトに対して,人間とロボットのハンドオーバ実験を行う。
論文 参考訳(メタデータ) (2022-03-31T23:08:20Z) - Characterizing and overcoming the greedy nature of learning in
multi-modal deep neural networks [62.48782506095565]
深層ニューラルネットワークにおける学習の欲張った性質から、モデルは一つのモダリティにのみ依存する傾向にあり、他のモダリティには不適合であることを示す。
本稿では,学習中のモーダル間の条件付き学習速度のバランスをとるアルゴリズムを提案し,グリージー学習の問題に対処できることを実証する。
論文 参考訳(メタデータ) (2022-02-10T20:11:21Z) - Evaluating model-based planning and planner amortization for continuous
control [79.49319308600228]
我々は、モデル予測制御(MPC)と学習モデルとモデルフリーポリシー学習を組み合わせたハイブリッドアプローチを採っている。
モデルフリーエージェントは高いDoF制御問題においても強いベースラインであることがわかった。
モデルに基づくプランナを,パフォーマンスを損なうことなく,計画が損なわれるようなポリシーに置き換えることが可能であることを示す。
論文 参考訳(メタデータ) (2021-10-07T12:00:40Z) - Deep Learning of Koopman Representation for Control [0.0]
提案手法は、制御のために、Deep Neural NetworkベースのKoopman演算子の学習に依存する。
コントローラは純粋にデータ駆動であり、事前のドメイン知識に依存しない。
本手法は,OpenAI Gym環境上の2つの古典力学系に適用し,その性能を実証する。
論文 参考訳(メタデータ) (2020-10-15T06:41:24Z) - Data Driven Control with Learned Dynamics: Model-Based versus Model-Free
Approach [0.0]
モデルベースとモデルフリーの2種類のデータ駆動制御手法を比較した。
最近提案されたDeep Koopman Representation for Control (DKRC)は、未知の非線形力学系を高次元線形系にマッピングするためにディープニューラルネットワークを利用する。
もう1つは、アクター批判アーキテクチャに基づく古典的なモデルフリー制御手法である、Deep Deterministic Policy Gradient (DDPG)は、様々な力学系で有効であることが証明されている。
論文 参考訳(メタデータ) (2020-06-16T22:18:21Z) - Mining Implicit Entity Preference from User-Item Interaction Data for
Knowledge Graph Completion via Adversarial Learning [82.46332224556257]
本稿では,知識グラフ補完タスクにおけるユーザインタラクションデータを活用することで,新たな逆学習手法を提案する。
我々のジェネレータはユーザインタラクションデータから分離されており、識別器の性能を向上させるのに役立ちます。
利用者の暗黙の実体的嗜好を発見するために,グラフニューラルネットワークに基づく精巧な協調学習アルゴリズムを設計する。
論文 参考訳(メタデータ) (2020-03-28T05:47:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。