論文の概要: Concurrent Policy Blending and System Identification for Generalized
Assistive Control
- arxiv url: http://arxiv.org/abs/2205.09836v1
- Date: Thu, 19 May 2022 20:22:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-23 14:34:33.353679
- Title: Concurrent Policy Blending and System Identification for Generalized
Assistive Control
- Title(参考訳): 一般化支援制御のための並行ポリシブレンディングとシステム同定
- Authors: Luke Bhan, Marcos Quinones-Grueiro and Gautam Biswas
- Abstract要約: 状態空間がパラメータ推定のみに依存するブレンディングネットワークをシステム識別技術から採用する。
本研究は,ロボットの協調動作と,ヒトの運動障害に対処する作業において,提案手法の能力を実証するものである。
- 参考スコア(独自算出の注目度): 1.8799681615947088
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this work, we address the problem of solving complex collaborative robotic
tasks subject to multiple varying parameters. Our approach combines
simultaneous policy blending with system identification to create generalized
policies that are robust to changes in system parameters. We employ a blending
network whose state space relies solely on parameter estimates from a system
identification technique. As a result, this blending network learns how to
handle parameter changes instead of trying to learn how to solve the task for a
generalized parameter set simultaneously. We demonstrate our scheme's ability
on a collaborative robot and human itching task in which the human has motor
impairments. We then showcase our approach's efficiency with a variety of
system identification techniques when compared to standard domain
randomization.
- Abstract(参考訳): 本研究では,複数のパラメータを対象とする複雑な協調ロボットタスクの解決問題に対処する。
本手法は,システムパラメータの変化に対して堅牢な汎用ポリシを作成するために,システム識別と同時ポリシを組み合わせる。
状態空間はシステム同定手法によるパラメータ推定のみに依存するブレンディングネットワークを用いる。
その結果、このブレンディングネットワークは、一般化されたパラメータセットのタスクを同時に解く方法を学ぶのではなく、パラメータ変更の扱い方を学ぶ。
本研究は,人間とロボットが協調して作業するロボットの能力と,運動障害を有する人間のかゆみ課題を実証する。
次に、標準的なドメインランダム化と比較して、様々なシステム識別手法でアプローチの効率を実証する。
関連論文リスト
- Task-Aware Harmony Multi-Task Decision Transformer for Offline Reinforcement Learning [70.96345405979179]
オフラインマルチタスク強化学習(MTRL)の目的は、オンライン環境相互作用を必要とせず、多様なタスクに適用可能な統一されたポリシーを開発することである。
タスクの内容と複雑さの変化は、政策の定式化において重大な課題を引き起こします。
本稿では,各タスクに対するパラメータの最適な調和部分空間を特定するための新しいソリューションであるHarmoDT(Harmony Multi-Task Decision Transformer)を紹介する。
論文 参考訳(メタデータ) (2024-11-02T05:49:14Z) - HarmoDT: Harmony Multi-Task Decision Transformer for Offline Reinforcement Learning [72.25707314772254]
本稿では,各タスクに対するパラメータの最適な調和部分空間を特定するための新しいソリューションであるHarmoDT(Harmony Multi-Task Decision Transformer)を紹介する。
このフレームワークの上位レベルは、調和部分空間を規定するタスク固有のマスクの学習に特化しており、内部レベルは、統一されたポリシーの全体的なパフォーマンスを高めるためにパラメータの更新に重点を置いている。
論文 参考訳(メタデータ) (2024-05-28T11:41:41Z) - Merging Multi-Task Models via Weight-Ensembling Mixture of Experts [64.94129594112557]
異なるタスクでトレーニングされたTransformerベースのモデルを単一の統一モデルにマージすることで、すべてのタスクを同時に実行できる。
従来の手法は、タスク演算によって例示され、効率的かつスケーラブルであることが証明されている。
本稿では,Transformer層をMoEモジュールにアップスケーリングしながら,ほとんどのパラメータをマージすることを提案する。
論文 参考訳(メタデータ) (2024-02-01T08:58:57Z) - Online Algorithmic Recourse by Collective Action [8.475375161946845]
本稿では,データ主体とのインタラクションに応じてシステムパラメータを動的に更新するオンライン設定に焦点を当てた。
ユーザが共同で特徴摂動を計算することで、リコースを改善できることを実証的に示す。
論文 参考訳(メタデータ) (2023-12-29T19:19:09Z) - Parameter Identification for Partial Differential Equations with
Spatiotemporal Varying Coefficients [5.373009527854677]
種々の偏微分方程式によって制御される多状態系のパラメータ同定を容易にする枠組みを提案する。
我々のフレームワークは、制約付き自己適応型ニューラルネットワークと、サブネットワーク物理インフォームドニューラルネットワークの2つの統合コンポーネントで構成されている。
我々は,時間変化パラメータを持つ1次元バーガースの場合と空間変化パラメータを持つ2次元波動方程式の2つの数値ケースにおいて,本フレームワークの有効性を実証した。
論文 参考訳(メタデータ) (2023-06-30T07:17:19Z) - Surrogate Assisted Generation of Human-Robot Interaction Scenarios [14.548073522259248]
本研究では,サロゲート支援シナリオ生成が,課題シナリオの多様なデータセットを効率的に合成することを示す。
これらの失敗は実世界の相互作用において再現可能であることを実証する。
論文 参考訳(メタデータ) (2023-04-26T19:11:56Z) - Interactive System-wise Anomaly Detection [66.3766756452743]
異常検出は様々なアプリケーションにおいて基本的な役割を果たす。
既存のメソッドでは、インスタンスがデータとして容易に観察できないシステムであるシナリオを扱うのが難しい。
システム埋め込みを学習するエンコーダデコーダモジュールを含むエンドツーエンドアプローチを開発する。
論文 参考訳(メタデータ) (2023-04-21T02:20:24Z) - Distributed Allocation and Scheduling of Tasks with Cross-Schedule
Dependencies for Heterogeneous Multi-Robot Teams [2.294915015129229]
本稿では,異なるロボットのタスクが時間的・優先的な制約に強く結びついているミッションに対して,タスク割り当てとスケジューリングを行うアルゴリズムを提案する。
マルチロボットシステムによって維持される温室の実用ユースケースへの計画手順の適用。
論文 参考訳(メタデータ) (2021-09-07T13:44:28Z) - Bayesian Meta-Learning for Few-Shot Policy Adaptation Across Robotic
Platforms [60.59764170868101]
強化学習手法は、重要な性能を達成できるが、同じロボットプラットフォームで収集される大量のトレーニングデータを必要とする。
私たちはそれを、さまざまなロボットプラットフォームで共有される共通の構造を捉えるモデルを見つけることを目標とする、数ショットのメタラーニング問題として定式化します。
我々は,400個のロボットを用いて,実ロボットピッキング作業とシミュレーションリーチの枠組みを実験的に評価した。
論文 参考訳(メタデータ) (2021-03-05T14:16:20Z) - Learning High-Level Policies for Model Predictive Control [54.00297896763184]
Model Predictive Control (MPC)は、ロボット制御タスクに対する堅牢なソリューションを提供する。
ニューラルネットワークの高レベルポリシーを学習するための自己教師付き学習アルゴリズムを提案する。
提案手法は, 標準的なMPCでは困難な状況に対処できることを示す。
論文 参考訳(メタデータ) (2020-07-20T17:12:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。