論文の概要: Learning Variable Impedance Control for Aerial Sliding on Uneven
Heterogeneous Surfaces by Proprioceptive and Tactile Sensing
- arxiv url: http://arxiv.org/abs/2206.14122v1
- Date: Tue, 28 Jun 2022 16:28:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-29 14:29:20.564184
- Title: Learning Variable Impedance Control for Aerial Sliding on Uneven
Heterogeneous Surfaces by Proprioceptive and Tactile Sensing
- Title(参考訳): 固有受容・触覚センシングによる不均一面上の空中すべりの学習可変インピーダンス制御
- Authors: Weixuan Zhang, Lionel Ott, Marco Tognon, Roland Siegwart
- Abstract要約: 本研究では,空中すべり作業に対する学習に基づく適応制御手法を提案する。
提案するコントローラ構造は,データ駆動制御とモデルベース制御を組み合わせたものである。
美術品間相互作用制御手法の微調整状態と比較して,追従誤差の低減と外乱拒否の改善を実現した。
- 参考スコア(独自算出の注目度): 42.27572349747162
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The recent development of novel aerial vehicles capable of physically
interacting with the environment leads to new applications such as
contact-based inspection. These tasks require the robotic system to exchange
forces with partially-known environments, which may contain uncertainties
including unknown spatially-varying friction properties and discontinuous
variations of the surface geometry. Finding a control strategy that is robust
against these environmental uncertainties remains an open challenge. This paper
presents a learning-based adaptive control strategy for aerial sliding tasks.
In particular, the gains of a standard impedance controller are adjusted in
real-time by a policy based on the current control signals, proprioceptive
measurements, and tactile sensing. This policy is trained in simulation with
simplified actuator dynamics in a student-teacher learning setup. The
real-world performance of the proposed approach is verified using a tilt-arm
omnidirectional flying vehicle. The proposed controller structure combines
data-driven and model-based control methods, enabling our approach to
successfully transfer directly and without adaptation from simulation to the
real platform. Compared to fine-tuned state of the art interaction control
methods we achieve reduced tracking error and improved disturbance rejection.
- Abstract(参考訳): 環境と物理的に相互作用できる新しい航空車両の最近の開発は、コンタクトベースの検査のような新しい応用に繋がる。
これらのタスクは、未知の空間的な摩擦特性や表面幾何学の不連続な変化を含む不確実性を含む可能性がある、部分的に知られている環境との力の交換を必要とする。
これらの環境不確実性に対して堅牢な制御戦略を見つけることは、依然としてオープンな課題である。
本稿では,空中スライディングタスクに対する学習に基づく適応制御戦略を提案する。
特に、標準インピーダンス制御器の利得は、現在の制御信号、受容性測定、触覚センシングに基づくポリシーにより、リアルタイムで調整される。
このポリシーは、生徒と教師の学習環境において、アクチュエータのダイナミクスを単純化したシミュレーションで訓練される。
提案手法の実際の性能は傾斜式全方向飛行車を用いて検証する。
提案するコントローラ構造は,データ駆動型制御とモデルベースの制御を組み合わせることで,シミュレーションから実プラットフォームへの適応なしに,直接的かつ効率的に移行できる。
artインタラクション制御手法の微調整状態と比較して,追跡誤差の低減と外乱除去の改善を実現する。
関連論文リスト
- Custom Non-Linear Model Predictive Control for Obstacle Avoidance in Indoor and Outdoor Environments [0.0]
本稿では,DJI行列100のための非線形モデル予測制御(NMPC)フレームワークを提案する。
このフレームワークは様々なトラジェクトリタイプをサポートし、厳密な操作の精度を制御するためにペナルティベースのコスト関数を採用している。
論文 参考訳(メタデータ) (2024-10-03T17:50:19Z) - Integrating DeepRL with Robust Low-Level Control in Robotic Manipulators for Non-Repetitive Reaching Tasks [0.24578723416255746]
ロボット工学では、現代の戦略は学習に基づくもので、複雑なブラックボックスの性質と解釈可能性の欠如が特徴である。
本稿では, 深部強化学習(DRL)に基づく衝突のない軌道プランナと, 自動調整型低レベル制御戦略を統合することを提案する。
論文 参考訳(メタデータ) (2024-02-04T15:54:03Z) - Conformal Policy Learning for Sensorimotor Control Under Distribution
Shifts [61.929388479847525]
本稿では,センサコントローラの観測値の分布変化を検知・応答する問題に焦点をあてる。
鍵となる考え方は、整合量子を入力として取ることができるスイッチングポリシーの設計である。
本稿では, 基本方針を異なる特性で切り替えるために, 共形量子関数を用いてこのようなポリシーを設計する方法を示す。
論文 参考訳(メタデータ) (2023-11-02T17:59:30Z) - Sim-to-Real Transfer of Adaptive Control Parameters for AUV
Stabilization under Current Disturbance [1.099532646524593]
本稿では,最大エントロピー深層強化学習フレームワークを古典的なモデルベース制御アーキテクチャと組み合わせ,適応制御系を定式化する新しい手法を提案する。
本フレームワークでは,バイオインスパイアされた体験再生機構,拡張されたドメインランダム化手法,物理プラットフォーム上で実行される評価プロトコルなどを含むSim-to-Real転送戦略を導入する。
実験により,AUVの準最適モデルから有能なポリシを効果的に学習し,実車への移動時の制御性能を3倍に向上することを示した。
論文 参考訳(メタデータ) (2023-10-17T08:46:56Z) - DATT: Deep Adaptive Trajectory Tracking for Quadrotor Control [62.24301794794304]
Deep Adaptive Trajectory Tracking (DATT)は、学習に基づくアプローチであり、現実世界の大きな乱れの存在下で、任意の、潜在的に実現不可能な軌跡を正確に追跡することができる。
DATTは、非定常風場における可溶性および非実用性の両方の軌道に対して、競争適応性非線形およびモデル予測コントローラを著しく上回っている。
適応非線形モデル予測制御ベースラインの1/4未満である3.2ms未満の推論時間で、効率的にオンラインで実行することができる。
論文 参考訳(メタデータ) (2023-10-13T12:22:31Z) - In-Distribution Barrier Functions: Self-Supervised Policy Filters that
Avoid Out-of-Distribution States [84.24300005271185]
本稿では,任意の参照ポリシーをラップした制御フィルタを提案する。
本手法は、トップダウンとエゴセントリックの両方のビュー設定を含むシミュレーション環境における2つの異なるビズモータ制御タスクに有効である。
論文 参考訳(メタデータ) (2023-01-27T22:28:19Z) - Learning Robust Policy against Disturbance in Transition Dynamics via
State-Conservative Policy Optimization [63.75188254377202]
深層強化学習アルゴリズムは、ソースとターゲット環境の相違により、現実世界のタスクでは不十分な処理を行うことができる。
本研究では,前もって乱れをモデル化せずにロバストなポリシーを学習するための,モデルフリーなアクター批判アルゴリズムを提案する。
いくつかのロボット制御タスクの実験では、SCPOは遷移力学の乱れに対する堅牢なポリシーを学習している。
論文 参考訳(メタデータ) (2021-12-20T13:13:05Z) - Learning-based vs Model-free Adaptive Control of a MAV under Wind Gust [0.2770822269241973]
未知の条件下でのナビゲーション問題は、制御分野において最も重要でよく研究されている問題の一つである。
近年のモデルフリー適応制御法は, センサフィードバックから直接植物の物理的特性を学習することにより, この依存を除去することを目的としている。
提案手法は,深い強化学習フレームワークによって頑健に調整された完全状態フィードバックコントローラからなる,概念的にシンプルな学習ベースアプローチを提案する。
論文 参考訳(メタデータ) (2021-01-29T10:13:56Z) - Model-Reference Reinforcement Learning for Collision-Free Tracking
Control of Autonomous Surface Vehicles [1.7033108359337459]
提案する制御アルゴリズムは,従来の制御手法と強化学習を組み合わせることで,制御精度と知性を向上させる。
強化学習により、全体トラッキングコントローラはモデルの不確実性を補償し、衝突回避を実現することができる。
論文 参考訳(メタデータ) (2020-08-17T12:15:15Z) - Learning Compliance Adaptation in Contact-Rich Manipulation [81.40695846555955]
本稿では,コンタクトリッチタスクに必要な力プロファイルの予測モデルを学習するための新しいアプローチを提案する。
このアプローチは、双方向Gated Recurrent Units (Bi-GRU) に基づく異常検出と適応力/インピーダンス制御を組み合わせたものである。
論文 参考訳(メタデータ) (2020-05-01T05:23:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。