論文の概要: Learning Dynamical Systems Encoding Non-Linearity within Space Curvature
- arxiv url: http://arxiv.org/abs/2403.11948v1
- Date: Mon, 18 Mar 2024 16:42:39 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-20 19:30:44.369586
- Title: Learning Dynamical Systems Encoding Non-Linearity within Space Curvature
- Title(参考訳): 空間曲率における非線形性を符号化する力学系学習
- Authors: Bernardo Fichera, Aude Billard,
- Abstract要約: 動的システム(DS)は、ロボット制御のための高レベルポリシーを効果的かつ強力に形成する手段である。
DSの現在の学習戦略は、しばしばトレードオフを伴い、安定性を保証するかオフラインの計算効率を犠牲にする。
ロボット制御のための非線形DSを学習的に安定させる幾何学的手法を提案する。
- 参考スコア(独自算出の注目度): 9.972829990880369
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Dynamical Systems (DS) are an effective and powerful means of shaping high-level policies for robotics control. They provide robust and reactive control while ensuring the stability of the driving vector field. The increasing complexity of real-world scenarios necessitates DS with a higher degree of non-linearity, along with the ability to adapt to potential changes in environmental conditions, such as obstacles. Current learning strategies for DSs often involve a trade-off, sacrificing either stability guarantees or offline computational efficiency in order to enhance the capabilities of the learned DS. Online local adaptation to environmental changes is either not taken into consideration or treated as a separate problem. In this paper, our objective is to introduce a method that enhances the complexity of the learned DS without compromising efficiency during training or stability guarantees. Furthermore, we aim to provide a unified approach for seamlessly integrating the initially learned DS's non-linearity with any local non-linearities that may arise due to changes in the environment. We propose a geometrical approach to learn asymptotically stable non-linear DS for robotics control. Each DS is modeled as a harmonic damped oscillator on a latent manifold. By learning the manifold's Euclidean embedded representation, our approach encodes the non-linearity of the DS within the curvature of the space. Having an explicit embedded representation of the manifold allows us to showcase obstacle avoidance by directly inducing local deformations of the space. We demonstrate the effectiveness of our methodology through two scenarios: first, the 2D learning of synthetic vector fields, and second, the learning of 3D robotic end-effector motions in real-world settings.
- Abstract(参考訳): 動的システム(DS)は、ロボット制御のための高レベルポリシーを効果的かつ強力に形成する手段である。
それらは、駆動ベクトル場の安定性を確保しながら、堅牢で反応性の高い制御を提供する。
現実のシナリオの複雑さが増大するにつれ、DSはより高度な非線形性を必要とし、障害物のような環境条件の変化に適応する能力も必要となる。
DSの現在の学習戦略は、しばしばトレードオフを伴い、学習されたDSの能力を高めるために、安定性保証かオフラインの計算効率を犠牲にする。
環境変化に対するオンラインの地域適応は考慮されないか、別の問題として扱われる。
本稿では,学習したDSの複雑性を,トレーニングや安定性保証において効率を損なうことなく向上させる手法を提案する。
さらに,初期学習されたDSの非線形性と環境の変化によって生じる任意の局所的非線形性とをシームレスに統合するための統一的なアプローチを提案する。
本稿では,ロボット制御のための漸近的に安定な非線形DSを学習するための幾何学的アプローチを提案する。
各DSは、潜在多様体上の調和減衰振動子としてモデル化される。
多様体のユークリッド埋め込み表現を学習することにより、我々のアプローチは空間の曲率内のDSの非線形性を符号化する。
多様体の明示的な埋め込み表現を持つことで、空間の局所的な変形を直接誘導することによって障害物回避を示すことができる。
まず,合成ベクトル場の2次元学習と,実環境における3次元ロボットのエンドエフェクタ動作の学習の2つのシナリオを通して,方法論の有効性を実証する。
関連論文リスト
- Learning to Boost the Performance of Stable Nonlinear Systems [0.0]
クローズドループ安定性保証による性能ブースティング問題に対処する。
本手法は,安定な非線形システムのための性能ブースティング制御器のニューラルネットワーククラスを任意に学習することを可能にする。
論文 参考訳(メタデータ) (2024-05-01T21:11:29Z) - Neural Contractive Dynamical Systems [13.046426079291376]
完全自律型ロボットが望ましくない、あるいは潜在的に有害な行動を起こさないためには、安定性の保証が不可欠である。
本稿では,ニューラルアーキテクチャが収縮を保証するニューラル収縮力学系を学習するための新しい手法を提案する。
提案手法は, 現状技術よりも所望の力学を正確に符号化し, 安定性の保証がより少ないことを示す。
論文 参考訳(メタデータ) (2024-01-17T17:18:21Z) - Learning Controllable Adaptive Simulation for Multi-resolution Physics [86.8993558124143]
完全深層学習に基づくサロゲートモデルとして,LAMP(Learning Controllable Adaptive Simulation for Multi- resolution Physics)を導入した。
LAMPは、前方進化を学習するためのグラフニューラルネットワーク(GNN)と、空間的洗練と粗大化のポリシーを学ぶためのGNNベースのアクター批判で構成されている。
我々は,LAMPが最先端のディープラーニングサロゲートモデルより優れており,長期予測誤差を改善するために,適応的なトレードオフ計算が可能であることを実証した。
論文 参考訳(メタデータ) (2023-05-01T23:20:27Z) - Data-Driven Control with Inherent Lyapunov Stability [3.695480271934742]
本研究では,非線形力学モデルと安定化制御器のパラメトリック表現をデータから共同学習する手法として,インヒーレント・リャプノフ安定度制御(CoILS)を提案する。
新たな構成によって保証される学習力学の安定化性に加えて、学習した制御器は学習力学の忠実性に関する特定の仮定の下で真の力学を安定化することを示す。
論文 参考訳(メタデータ) (2023-03-06T14:21:42Z) - Learning to Accelerate Partial Differential Equations via Latent Global
Evolution [64.72624347511498]
The Latent Evolution of PDEs (LE-PDE) is a simple, fast and scalable method to accelerate the simulation and inverse optimization of PDEs。
我々は,このような潜在力学を効果的に学習し,長期的安定性を確保するために,新たな学習目標を導入する。
更新対象の寸法が最大128倍、速度が最大15倍向上し、競争精度が向上した。
論文 参考訳(メタデータ) (2022-06-15T17:31:24Z) - OSCAR: Data-Driven Operational Space Control for Adaptive and Robust
Robot Manipulation [50.59541802645156]
オペレーショナル・スペース・コントロール(OSC)は、操作のための効果的なタスクスペース・コントローラとして使われてきた。
本稿では,データ駆動型OSCのモデル誤差を補償するOSC for Adaptation and Robustness (OSCAR)を提案する。
本手法は,様々なシミュレーション操作問題に対して評価し,制御器のベースラインの配列よりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2021-10-02T01:21:38Z) - Towards Generalisable Deep Inertial Tracking via Geometry-Aware Learning [2.694262942445446]
慣性追跡は、一時的な不利な運用条件下で重要な役割を果たす。
慣性追跡は伝統的に(i)過度なエラーの増大に悩まされ、(ii)広範囲で面倒なチューニングを必要とした。
本稿では,従来の制限を克服した新しいディープラーニング慣性追跡システムDITを提案する。
論文 参考訳(メタデータ) (2021-06-29T08:50:23Z) - Learning to Continuously Optimize Wireless Resource in a Dynamic
Environment: A Bilevel Optimization Perspective [52.497514255040514]
この研究は、データ駆動メソッドが動的環境でリソース割り当て戦略を継続的に学び、最適化することを可能にする新しいアプローチを開発しています。
学習モデルが新たなエピソードに段階的に適応できるように、連続学習の概念を無線システム設計に組み込むことを提案する。
我々の設計は、異なるデータサンプルにまたがる公平性を保証する、新しい二段階最適化定式化に基づいている。
論文 参考訳(メタデータ) (2021-05-03T07:23:39Z) - Reinforcement Learning with Fast Stabilization in Linear Dynamical
Systems [91.43582419264763]
未知の安定化線形力学系におけるモデルベース強化学習(RL)について検討する。
本研究では,環境を効果的に探索することで,基盤システムの高速安定化を証明できるアルゴリズムを提案する。
提案アルゴリズムはエージェント環境相互作用の時間ステップで$tildemathcalO(sqrtT)$ regretを達成した。
論文 参考訳(メタデータ) (2020-07-23T23:06:40Z) - Deep Reinforcement Learning amidst Lifelong Non-Stationarity [67.24635298387624]
政治以外のRLアルゴリズムは、寿命の長い非定常性に対処できることを示す。
提案手法は潜在変数モデルを用いて,現在および過去の経験から環境表現を学習する。
また, 生涯の非定常性を示すシミュレーション環境もいくつか導入し, 環境変化を考慮しないアプローチを著しく上回っていることを実証的に確認した。
論文 参考訳(メタデータ) (2020-06-18T17:34:50Z) - Deep Reinforcement Learning with Linear Quadratic Regulator Regions [26.555266610250797]
シミュレーションで訓練されたポリシーの出力に対して,アトラクションの安定領域を保証する新しい手法を提案する。
実システムに振り上げ反転振子のシミュレーションポリシを転送し,本手法の有効性を実証し,本手法の有効性を検証した。
論文 参考訳(メタデータ) (2020-02-23T03:50:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。