論文の概要: Task Generalization with Stability Guarantees via Elastic Dynamical
System Motion Policies
- arxiv url: http://arxiv.org/abs/2309.01884v1
- Date: Tue, 5 Sep 2023 01:22:19 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-06 16:53:20.391331
- Title: Task Generalization with Stability Guarantees via Elastic Dynamical
System Motion Policies
- Title(参考訳): 弾性力学系運動ポリシーによる安定性保証を伴うタスク一般化
- Authors: Tianyu Li, Nadia Figueroa
- Abstract要約: 動的システム(DS)をベースとしたLearning from Demonstration(LfD)は,いくつかのトラジェクトリから,安定性と収束性を保証するリアクティブな動作ポリシの学習を可能にする。
本稿では,Gaussian Mixture Model (GMM) をベースとした線形Varying (LPV) DSの定式化にタスクパラメータを組み込んだ新しいDS学習手法であるElastic-DSを提案する。
我々は、制御理論上の望ましい保証を保ちながら、シミュレーションおよび実ロボット実験の無数の長所を示す。
- 参考スコア(独自算出の注目度): 3.5445578113117113
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Dynamical System (DS) based Learning from Demonstration (LfD) allows learning
of reactive motion policies with stability and convergence guarantees from a
few trajectories. Yet, current DS learning techniques lack the flexibility to
generalize to new task instances as they ignore explicit task parameters that
inherently change the underlying trajectories. In this work, we propose
Elastic-DS, a novel DS learning, and generalization approach that embeds task
parameters into the Gaussian Mixture Model (GMM) based Linear Parameter Varying
(LPV) DS formulation. Central to our approach is the Elastic-GMM, a GMM
constrained to SE(3) task-relevant frames. Given a new task instance/context,
the Elastic-GMM is transformed with Laplacian Editing and used to re-estimate
the LPV-DS policy. Elastic-DS is compositional in nature and can be used to
construct flexible multi-step tasks. We showcase its strength on a myriad of
simulated and real-robot experiments while preserving desirable
control-theoretic guarantees. Supplementary videos can be found at
https://sites.google.com/view/elastic-ds
- Abstract(参考訳): dynamical system (ds) ベースのlearning from demonstration (lfd) は、いくつかの軌道から安定性と収束性を保証するリアクティブな運動ポリシーの学習を可能にする。
しかし、現在のDS学習技術は、基礎となる軌道を本質的に変更する明示的なタスクパラメータを無視して、新しいタスクインスタンスに一般化する柔軟性を欠いている。
本研究では,Gaussian Mixture Model(GMM)に基づく線形パラメータバリアリング(LPV)DSの定式化にタスクパラメータを組み込む,新しいDS学習および一般化手法であるElastic-DSを提案する。
我々のアプローチの中心は、SE(3)タスク関連フレームに制約されたGMMであるElastic-GMMである。
新しいタスクインスタンス/コンテキストが与えられたとき、Elastic-GMMはLaplacian Editingで変換され、LPV-DSポリシーの再見積に使用される。
Elastic-DSは本質的に構成的であり、柔軟なマルチステップタスクを構築するために使用できる。
我々は、制御理論上の望ましい保証を保ちながら、シミュレーションおよび実ロボット実験の無数の強度を示す。
追加ビデオはhttps://sites.google.com/view/elastic-dsで見ることができる。
関連論文リスト
- Reference Trustable Decoding: A Training-Free Augmentation Paradigm for Large Language Models [79.41139393080736]
大規模言語モデル(LLM)は急速に進歩し、印象的な機能を示している。
In-Context Learning (ICL) など。
効率的なファインチューニング(PEFT)は、現在2つの主要な拡張方法である。
下流タスクへのLLM。
我々は、モデルが微調整なしで新しいタスクに迅速に適応できるパラダイムである参照信頼復号(RTD)を提案する。
論文 参考訳(メタデータ) (2024-09-30T10:48:20Z) - Mamba-FSCIL: Dynamic Adaptation with Selective State Space Model for Few-Shot Class-Incremental Learning [113.89327264634984]
FSCIL(Few-shot class-incremental Learning)は、最小限のトレーニングサンプルを持つモデルに新しいクラスを統合するという課題に直面している。
従来の手法では、固定パラメータ空間に依存する静的適応を広く採用し、逐次到着するデータから学習する。
本稿では、動的適応のための中間特徴に基づいてプロジェクションパラメータを動的に調整する2つの選択型SSMプロジェクタを提案する。
論文 参考訳(メタデータ) (2024-07-08T17:09:39Z) - Learning Optimal Deterministic Policies with Stochastic Policy Gradients [62.81324245896716]
政策勾配法(PG法)は連続強化学習(RL法)問題に対処する手法として成功している。
一般的には、収束(ハイパー)政治は、決定論的バージョンをデプロイするためにのみ学習される。
本稿では,サンプルの複雑性とデプロイされた決定論的ポリシのパフォーマンスのトレードオフを最適化するために,学習に使用する探索レベルの調整方法を示す。
論文 参考訳(メタデータ) (2024-05-03T16:45:15Z) - Task-Distributionally Robust Data-Free Meta-Learning [99.56612787882334]
Data-Free Meta-Learning (DFML)は、複数の事前学習モデルを活用することで、独自のトレーニングデータを必要とせずに、新しいタスクを効率的に学習することを目的としている。
TDS(Task-Distribution Shift)とTDC(Task-Distribution Corruption)の2つの大きな課題を初めて明らかにした。
論文 参考訳(メタデータ) (2023-11-23T15:46:54Z) - Virtual Data Augmentation: A Robust and General Framework for
Fine-tuning Pre-trained Models [51.46732511844122]
強力な事前訓練型言語モデル(PLM)は、小さな摂動や意図的な攻撃によって騙されることがある。
VDA(Virtual Data Augmentation)は,PLMを高度に微調整するための一般的なフレームワークである。
本手法は, PLMの堅牢性を向上し, 敵攻撃時の性能劣化を軽減する。
論文 参考訳(メタデータ) (2021-09-13T09:15:28Z) - DySMHO: Data-Driven Discovery of Governing Equations for Dynamical
Systems via Moving Horizon Optimization [77.34726150561087]
本稿では,スケーラブルな機械学習フレームワークである移動水平最適化(DySMHO)による動的システムの発見について紹介する。
DySMHOは、基底関数の大きな辞書から基礎となる支配方程式を逐次学習する。
標準非線形力学系の例は、DySMHOが規則を正確に回復できることを示すために用いられる。
論文 参考訳(メタデータ) (2021-07-30T20:35:03Z) - Learn Dynamic-Aware State Embedding for Transfer Learning [0.8756822885568589]
報酬機能以外のすべてのタスク(MDP)が同じ環境を動的に共有する設定を検討します。
この設定では、MDPのダイナミクスは、一様ランダムなポリシーによって推測できる、転送のよい知識である。
我々は、一様ランダムポリシーの必要性を避けるため、任意のポリシーの軌跡からバイナリMDPのダイナミクスを推定できることを観察する。
論文 参考訳(メタデータ) (2021-01-06T19:07:31Z) - Enabling Continual Learning with Differentiable Hebbian Plasticity [18.12749708143404]
連続学習は、獲得した知識を保護しながら、新しいタスクや知識を順次学習する問題である。
破滅的な忘れ物は、そのような学習プロセスを実行するニューラルネットワークにとって、大きな課題となる。
微分可能なヘビアン塑性からなるヘビアンコンソリデーションモデルを提案する。
論文 参考訳(メタデータ) (2020-06-30T06:42:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。