論文の概要: L-Learning : A Lyapunov-Based Approach Leveraging Lagrangian Mechanics for Efficient and Stable Robot Tracking
- arxiv url: http://arxiv.org/abs/2605.26648v1
- Date: Tue, 26 May 2026 07:31:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:41.73089
- Title: L-Learning : A Lyapunov-Based Approach Leveraging Lagrangian Mechanics for Efficient and Stable Robot Tracking
- Title(参考訳): L-Learning : ラグランジアン・メカニクスを応用したL-punov-based Approach for Efficient and Staable Robot Tracking
- Authors: Quan Quan, Hao Li,
- Abstract要約: L-Learningは、Lyapunovの安定性理論とLagrangianの力学を統合し、軌道追跡性能を向上させる、ロボティクスのための新しいデータ駆動制御フレームワークである。
制御精度が優れ、理論安定性が保証され、サンプル効率が高いことが特徴で、Lラーニングは実用ロボット応用の有望なソリューションである。
- 参考スコア(独自算出の注目度): 15.952830497942125
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents L-Learning, a novel data-driven control framework for robotics that integrates Lyapunov stability theory with Lagrangian mechanics to enhance trajectory tracking performance. While traditional control methods often suffer from performance degradation in dynamic and uncertain environments, data-driven approaches, while more adaptable, are frequently limited by high sample complexity and a lack of rigorous stability guarantees. L-Learning mitigates these challenges by explicitly learning the system's energy function from data, thereby optimizing performance while ensuring closed-loop stability intrinsically. Characterized by superior control accuracy, theoretical stability guarantees, and high sample efficiency, L-Learning represents a promising solution for practical robotic applications.
- Abstract(参考訳): 本稿ではL-Learningについて述べる。L-LearningはLyapunovの安定性理論とLagrangianの力学を統合して軌道追跡性能を向上させるロボットのための新しいデータ駆動制御フレームワークである。
従来の制御手法は、動的で不確実な環境での性能劣化に悩まされることが多いが、データ駆動のアプローチは、適応性が高いが、高いサンプルの複雑さと厳密な安定性の保証が欠如しているため、しばしば制限される。
L-ラーニングは、データからシステムのエネルギー関数を明示的に学習することでこれらの課題を緩和し、本質的に閉ループ安定性を確保しながら性能を最適化する。
制御精度が優れ、理論安定性が保証され、サンプル効率が高いことが特徴で、Lラーニングは実用ロボット応用の有望なソリューションである。
関連論文リスト
- SmoothVLA: Aligning Vision-Language-Action Models with Physical Constraints via Intrinsic Smoothness Optimization [11.680753432998358]
VLA(Vision-Language-Action)モデルは、ロボット操作の強力なパラダイムとして登場した。
SmoothVLAは,タスク性能と動作のスムーズさを相乗的に最適化する,新しい強化学習ファインチューニングフレームワークである。
我々の研究は、本質的な報酬最適化を通じて、VLAモデルと物理世界の制約を整合させるスケーラブルなアプローチを提供する。
論文 参考訳(メタデータ) (2026-03-14T12:47:04Z) - Human-in-the-loop Online Rejection Sampling for Robotic Manipulation [55.99788088622936]
Hi-ORSは、オンライン微調整中に負の報酬を得たサンプルをフィルタリングすることで、値推定を安定化する。
Hi-ORSは、わずか1.5時間でコンタクトリッチな操作をマスターするためのpiベースのポリシーを微調整する。
論文 参考訳(メタデータ) (2025-10-30T11:53:08Z) - Robotic World Model: A Neural Network Simulator for Robust Policy Optimization in Robotics [50.191655141020505]
この研究は、長期水平予測、エラー蓄積、およびsim-to-real転送の課題に対処することで、モデルに基づく強化学習を前進させる。
スケーラブルでロバストなフレームワークを提供することで、現実のアプリケーションにおいて適応的で効率的なロボットシステムを実現することができる。
論文 参考訳(メタデータ) (2025-01-17T10:39:09Z) - Learning to Boost the Performance of Stable Nonlinear Systems [0.0]
クローズドループ安定性保証による性能ブースティング問題に対処する。
本手法は,安定な非線形システムのための性能ブースティング制御器のニューラルネットワーククラスを任意に学習することを可能にする。
論文 参考訳(メタデータ) (2024-05-01T21:11:29Z) - Distributed Robust Learning based Formation Control of Mobile Robots based on Bioinspired Neural Dynamics [14.149584412213269]
まず,変数構造とカスケード設計手法を用いた分散推定器を導入し,実時間性能向上のための微分情報の必要性を排除した。
そして、スムーズな制御入力を提供し、スピードジャンプ問題を効果的に解決することを目的とした、バイオインスパイアされたニューラルダイナミックベースのアプローチを用いて、キネマティックトラッキング制御法を開発した。
完全に未知の力学と乱れを持つロボットの課題に対処するために,学習に基づく頑健な動的コントローラを開発した。
論文 参考訳(メタデータ) (2024-03-23T04:36:12Z) - Active Learning of Discrete-Time Dynamics for Uncertainty-Aware Model Predictive Control [46.81433026280051]
本稿では,非線形ロボットシステムの力学を積極的にモデル化する自己教師型学習手法を提案する。
我々のアプローチは、目に見えない飛行条件に一貫して適応することで、高いレジリエンスと一般化能力を示す。
論文 参考訳(メタデータ) (2022-10-23T00:45:05Z) - Probabilistic robust linear quadratic regulators with Gaussian processes [73.0364959221845]
ガウス過程(GP)のような確率モデルは、制御設計に続く使用のためのデータから未知の動的システムを学ぶための強力なツールです。
本稿では、確率的安定性マージンに関して堅牢なコントローラを生成する線形化GPダイナミクスのための新しいコントローラ合成について述べる。
論文 参考訳(メタデータ) (2021-05-17T08:36:18Z) - Imitation Learning for Robust and Safe Real-time Motion Planning: A
Contraction Theory Approach [9.35511513240868]
LAG-ROSは、境界外乱によって乱される安全臨界非線形システムのリアルタイムロバストな動作計画アルゴリズムである。
LAG-ROSはリアルタイム計算のためのより速い実行の速度のより高い制御性能そしてタスクの成功率を達成します。
論文 参考訳(メタデータ) (2021-02-25T03:47:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。