論文の概要: Signatures Meet Dynamic Programming: Generalizing Bellman Equations for Trajectory Following
- arxiv url: http://arxiv.org/abs/2312.05547v2
- Date: Wed, 19 Jun 2024 00:07:53 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-22 06:08:04.550573
- Title: Signatures Meet Dynamic Programming: Generalizing Bellman Equations for Trajectory Following
- Title(参考訳): 動的プログラミング - 軌道追従のためのベルマン方程式の一般化
- Authors: Motoya Ohnishi, Iretiayo Akinola, Jie Xu, Ajay Mandlekar, Fabio Ramos,
- Abstract要約: 信号は経路の分析的特徴と幾何学的特徴を効率的に捉えた経路の強力な表現として提案されている。
本研究では、経路シグネチャの最適制御や興味深い性質に典型的に使用される値関数間の接続を確立する。
我々は、シグネチャ制御と呼ばれるフレームワークの特性と利点を分析する。
- 参考スコア(独自算出の注目度): 22.66318047036675
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Path signatures have been proposed as a powerful representation of paths that efficiently captures the path's analytic and geometric characteristics, having useful algebraic properties including fast concatenation of paths through tensor products. Signatures have recently been widely adopted in machine learning problems for time series analysis. In this work we establish connections between value functions typically used in optimal control and intriguing properties of path signatures. These connections motivate our novel control framework with signature transforms that efficiently generalizes the Bellman equation to the space of trajectories. We analyze the properties and advantages of the framework, termed signature control. In particular, we demonstrate that (i) it can naturally deal with varying/adaptive time steps; (ii) it propagates higher-level information more efficiently than value function updates; (iii) it is robust to dynamical system misspecification over long rollouts. As a specific case of our framework, we devise a model predictive control method for path tracking. This method generalizes integral control, being suitable for problems with unknown disturbances. The proposed algorithms are tested in simulation, with differentiable physics models including typical control and robotics tasks such as point-mass, curve following for an ant model, and a robotic manipulator.
- Abstract(参考訳): 経路シグネチャは、テンソル積を通る経路の高速連結を含む有用な代数的性質を持つ、経路の解析的および幾何学的特性を効率的に捉えた経路の強力な表現として提案されている。
近年,時系列解析のための機械学習問題において,シグナチャが広く採用されている。
本研究では、経路シグネチャの最適制御や興味深い性質に典型的に使用される値関数間の接続を確立する。
これらの接続は、ベルマン方程式を軌道空間に効率的に一般化するシグネチャ変換によって、我々の新しい制御フレームワークを動機付けている。
我々は、シグネチャ制御と呼ばれるフレームワークの特性と利点を分析する。
特に、私たちは、
(i)自然に変化・適応的な時間段階を扱うことができる。
(ii)値関数更新よりも高レベルの情報を効率的に伝播する。
三 長期のロールアウトに対して力学系の不特定性に頑健であること。
本フレームワークの具体例として,経路追跡のためのモデル予測制御法を提案する。
この方法は積分制御を一般化し、未知の乱問題に適合する。
提案したアルゴリズムはシミュレーションにおいてテストされ、典型的な制御や点質量、アリモデルに対する曲線、ロボットマニピュレータなどのロボット工学のタスクを含む微分可能な物理モデルが試験される。
関連論文リスト
- Safe Active Learning for Time-Series Modeling with Gaussian Processes [7.505622158856545]
時系列モデルの学習はシミュレーションや予測といった多くのアプリケーションに有用である。
本研究では,安全制約を考慮した時系列モデルを積極的に学習する問題について考察する。
提案手法は,入力空間を動的に探索することにより,時系列モデル学習に適したデータ,すなわち入力と出力の軌跡を生成する。
論文 参考訳(メタデータ) (2024-02-09T09:40:33Z) - TimewarpVAE: Simultaneous Time-Warping and Representation Learning of Trajectories [15.28090738928877]
TimewarpVAEは、空間変動の時間変化と潜時要因を同時に学習する多様体学習アルゴリズムである。
本稿では,手書きおよびフォーク操作データセットにおける空間変動の適切な時間アライメントと有意義な表現をアルゴリズムがどのように学習するかを示す。
論文 参考訳(メタデータ) (2023-10-24T17:43:16Z) - Learning minimal representations of stochastic processes with
variational autoencoders [52.99137594502433]
プロセスを記述するのに必要なパラメータの最小セットを決定するために、教師なしの機械学習アプローチを導入する。
我々の手法はプロセスを記述する未知のパラメータの自律的な発見を可能にする。
論文 参考訳(メタデータ) (2023-07-21T14:25:06Z) - Performance Embeddings: A Similarity-based Approach to Automatic
Performance Optimization [71.69092462147292]
パフォーマンス埋め込みは、アプリケーション間でパフォーマンスチューニングの知識伝達を可能にする。
本研究では, 深層ニューラルネットワーク, 密度およびスパース線形代数合成, および数値風速予測ステンシルのケーススタディにおいて, この伝達チューニング手法を実証する。
論文 参考訳(メタデータ) (2023-03-14T15:51:35Z) - Multi-Scale Control Signal-Aware Transformer for Motion Synthesis
without Phase [72.01862340497314]
マルチスケール制御信号認識変換器(MCS-T)を提案する。
MCS-Tは補助情報を用いてメソッドが生成した動作に匹敵する動作をうまく生成できる。
論文 参考訳(メタデータ) (2023-03-03T02:56:44Z) - Neural Motion Fields: Encoding Grasp Trajectories as Implicit Value
Functions [65.84090965167535]
本稿では,ニューラルネットワークによってパラメータ化される暗黙的値関数として,オブジェクト点群と相対的タスク軌跡の両方を符号化する新しいオブジェクト表現であるNeural Motion Fieldsを提案する。
このオブジェクト中心表現は、SE(3)空間上の連続分布をモデル化し、サンプリングベースのMPCを利用して、この値関数を最適化することで、反応的に把握することができる。
論文 参考訳(メタデータ) (2022-06-29T18:47:05Z) - On the effectiveness of Randomized Signatures as Reservoir for Learning
Rough Dynamics [22.08436589595832]
時系列解析を行う強力なツールは、粗い経路理論に根ざし、いわゆるSignature Transformを活用する。
このアルゴリズムは理論的な保証が強いが、高次元のデータにスケールすることは困難である。
我々は、Johnson-Lindenstrauss Lemmaを用いて得られたランダム化符号と呼ばれる最近導出されたランダムプロジェクション変種について研究する。
論文 参考訳(メタデータ) (2022-01-02T17:37:25Z) - Accurate methods for the analysis of strong-drive effects in parametric
gates [94.70553167084388]
正確な数値と摂動解析手法を用いて効率的にゲートパラメータを抽出する方法を示す。
我々は,$i$SWAP, Control-Z, CNOT など,異なる種類のゲートに対する最適操作条件を同定する。
論文 参考訳(メタデータ) (2021-07-06T02:02:54Z) - A non-autonomous equation discovery method for time signal
classification [1.933681537640272]
非自律的力学方程式に基づいて時間信号を解析するフレームワークを開発する。
随伴法を用いて勾配を効率的に計算する方法を示す。
また,提案手法が位相像の形で解釈可能性をもたらすことを示す。
論文 参考訳(メタデータ) (2020-11-22T20:03:46Z) - Tracking Performance of Online Stochastic Learners [57.14673504239551]
オンラインアルゴリズムは、大規模なバッチにデータを保存したり処理したりすることなく、リアルタイムで更新を計算できるため、大規模な学習環境で人気がある。
一定のステップサイズを使用すると、これらのアルゴリズムはデータやモデル特性などの問題パラメータのドリフトに適応し、適切な精度で最適解を追跡する能力を持つ。
定常仮定に基づく定常状態性能とランダムウォークモデルによるオンライン学習者の追跡性能の関連性を確立する。
論文 参考訳(メタデータ) (2020-04-04T14:16:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。