論文の概要: KeyCLD: Learning Constrained Lagrangian Dynamics in Keypoint Coordinates
from Images
- arxiv url: http://arxiv.org/abs/2206.11030v1
- Date: Wed, 22 Jun 2022 12:51:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-23 21:16:22.025034
- Title: KeyCLD: Learning Constrained Lagrangian Dynamics in Keypoint Coordinates
from Images
- Title(参考訳): KeyCLD: 画像からのキーポイント座標における制約付きラグランジアンダイナミクスの学習
- Authors: Rembert Daems, Jeroen Taets, Francis wyffels and Guillaume Crevecoeur
- Abstract要約: KeyCLDは、イメージからラグランジアンダイナミクスを学ぶためのフレームワークである。
我々は、dm_control振り子、カートポール、アクロボット環境の画像からラグランジアン力学の学習を初めて実演する。
- 参考スコア(独自算出の注目度): 1.1125968799758437
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present KeyCLD, a framework to learn Lagrangian dynamics from images.
Learned keypoints represent semantic landmarks in images and can directly
represent state dynamics. Interpreting this state as Cartesian coordinates
coupled with explicit holonomic constraints, allows expressing the dynamics
with a constrained Lagrangian. Our method explicitly models kinetic and
potential energy, thus allowing energy based control. We are the first to
demonstrate learning of Lagrangian dynamics from images on the dm_control
pendulum, cartpole and acrobot environments. This is a step forward towards
learning Lagrangian dynamics from real-world images, since previous work in
literature was only applied to minimalistic images with monochromatic shapes on
empty backgrounds. Please refer to our project page for code and additional
results: https://rdaems.github.io/keycld/
- Abstract(参考訳): 画像からラグランジアン力学を学習するフレームワークであるKeyCLDを提案する。
学習されたキーポイントはイメージのセマンティックランドマークを表し、状態のダイナミクスを直接表現することができる。
この状態を、明示的なホロノミック制約と結合した直交座標として解釈することで、制約されたラグランジアンでダイナミクスを表現することができる。
提案手法は運動エネルギーとポテンシャルエネルギーを明示的にモデル化し,エネルギーベース制御を可能にする。
我々は、dm_control振り子、カートポール、アクロボット環境の画像からラグランジアン力学を初めて学習した。
これは、文学におけるこれまでの研究は、空の背景に単色形状の最小限の画像にのみ適用されていたため、現実のイメージからラグランジュ力学を学ぶための一歩である。
https://rdaems.github.io/keycld/. プロジェクトページ コードと追加結果を参照してください。
関連論文リスト
- SOLD: Reinforcement Learning with Slot Object-Centric Latent Dynamics [16.020835290802548]
Slot-Attention for Object-centric Latent Dynamicsは、画素入力からオブジェクト中心の動的モデルを学ぶ新しいアルゴリズムである。
構造化潜在空間は、モデル解釈可能性を改善するだけでなく、振る舞いモデルが推論する価値のある入力空間も提供することを実証する。
以上の結果から,SOLDは,最先端のモデルベースRLアルゴリズムであるDreamerV3よりも,さまざまなベンチマークロボット環境において優れていた。
論文 参考訳(メタデータ) (2024-10-11T14:03:31Z) - VDG: Vision-Only Dynamic Gaussian for Driving Simulation [112.6139608504842]
ポーズフリーな動的ガウス法(VDG)に自己教師付きVOを導入する。
VDGはRGB画像入力のみで動作可能で、ポーズフリーのダイナミックビュー合成法に比べて高速で広いシーンで動的シーンを構築することができる。
その結果,現状の動的ビュー合成法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2024-06-26T09:29:21Z) - VoxPoser: Composable 3D Value Maps for Robotic Manipulation with
Language Models [38.503337052122234]
大規模言語モデル(LLM)は、ロボット操作のために抽出できる豊富な行動可能な知識を持っていることが示されている。
我々は,オープンな命令セットとオープンなオブジェクトセットが与えられた様々な操作タスクに対して,ロボット軌道を合成することを目指している。
筆者らは,接触に富んだインタラクションを含むシーンのダイナミックスモデルを効率的に学習することで,提案フレームワークがオンライン体験の恩恵を享受できることを実証する。
論文 参考訳(メタデータ) (2023-07-12T07:40:48Z) - Modelling Latent Dynamics of StyleGAN using Neural ODEs [52.03496093312985]
我々は、GANから独立に反転した潜在符号の軌跡を学習する。
学習した連続軌道により、無限のフレームと一貫したビデオ操作を行うことができる。
提案手法は最先端の性能を実現するが,計算量が少なくなる。
論文 参考訳(メタデータ) (2022-08-23T21:20:38Z) - Masked World Models for Visual Control [90.13638482124567]
視覚表現学習と動的学習を分離する視覚モデルに基づくRLフレームワークを提案する。
提案手法は,様々な視覚ロボット作業における最先端性能を実現する。
論文 参考訳(メタデータ) (2022-06-28T18:42:27Z) - Learning Latent Graph Dynamics for Deformable Object Manipulation [37.12269538618698]
本研究はDefOrmable Object Manipulationの遅延グラフダイナミクスを学習することを目的とする。
G-DOOMは、変形可能なオブジェクトを相互作用するキーポイントのスパースセットとして近似する。
キーポイントの幾何と相互作用のダイナミクスを抽象的に捉えるグラフニューラルネットワークを学習する。
論文 参考訳(メタデータ) (2021-04-25T13:06:02Z) - GEM: Group Enhanced Model for Learning Dynamical Control Systems [78.56159072162103]
サンプルベースの学習が可能な効果的なダイナミクスモデルを構築します。
リー代数ベクトル空間上のダイナミクスの学習は、直接状態遷移モデルを学ぶよりも効果的であることを示す。
この研究は、ダイナミクスの学習とリー群の性質の関連性を明らかにし、新たな研究の方向への扉を開く。
論文 参考訳(メタデータ) (2021-04-07T01:08:18Z) - Neural Dynamic Policies for End-to-End Sensorimotor Learning [51.24542903398335]
感覚運動制御における現在の主流パラダイムは、模倣であれ強化学習であれ、生の行動空間で政策を直接訓練することである。
軌道分布空間の予測を行うニューラル・ダイナミック・ポリシー(NDP)を提案する。
NDPは、いくつかのロボット制御タスクにおいて、効率と性能の両面で、これまでの最先端よりも優れている。
論文 参考訳(メタデータ) (2020-12-04T18:59:32Z) - Deep Imitation Learning for Bimanual Robotic Manipulation [70.56142804957187]
本稿では,ロボットによるバイマニュアル操作のための深層模倣学習フレームワークを提案する。
中心となる課題は、操作スキルを異なる場所にあるオブジェクトに一般化することである。
i)マルチモーダルダイナミクスを要素運動プリミティブに分解し、(ii)リカレントグラフニューラルネットワークを用いて各プリミティブをパラメータ化して相互作用を捕捉し、(iii)プリミティブを逐次的に構成する高レベルプランナと、プリミティブダイナミクスと逆運動学制御を組み合わせた低レベルコントローラを統合することを提案する。
論文 参考訳(メタデータ) (2020-10-11T01:40:03Z) - Unsupervised Learning of Lagrangian Dynamics from Images for Prediction
and Control [12.691047660244335]
画像からラグランジアン力学を学習する新しい教師なしニューラルネットワークモデルを導入する。
このモデルは、座標対応変分オートエンコーダで同時に学習される一般化座標上でラグランジアン力学を推論する。
論文 参考訳(メタデータ) (2020-07-03T20:06:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。