論文の概要: Obstacle Avoidance using Dynamic Movement Primitives and Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2510.09254v1
- Date: Fri, 10 Oct 2025 10:51:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 00:38:48.713984
- Title: Obstacle Avoidance using Dynamic Movement Primitives and Reinforcement Learning
- Title(参考訳): 動的運動プリミティブと強化学習を用いた障害物回避
- Authors: Dominik Urbaniak, Alejandro Agostini, Pol Ramon, Jan Rosell, Raúl Suárez, Michael Suppa,
- Abstract要約: 本研究は, 1つの人工的な実験からスムーズで, ほぼ最適な衝突のない3次元カルト軌道を高速に生成する手法を提案する。
デモは動的運動プリミティブ(DMP)として符号化され、ポリシーベースの強化学習を用いて反復的に再構成される。
この手法はシミュレーションと実ロボット実験で検証され、計算と実行時間の点でRTT-Connectベースラインを上回っている。
- 参考スコア(独自算出の注目度): 36.09105994195904
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Learning-based motion planning can quickly generate near-optimal trajectories. However, it often requires either large training datasets or costly collection of human demonstrations. This work proposes an alternative approach that quickly generates smooth, near-optimal collision-free 3D Cartesian trajectories from a single artificial demonstration. The demonstration is encoded as a Dynamic Movement Primitive (DMP) and iteratively reshaped using policy-based reinforcement learning to create a diverse trajectory dataset for varying obstacle configurations. This dataset is used to train a neural network that takes as inputs the task parameters describing the obstacle dimensions and location, derived automatically from a point cloud, and outputs the DMP parameters that generate the trajectory. The approach is validated in simulation and real-robot experiments, outperforming a RRT-Connect baseline in terms of computation and execution time, as well as trajectory length, while supporting multi-modal trajectory generation for different obstacle geometries and end-effector dimensions. Videos and the implementation code are available at https://github.com/DominikUrbaniak/obst-avoid-dmp-pi2.
- Abstract(参考訳): 学習に基づくモーションプランニングは、ほぼ最適な軌道を素早く生成できる。
しかし、大規模なトレーニングデータセットか、人間のデモの高価な収集を必要とすることが多い。
本研究は, 1つの人工的な実験からスムーズで, ほぼ最適な衝突のない3次元カルト軌道を高速に生成する手法を提案する。
デモは動的運動プリミティブ(Dynamic Movement Primitive, DMP)として符号化され、ポリシーベースの強化学習を用いて反復的に再構成され、さまざまな障害物構成のための多様な軌道データセットを生成する。
このデータセットは、障害物次元と位置を記述するタスクパラメータを入力として入力するニューラルネットワークをトレーニングするために使用され、ポイントクラウドから自動的に派生し、軌道を生成するDMPパラメータを出力する。
この手法はシミュレーションと実ロボット実験において検証され、RRT-Connectのベースラインを計算と実行時間、軌道長で上回り、異なる障害物測度と端エフェクタ次元のマルチモーダル軌道生成をサポートする。
ビデオと実装コードはhttps://github.com/DominikUrbaniak/obst-avoid-dmp-pi2で公開されている。
関連論文リスト
- Learning to Track Any Points from Human Motion [55.831218129679144]
点追跡のための擬似ラベル付きトレーニングデータを生成する自動パイプラインを提案する。
AnthroTAPでトレーニングされた点追跡モデルは、TAP-Vidベンチマークで注釈付き最先端性能を達成する。
論文 参考訳(メタデータ) (2025-07-08T17:59:58Z) - Gradient-based Trajectory Optimization with Parallelized Differentiable Traffic Simulation [24.95575815501035]
インテリジェントドライバモデル(IDM)に基づく並列化微分可能交通シミュレータを提案する。
我々の車両シミュレーターは、車両の動きを効率的にモデル化し、現実世界のデータに合うように教師できる軌道を生成する。
このシミュレータを用いて、入力軌跡の雑音をフィルタリングし(軌道フィルタリング)、スパース軌跡から高密度軌跡を再構成し(軌道再構成)、将来の軌跡を予測する。
論文 参考訳(メタデータ) (2024-12-21T19:53:38Z) - Autonomous Vehicle Controllers From End-to-End Differentiable Simulation [57.278726604424556]
そこで我々は,AVコントローラのトレーニングにAPG(analytic Policy gradients)アプローチを適用可能なシミュレータを提案し,その設計を行う。
提案するフレームワークは, エージェントがより根底的なポリシーを学ぶのを助けるために, 環境力学の勾配を役立てる, エンド・ツー・エンドの訓練ループに, 微分可能シミュレータを組み込む。
ダイナミクスにおけるパフォーマンスとノイズに対する堅牢性の大幅な改善と、全体としてより直感的なヒューマンライクな処理が見られます。
論文 参考訳(メタデータ) (2024-09-12T11:50:06Z) - Exploring Dynamic Transformer for Efficient Object Tracking [58.120191254379854]
効率的なトラッキングのための動的トランスフォーマーフレームワークであるDyTrackを提案する。
DyTrackは、様々な入力に対して適切な推論ルートを設定することを学習し、利用可能な計算予算をより活用する。
複数のベンチマークの実験では、DyTrackは単一のモデルで有望な速度精度のトレードオフを実現している。
論文 参考訳(メタデータ) (2024-03-26T12:31:58Z) - TimewarpVAE: Simultaneous Time-Warping and Representation Learning of Trajectories [15.28090738928877]
TimewarpVAEは、空間変動の時間変化と潜時要因を同時に学習する多様体学習アルゴリズムである。
本稿では,手書きおよびフォーク操作データセットにおける空間変動の適切な時間アライメントと有意義な表現をアルゴリズムがどのように学習するかを示す。
論文 参考訳(メタデータ) (2023-10-24T17:43:16Z) - 3DMOTFormer: Graph Transformer for Online 3D Multi-Object Tracking [15.330384668966806]
最先端の3Dマルチオブジェクト追跡(MOT)アプローチは通常、Kalman Filterのような非学習モデルベースのアルゴリズムに依存している。
本稿では3DMOTFormerを提案する。この3D MOTフレームワークはトランスフォーマーアーキテクチャをベースに構築されている。
提案手法は, nuScenesバリデーションとテストスプリットでそれぞれ71.2%, AMOTA68.2%を達成している。
論文 参考訳(メタデータ) (2023-08-12T19:19:58Z) - Neural Motion Fields: Encoding Grasp Trajectories as Implicit Value
Functions [65.84090965167535]
本稿では,ニューラルネットワークによってパラメータ化される暗黙的値関数として,オブジェクト点群と相対的タスク軌跡の両方を符号化する新しいオブジェクト表現であるNeural Motion Fieldsを提案する。
このオブジェクト中心表現は、SE(3)空間上の連続分布をモデル化し、サンプリングベースのMPCを利用して、この値関数を最適化することで、反応的に把握することができる。
論文 参考訳(メタデータ) (2022-06-29T18:47:05Z) - Generating Synthetic Training Data for Deep Learning-Based UAV
Trajectory Prediction [11.241614693184323]
本稿では,無人航空機車(UAV)の合成軌道データを生成する手法を提案する。
実世界のUAV追跡データセットにおいて,RNNに基づく予測モデルが従来の参照モデルより優れていることを示す。
論文 参考訳(メタデータ) (2021-07-01T13:08:31Z) - Risk-Averse MPC via Visual-Inertial Input and Recurrent Networks for
Online Collision Avoidance [95.86944752753564]
本稿では,モデル予測制御(MPC)の定式化を拡張したオンライン経路計画アーキテクチャを提案する。
我々のアルゴリズムは、状態推定の共分散を推論するリカレントニューラルネットワーク(RNN)とオブジェクト検出パイプラインを組み合わせる。
本手法のロバスト性は, 複雑な四足歩行ロボットの力学で検証され, ほとんどのロボットプラットフォームに適用可能である。
論文 参考訳(メタデータ) (2020-07-28T07:34:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。