論文の概要: Towards Bio-Inspired Robotic Trajectory Planning via Self-Supervised RNN
- arxiv url: http://arxiv.org/abs/2507.02171v1
- Date: Wed, 02 Jul 2025 22:05:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-04 15:37:15.273499
- Title: Towards Bio-Inspired Robotic Trajectory Planning via Self-Supervised RNN
- Title(参考訳): 自己監督型RNNによるバイオインスパイアされたロボット軌道計画に向けて
- Authors: Miroslav Cibula, Kristína Malinovská, Matthias Kerzel,
- Abstract要約: ロボット工学における軌道計画は、ロボットエージェントを初期状態から望ましい最終状態へと導く一連の関節構成を生成すると理解されている。
近年の進歩は、軌道計画がトラジェクトリの教師付きシーケンス学習によっても実行可能であることを示している。
本稿では,軌道モデル構築のための繰り返しアーキテクチャに基づく,認知にインスパイアされた自己教師型学習手法を提案する。
- 参考スコア(独自算出の注目度): 1.474723404975345
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Trajectory planning in robotics is understood as generating a sequence of joint configurations that will lead a robotic agent, or its manipulator, from an initial state to the desired final state, thus completing a manipulation task while considering constraints like robot kinematics and the environment. Typically, this is achieved via sampling-based planners, which are computationally intensive. Recent advances demonstrate that trajectory planning can also be performed by supervised sequence learning of trajectories, often requiring only a single or fixed number of passes through a neural architecture, thus ensuring a bounded computation time. Such fully supervised approaches, however, perform imitation learning; they do not learn based on whether the trajectories can successfully reach a goal, but try to reproduce observed trajectories. In our work, we build on this approach and propose a cognitively inspired self-supervised learning scheme based on a recurrent architecture for building a trajectory model. We evaluate the feasibility of the proposed method on a task of kinematic planning for a robotic arm. The results suggest that the model is able to learn to generate trajectories only using given paired forward and inverse kinematics models, and indicate that this novel method could facilitate planning for more complex manipulation tasks requiring adaptive solutions.
- Abstract(参考訳): ロボット工学における軌道計画は、ロボットエージェントまたはそのマニピュレータを初期状態から望ましい最終状態に導く一連のジョイント構成を生成し、ロボット運動学や環境などの制約を考慮して操作タスクを完了すると理解されている。
通常、これはサンプリングベースのプランナーによって達成される。
最近の進歩は、トラジェクトリ計画がトラジェクトリの教師付きシーケンス学習によっても実行可能であることを示している。
しかし、そのような完全に教師されたアプローチは模倣学習を行い、軌道が目標に達するかどうかに基づいて学習するのではなく、観測された軌道を再現しようと試みる。
本研究は,本手法に基づいて,軌道モデル構築のための反復的アーキテクチャに基づく,認知にインスパイアされた自己教師付き学習手法を提案する。
ロボットアームの運動計画作業における提案手法の有効性を評価する。
以上の結果から, このモデルでは, 与えられたペアフォワードモデルと逆運動学モデルのみを用いて, トラジェクトリを生成することができることが示唆され, 適応解を必要とするより複雑な操作タスクの計画が容易になる可能性が示唆された。
関連論文リスト
- Action Flow Matching for Continual Robot Learning [57.698553219660376]
ロボット工学における継続的な学習は、変化する環境やタスクに常に適応できるシステムを求める。
本稿では,オンラインロボット力学モデルアライメントのためのフローマッチングを利用した生成フレームワークを提案する。
ロボットは,不整合モデルで探索するのではなく,行動自体を変換することで,より効率的に情報収集を行う。
論文 参考訳(メタデータ) (2025-04-25T16:26:15Z) - Closed-Loop Long-Horizon Robotic Planning via Equilibrium Sequence Modeling [21.45039811922009]
我々は、均衡に達するまで計画案を反復的に洗練する自己精製スキームを提唱する。
効率的なクローズドループ計画のためのネスト型平衡系列モデリング手法を考案した。
提案手法はVirtualHome-Envベンチマークで評価され,スケーリングw.r.t.推論時間計算の改善による高度な性能を示す。
論文 参考訳(メタデータ) (2024-10-02T11:42:49Z) - Integration of Reinforcement Learning Based Behavior Planning With
Sampling Based Motion Planning for Automated Driving [0.5801044612920815]
本研究では,高度行動計画のための訓練された深層強化学習ポリシーを用いる方法を提案する。
私たちの知る限りでは、この研究は、この方法で深層強化学習を適用した最初のものである。
論文 参考訳(メタデータ) (2023-04-17T13:49:55Z) - Fast Kinodynamic Planning on the Constraint Manifold with Deep Neural
Networks [29.239926645660823]
本稿では,制約多様体の概念を利用した新しい学習計画フレームワークを提案する。
我々の手法は任意の制約を満たす計画を生成し、ニューラルネットワークの推論時間という短い一定時間でそれらを計算する。
我々は,2つのシミュレートされたタスクと,ロボット・エアホッケーにおける打撃動作を実行するために,クカ・LBRIiwa 14ロボットアームを用いた実世界のシナリオに対して,我々のアプローチを検証した。
論文 参考訳(メタデータ) (2023-01-11T06:54:11Z) - Leveraging Sequentiality in Reinforcement Learning from a Single
Demonstration [68.94506047556412]
本稿では,複雑なロボットタスクの制御ポリシーを1つの実演で学習するために,シーケンシャルなバイアスを活用することを提案する。
本研究は, ヒューマノイド移動やスタンドアップなど, 模擬課題のいくつかを, 前例のないサンプル効率で解くことができることを示す。
論文 参考訳(メタデータ) (2022-11-09T10:28:40Z) - Reaching Through Latent Space: From Joint Statistics to Path Planning in
Manipulation [26.38185646091712]
本稿では,ロボットマニピュレータのための経路計画手法を提案する。
経路は、ロボットのポーズ生成モデルの潜在空間における反復的最適化によって生成される。
我々のモデルはランダムにサンプリングされたロボットのポーズに基づいてタスク非依存で訓練されている。
論文 参考訳(メタデータ) (2022-10-21T07:25:21Z) - Real-to-Sim: Predicting Residual Errors of Robotic Systems with Sparse
Data using a Learning-based Unscented Kalman Filter [65.93205328894608]
我々は,動的・シミュレータモデルと実ロボット間の残差を学習する。
学習した残差誤差により、動的モデル、シミュレーション、および実際のハードウェア間の現実的ギャップをさらに埋めることができることを示す。
論文 参考訳(メタデータ) (2022-09-07T15:15:12Z) - Silver-Bullet-3D at ManiSkill 2021: Learning-from-Demonstrations and
Heuristic Rule-based Methods for Object Manipulation [118.27432851053335]
本稿では,SAPIEN ManiSkill Challenge 2021: No Interaction Trackにおいて,以下の2つのトラックを対象としたシステムの概要と比較分析を行った。
No Interactionは、事前に収集された実証軌道からの学習ポリシーのターゲットを追跡する。
このトラックでは,タスクを一連のサブタスクに分解することで,高品質なオブジェクト操作をトリガするHuristic Rule-based Method (HRM) を設計する。
各サブタスクに対して、ロボットアームに適用可能なアクションを予測するために、単純なルールベースの制御戦略が採用されている。
論文 参考訳(メタデータ) (2022-06-13T16:20:42Z) - Learning Neuro-Symbolic Relational Transition Models for Bilevel
Planning [61.37385221479233]
本研究では,モデルに基づく強化学習と記号幾何学的ロボット計画の統合のギャップを埋めるための一歩を踏み出した。
NSRTはシンボリックコンポーネントとニューラルコンポーネントの両方を持ち、外ループにおけるシンボリックAI計画がインナーループ内のニューラルモデルによる継続的な計画をガイドするバイレベルプランニングスキームを可能にする。
NSRTは、ほんの数十~数百回のトレーニングの後に学習でき、目標を達成するのに最大60のアクションを必要とする新しいタスクの高速計画に使用される。
論文 参考訳(メタデータ) (2021-05-28T19:37:18Z) - Structured Prediction for CRiSP Inverse Kinematics Learning with
Misspecified Robot Models [39.513301957826435]
本稿では,データ駆動戦略とフォワードキネマティックス関数を組み合わせた構造化予測アルゴリズムを提案する。
提案手法により、予測された関節構成がロボットの制約内に適切に収まることが保証される。
論文 参考訳(メタデータ) (2021-02-25T15:39:33Z) - Thinking While Moving: Deep Reinforcement Learning with Concurrent
Control [122.49572467292293]
本研究では,制御システムの時間的進化とともに,ポリシーからのアクションのサンプリングを同時に行わなければならないような環境下での強化学習について検討する。
人や動物のように、ロボットは思考と移動を同時に行わなければならず、前の動作が完了する前に次の動作を決定する。
論文 参考訳(メタデータ) (2020-04-13T17:49:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。