論文の概要: LineRides: Line-Guided Reinforcement Learning for Bicycle Robot Stunts
- arxiv url: http://arxiv.org/abs/2605.05110v2
- Date: Fri, 08 May 2026 17:02:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 16:31:22.924663
- Title: LineRides: Line-Guided Reinforcement Learning for Bicycle Robot Stunts
- Title(参考訳): LineRides: 自転車用ロボットのラインガイド強化学習
- Authors: Seungeun Rho, Shamel Fahmi, Jeonghwan Kim, Arianna Ilvonen, Sehoon Ha, Gabriel Nelson,
- Abstract要約: LineRidesは、カスタム自転車ロボットが多種多様なコマンド可能なスタント行動を取得することができる、ライン誘導学習フレームワークである。
LineRidesは、制御された偏差を許容するトラッキングマージンを使用して、物理的に実現不可能なガイドラインを処理する。
本手法で訓練したポリシは,通常の運転とスタント実行のシームレスな遷移をサポートすることを示す。
- 参考スコア(独自算出の注目度): 11.983924042209447
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Designing reward functions for agile robotic maneuvers in reinforcement learning remains difficult, and demonstration-based approaches often require reference motions that are unavailable for novel platforms or extreme stunts. We present LineRides, a line-guided learning framework that enables a custom bicycle robot to acquire diverse, commandable stunt behaviors from a user-provided spatial guideline and sparse key-orientations, without demonstrations or explicit timing. LineRides handles physically infeasible guidelines using a tracking margin that permits controlled deviation, resolves temporal ambiguity by measuring progress via traveled distance along the guideline, and disambiguates motion details through position- and sequence-based key-orientations. We evaluate LineRides on the Ultra Mobility Vehicle (UMV) and show that the policy trained with our methods supports seamless transitions between normal driving and stunt execution, enabling five distinct stunts on command: MiniHop, LargeHop, ThreePointTurn, Backflip, and DriftTurn.
- Abstract(参考訳): 強化学習におけるアジャイルなロボット操作のための報酬関数の設計は依然として困難であり、デモベースのアプローチでは、新しいプラットフォームや極端なスタントでは利用できない参照動作を必要とすることが多い。
提案するLineRidesは,実演や明示的なタイミングを伴わずに,ユーザが提供した空間的ガイドラインとスパースキーオリエンテーションから多種多様な命令可能なスタント行動を取得することができる,ラインガイド付き学習フレームワークである。
LineRidesは、制御された偏差を許容するトラッキングマージンを使用して物理的に実現不可能なガイドラインを処理し、ガイドラインに沿って走行距離を計測することで時間的曖昧さを解消し、位置とシーケンスに基づくキーオリエンテーションを通じて運動の詳細を曖昧にする。
我々は,Ultra Mobility Vehicle (UMV) 上でLineRidesを評価し,通常の運転とスタント実行のシームレスな移行をサポートし,MiniHop,LargeHop,ThreePointTurn,Backflip,DriftTurnの5つの異なるスタントを可能にすることを示す。
関連論文リスト
- Precise Aggressive Aerial Maneuvers with Sensorimotor Policies [14.348190270475214]
本稿では,車載視覚とプロプレセプションを直接低レベル制御コマンドにマッピングする。
提案手法は, 四角形を5cmのクリアランスで移動し, 最大90度傾いた場合, ギャップの位置や方向を知ることなく, 四角形を移動させることができる。
論文 参考訳(メタデータ) (2026-04-07T13:00:59Z) - Learning to Drive is a Free Gift: Large-Scale Label-Free Autonomy Pretraining from Unposed In-The-Wild Videos [20.73513310337503]
オンラインで利用できるエゴ中心の運転ビデオは、自動運転のための豊富な視覚的データを提供する。
本研究では,未提示ビデオから直接自律運転表現を学習するための,ラベルのない教師誘導型フレームワークを提案する。
論文 参考訳(メタデータ) (2026-02-25T16:38:53Z) - Dexplore: Scalable Neural Control for Dexterous Manipulation from Reference-Scoped Exploration [58.4036440289082]
ハンドオブジェクトモーションキャプチャ(MoCap)は、大規模でコンタクトに富んだデモと、器用なロボットスコープの約束を提供する。
Dexploreは、リポジトリとトラッキングを実行し、MoCapから直接ロボット制御ポリシーを学習する、統一された単一ループ最適化である。
論文 参考訳(メタデータ) (2025-09-11T17:59:07Z) - PMG: Progressive Motion Generation via Sparse Anchor Postures Curriculum Learning [5.247557449370603]
ProMoGenは、軌跡誘導とスパースアンカー動作制御を統合する新しいフレームワークである。
ProMoGenは、統合トレーニングプロセス内で、二重制御パラダイムと単一制御パラダイムの両方をサポートする。
われわれのアプローチはパーソナライズされた動作と構造化されたガイダンスをシームレスに統合し、最先端の手法を著しく上回っている。
論文 参考訳(メタデータ) (2025-04-23T13:51:42Z) - Guided Decoding for Robot On-line Motion Generation and Adaption [44.959409835754634]
本稿では,ロボットアームに高い自由度を持つ新たな動作生成手法を提案する。
本研究では,実演として使用する擬似軌道の大規模データセットに基づいて,条件付き変分オートエンコーダに基づくトランスフォーマーアーキテクチャを訓練する。
本モデルでは, 異なる初期点と目標点からの運動をうまく生成し, 異なるロボットプラットフォームを横断する複雑なタスクをナビゲートする軌道を生成可能であることを示す。
論文 参考訳(メタデータ) (2024-03-22T14:32:27Z) - VAE-Loco: Versatile Quadruped Locomotion by Learning a Disentangled Gait
Representation [78.92147339883137]
本研究では,特定の歩行を構成する主要姿勢位相を捕捉する潜在空間を学習することにより,制御器のロバスト性を高めることが重要であることを示す。
本研究では,ドライブ信号マップの特定の特性が,歩幅,歩幅,立位などの歩行パラメータに直接関係していることを示す。
生成モデルを使用することで、障害の検出と緩和が容易になり、汎用的で堅牢な計画フレームワークを提供する。
論文 参考訳(メタデータ) (2022-05-02T19:49:53Z) - Next Steps: Learning a Disentangled Gait Representation for Versatile
Quadruped Locomotion [69.87112582900363]
現在のプランナーは、ロボットが動いている間、キー歩行パラメータを連続的に変更することはできない。
本研究では、特定の歩行を構成する重要な姿勢位相を捉える潜在空間を学習することにより、この制限に対処する。
本研究では, 歩幅, 歩幅, 立位など, 歩行パラメータに直接対応した駆動信号マップの具体的特性を示す。
論文 参考訳(メタデータ) (2021-12-09T10:02:02Z) - Reinforcement Learning for Robust Parameterized Locomotion Control of
Bipedal Robots [121.42930679076574]
シミュレーションにおけるロコモーションポリシをトレーニングするためのモデルフリー強化学習フレームワークを提案する。
ドメインランダム化は、システムダイナミクスのバリエーションにまたがる堅牢な振る舞いを学ぶためのポリシーを奨励するために使用されます。
本研究では、目標歩行速度、歩行高さ、旋回ヨーなどの多目的歩行行動について示す。
論文 参考訳(メタデータ) (2021-03-26T07:14:01Z) - ReLMoGen: Leveraging Motion Generation in Reinforcement Learning for
Mobile Manipulation [99.2543521972137]
ReLMoGenは、サブゴールを予測するための学習されたポリシーと、これらのサブゴールに到達するために必要な動作を計画し実行するためのモーションジェネレータを組み合わせたフレームワークである。
本手法は,フォトリアリスティック・シミュレーション環境における7つのロボットタスクの多種多様なセットをベンチマークする。
ReLMoGenは、テスト時に異なるモーションジェネレータ間で顕著な転送可能性を示し、実際のロボットに転送する大きな可能性を示している。
論文 参考訳(メタデータ) (2020-08-18T08:05:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。