論文の概要: Extreme Motion Generation via Hybrid Null-Space Control for Straight-Line Path Following
- arxiv url: http://arxiv.org/abs/2606.03390v1
- Date: Tue, 02 Jun 2026 09:33:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-03 22:00:04.90777
- Title: Extreme Motion Generation via Hybrid Null-Space Control for Straight-Line Path Following
- Title(参考訳): 直線線追従のためのハイブリッドNull空間制御による極端運動生成
- Authors: Xinyi Yuan, Weiwei Wan, Kensuke Harada,
- Abstract要約: 本稿では, マニピュレータの作業空間内で, 予め定義された軌道に沿った経路長を最大化する「極端運動生成」について検討する。
本稿では,RLベースとモデルベースコントローラを正規化した連接限界距離に応じて切り替えるステップレベルハイブリッドコントローラを提案する。
提案手法を7-DoF Franka FR3を用いて一万進路追従タスクに適用し,平均ロールアウト期間をモデルベースベースラインより27%延長した。
- 参考スコア(独自算出の注目度): 10.975583425374532
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This work studies ``extreme motion generation'', which aims to maximize the Cartesian path length along a pre-defined trajectory within the manipulator's workspace. This objective is important in industry as long as path-following is fundamental to a large variety of tasks such as surface coating and welding. More critically, extreme motion enables a fixed-base manipulator to exploit the kinematic capability under limited reachability. However, such exploitation is challenging in practice, as the manipulator must actively avoid the safety boundary through execution, which is inherently a long-horizon problem. Accordingly, we claim that long-horizon decision-making should be delegated to a learning-based policy to maximize exploitation, while a classical model-based controller covers the near-boundary region, where the learning policy degrades sharply due to sparse data coverage. In detail, our proposed method is a step-level hybrid controller that switches between an RL-based and a model-based controller according to the normalized joint-limit distance. The initial joint configuration is sampled through conditional diffusion-based sampling, which improves the achievable path length based on the learned motion prior. We evaluate the proposed framework on 10,000 straight-line path-following tasks with a 7-DoF Franka FR3, extending the average rollout length by 27\% over the model-based baseline. Notably, certain tasks yield a pronounced extension toward the motion extreme, as reflected in the maximum improvement reported in the statistical results. The project website and related videos of this paper can be found at https://yuan-xinyi.github.io/extreme-motion-generation/.
- Abstract(参考訳): 本研究は, マニピュレータの作業空間内の予め定義された軌道に沿って, モンテカルロ経路長を最大化することを目的とした「極端運動生成」を研究する。
この目的は、表面コーティングや溶接といった様々なタスクにパス追従が不可欠である限り、産業において重要である。
より重要なことに、極端な動きは、固定ベースマニピュレータが限られた到達性の下で運動能力を利用することを可能にする。
しかし、このような搾取は実際は困難であり、マニピュレータは実行を通じて安全境界を積極的に回避しなければならない。
したがって,従来のモデルベースコントローラは,データカバレッジの不足により学習方針が急激に低下する領域を網羅する一方で,長期的意思決定を最大限に活用するための学習ベースの政策に委譲すべきであると主張する。
提案手法は,RLベースとモデルベースコントローラを正規化結合限界距離に応じて切り替えるステップレベルハイブリッドコントローラである。
初期関節構成は条件拡散に基づくサンプリングによってサンプリングされ、学習前の動作に基づいて達成可能な経路長を改善する。
提案手法を7-DoF Franka FR3を用いて一万進路追従タスクに適用し, モデルベースライン上での平均ロールアウト期間を27 %延長した。
特に、あるタスクは、統計結果に報告された最大改善に反映されるように、極端運動に対する顕著な拡張をもたらす。
この論文のプロジェクトウェブサイトと関連ビデオはhttps://yuan-xinyi.github.io/extreme-motion-generation/にある。
関連論文リスト
- Intent-aligned Autonomous Spacecraft Guidance via Reasoning Models [4.254099382808598]
本稿では,高レベル推論と安全な軌道最適化を結びつける意図整合型宇宙船誘導フレームワークを提案する。
ファンデーションモデルは、まず意図に沿った行動計画を予測し、その後、ウェイポイント生成モデルをウェイポイント制約に変換し、安全な軌道を最適化して計算する。
論文 参考訳(メタデータ) (2026-04-19T00:25:54Z) - Simple but Stable, Fast and Safe: Achieve End-to-end Control by High-Fidelity Differentiable Simulation [14.322775509774246]
障害物回避(Obstacle avoidance)は、四重項が高度なアプリケーションを実行できるようにするための基本的な視覚ベースのタスクである。
本稿では,深度画像を直接低レベルのボディレートコマンドにマッピングする新しいエンドツーエンドポリシーを提案する。
その結果,提案手法は,最先端のベースラインの中で,最も成功率が高く,かつ最低であることがわかった。
論文 参考訳(メタデータ) (2026-04-12T09:38:00Z) - Amortizing Trajectory Diffusion with Keyed Drift Fields [2.5352713493505785]
キード・ドリフト・ポリシーズ (Keyed Drifting Policies) は、ドリフトフィールドの目標で訓練された1ステップの軌道生成装置である。
生成されたトラジェクトリを条件マッチングされたデータセットウィンドウに反映する。
1ステップの推論で高い性能を達成し、拡散サンプリングよりも計画遅延を大幅に低減する。
論文 参考訳(メタデータ) (2026-03-14T17:56:15Z) - Model-Based Policy Adaptation for Closed-Loop End-to-End Autonomous Driving [54.46325690390831]
本稿では,事前学習したE2E運転エージェントのロバスト性と安全性を高めるための汎用フレームワークとして,モデルベースポリシー適応(MPA)を提案する。
MPAは、ジオメトリ一貫性のあるシミュレーションエンジンを用いて、まず様々な対物軌道を生成する。
MPAは拡散ベースのポリシーアダプタを訓練し、基本方針の予測を洗練させ、Q値モデルを多段階に分けて長期的な結果を評価する。
論文 参考訳(メタデータ) (2025-11-26T17:01:41Z) - Scaling Up Occupancy-centric Driving Scene Generation: Dataset and Method [54.461213497603154]
作業中心の手法は、最近、フレームとモダリティをまたいだ一貫した条件付けを提供することで、最先端の結果を得た。
Nuplan-Occは、広く使われているNuplanベンチマークから構築された、これまでで最大の占有率データセットである。
高品質な占有、多視点ビデオ、LiDAR点雲を共同で合成する統合フレームワークを開発した。
論文 参考訳(メタデータ) (2025-10-27T03:52:45Z) - ResAD: Normalized Residual Trajectory Modeling for End-to-End Autonomous Driving [64.42138266293202]
ResADは正規化された残留軌道モデリングフレームワークである。
学習タスクを再編成し、慣性参照からの残留偏差を予測する。
NAVSIMベンチマークでは、ResADはバニラ拡散ポリシーを用いて最先端のPDMS 88.6を達成している。
論文 参考訳(メタデータ) (2025-10-09T17:59:36Z) - DAgger Diffusion Navigation: DAgger Boosted Diffusion Policy for Vision-Language Navigation [73.80968452950854]
Vision-Language Navigation in Continuous Environments (VLN-CE) は、エージェントが自由形式の3D空間を通して自然言語の指示に従う必要がある。
既存のVLN-CEアプローチは通常、2段階のウェイポイント計画フレームワークを使用する。
本稿では,エンドツーエンド最適化VLN-CEポリシとしてDAgger Diffusion Navigation (DifNav)を提案する。
論文 参考訳(メタデータ) (2025-08-13T02:51:43Z) - FlowPG: Action-constrained Policy Gradient with Normalizing Flows [14.98383953401637]
ACRL(Action-Constrained reinforcement learning)は、安全クリティカルなリソース関連意思決定問題を解決するための一般的な手法である。
ACRLの最大の課題は、各ステップにおける制約を満たす有効なアクションを取るエージェントを確保することである。
論文 参考訳(メタデータ) (2024-02-07T11:11:46Z) - Let Offline RL Flow: Training Conservative Agents in the Latent Space of
Normalizing Flows [58.762959061522736]
オフライン強化学習は、追加の環境相互作用なしに、事前に記録された、固定されたデータセット上でポリシーをトレーニングすることを目的としている。
我々は、最近、潜在行動空間における学習ポリシーを基礎として、生成モデルの構築に正規化フローの特別な形式を用いる。
提案手法が最近提案したアルゴリズムより優れていることを示すため,様々な移動タスクとナビゲーションタスクについて評価を行った。
論文 参考訳(メタデータ) (2022-11-20T21:57:10Z) - Long-HOT: A Modular Hierarchical Approach for Long-Horizon Object
Transport [83.06265788137443]
我々は、時間的拡張ナビゲーションのための新しいオブジェクトトランスポートタスクと新しいモジュラーフレームワークを提案することで、長距離探査と航法を具現化する上で重要な課題に対処する。
私たちの最初の貢献は、深層探査と長期計画に焦点を当てた新しいLong-HOT環境の設計である。
重み付けされたフロンティアの助けを借りて探索を行うために,シーンのトポロジカルグラフを構築するモジュラー階層輸送ポリシー(HTP)を提案する。
論文 参考訳(メタデータ) (2022-10-28T05:30:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。