論文の概要: Spline Policy: A Structured Representation for Robot Policies
- arxiv url: http://arxiv.org/abs/2606.07386v1
- Date: Fri, 05 Jun 2026 15:23:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-08 14:33:29.824607
- Title: Spline Policy: A Structured Representation for Robot Policies
- Title(参考訳): スプラインポリシー:ロボット政策の構造的表現
- Authors: Mengze Tian, Yiming Li, Sichao Liu, Auke Ijspeert, Sylvain Calinon,
- Abstract要約: 本稿では,アクションチャンクをスプラインパラメータに置き換える構造的表現であるスプラインポリシー(SP)について検討する。
予測スプラインは、コンパクトな連続軌道としてデコードされ、異なる時間分解能でクエリされ、パラメータ空間で制限または編集され、下流コントローラに渡される。
低次元動作学習の実験、マッチしたバックボーンの模擬操作、デキスタラス操作、および実ロボットケーススタディにより、SPは現代の政策学習者と相容れないことが示されている。
- 参考スコア(独自算出の注目度): 18.73114596777634
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modern imitation-learning policies for robot manipulation often represent actions as fixed-resolution action chunks, which are simple and effective but expose limited geometric and temporal structure before execution. This paper studies Spline Policy (SP), a structured representation that replaces action chunks with spline parameters while keeping the policy backbone unchanged. The predicted spline can be decoded as a compact continuous trajectory, queried at different temporal resolutions, constrained or edited in parameter space, and passed to downstream controllers. For quadratic spline outputs, the same representation can also be converted into a state-dependent vector field through an analytical distance-field construction. Under the regularity and projection assumptions of this construction, the induced dynamics do not increase the distance to the generated spline, yielding a principled local corrective mechanism around the predicted motion. The spline output further supports uncertainty propagation from observations to spline parameters, trajectories, and flow fields, and can be combined with classical control mechanisms such as null-space collision avoidance without retraining the policy backbone. We instantiate SP with diffusion, flow-matching, transformer-based, and vision-language-action backbones. Experiments in low-dimensional motion learning, simulated manipulation under matched backbones, dexterous manipulation, and real-robot case studies show that SP remains compatible with modern policy learners while exposing useful motion-structure properties, including compact decoding, temporal resampling, local correction around predicted motions, uncertainty evaluation, and controller compatibility.
- Abstract(参考訳): ロボット操作のための現代の模倣学習ポリシーは、しばしばアクションを固定解像度のアクションチャンクとして表現するが、これは単純で効果的であるが、実行前に限られた幾何学的・時間的構造を露呈する。
本稿では,アクションチャンクをスプラインパラメータに置き換える構造的表現であるスプラインポリシー(SP)について検討する。
予測スプラインは、コンパクトな連続軌道としてデコードされ、異なる時間分解能でクエリされ、パラメータ空間で制限または編集され、下流コントローラに渡される。
二次スプライン出力に対しては、解析的距離場構成を通じて同じ表現を状態依存ベクトル場に変換することもできる。
この構成の規則性と射影仮定の下では、誘導力学は生成したスプラインまでの距離を増大させず、予測された運動の周囲に原理化された局所的な補正機構をもたらす。
スプライン出力は、観測からスプラインパラメータ、軌道、流れ場への不確実性伝播をさらにサポートし、ポリシーバックボーンを再トレーニングすることなく、ヌル空間衝突回避のような古典的な制御機構と組み合わせることができる。
我々はSPを拡散、フローマッチング、トランスフォーマーベース、視覚言語アクションバックボーンでインスタンス化する。
低次元の動作学習、マッチングされたバックボーンでのシミュレーション操作、デキスタラス操作、実ロボットケーススタディにおいて、SPは、コンパクトデコード、時間的再サンプリング、予測された動きの局所補正、不確実性評価、コントローラ互換性といった有用な動作構造特性を公開しながら、現代の政策学習者と相容れないことが示されている。
関連論文リスト
- From Noise to Control: Parameterized Diffusion Policies [54.941343992110426]
本研究では,学習行動多様体に埋め込まれた連続パラメータに条件付き拡散ポリシーを学習するためのフレームワークを提案する。
政策重みを更新することなく、既知の戦略間の円滑な距離と、新しい制約への効率的な適応を可能にする。
論文 参考訳(メタデータ) (2026-05-29T20:21:50Z) - TapSampling: Inference-Time Sampling with a Task-Progress-Understanding Verifier for Robotic Manipulation [61.35569005726248]
既存の具体的制御研究は、トレーニングデータとモデルサイズをスケールすることで、顕著なパフォーマンス向上を示す。
拡散や自己回帰モデルのような非決定論的生成モデルは、エンボディドコントロールの分野で広く採用されている。
推測時間サンプリングのためのプラグイン・アンド・プレイフレームワークである textbfTapSampling を提案する。
論文 参考訳(メタデータ) (2026-05-25T08:03:31Z) - Beyond Point-Wise Matching: Structural Representation Alignment for Accelerating Diffusion Transformers [93.3976834364707]
本稿では,特徴写像のリレーショナル幾何における整合性を実現する構造的RePresentation AlignmentフレームワークであるsREPAを提案する。
モデルが事前訓練された特徴から全体的空間配置と構造的相関を内包するように促すことにより、sREPAはより高速でより安定した収束を達成する。
論文 参考訳(メタデータ) (2026-05-16T12:01:04Z) - Real-Time Projected Adaptive Control for Closed-Chain Co-Manipulative Continuum Robots [0.764671395172401]
協調操作型連続ロボット(CCR)では、複数の連続アームが共通の柔軟な物体をつかむことで協調する。
現実的なタスクでは、フレキシブルオブジェクトの物理パラメータはしばしば未知であり、操作によって異なる。
本稿では,動的レベルで定式化されたCCRの適応制御フレームワークを提案する。
論文 参考訳(メタデータ) (2026-04-05T22:03:23Z) - ContractionPPO: Certified Reinforcement Learning via Differentiable Contraction Layers [5.690649768462432]
本稿では,手足ロボットのロバストな計画と制御のためのフレームワークであるContractionPPOを提案する。
収縮PPOは、模擬閉ループ系の指数的安定性を証明する収縮計量を生成する。
四足歩行におけるハードウェア実験により,強い外乱下であっても,ContractionPPOは頑健で安定な制御を可能にすることが示された。
論文 参考訳(メタデータ) (2026-03-20T04:32:18Z) - Online Generation of Collision-Free Trajectories in Dynamic Environments [0.9596789853473943]
状態列で表される任意の幾何経路を対応する運動可能軌道に変換するオンライン手法を提案する。
ユーザが指定した制御速度で離散化して低レベルロボットコントローラにストリームできるクインティック/クアティック・スプラインのシーケンスを生成する。
実際のロボットの実験では、提案手法が人間の存在を含む現実のシナリオで使用できることを示した。
論文 参考訳(メタデータ) (2026-02-28T18:04:50Z) - Constraining Streaming Flow Models for Adapting Learned Robot Trajectory Distributions [10.615762867055677]
Streaming Flow Policies (SFPs) は,学習速度場をアクション空間に直接統合することにより,ロボット軌道を生成するための強力なパラダイムとして登場した。
本研究では,ストリーミングフローポリシーを制約に依存したメトリクスで拡張し,実行中に学習速度場を再構築するフレームワークであるConstraint-Aware Streaming Flow (CASF)を提案する。
シミュレーションおよび実世界の操作タスクにおいてCASFを実証し、スムーズで実現可能で、動的に一貫した制約を満たす軌道を生成することを示した。
論文 参考訳(メタデータ) (2026-02-17T13:27:05Z) - Robot-DIFT: Distilling Diffusion Features for Geometrically Consistent Visuomotor Control [31.523644271297616]
一般化可能なロボット操作における重要なボトルネックは、現在の視覚的バックボーンと閉ループ制御の物理的要求との間の構造的ミスマッチである。
我々は,マニフォールド蒸留による推論プロセスから幾何学的情報ソースを分離するフレームワークであるRobot-DIFTを提案する。
凍結拡散教師を決定論的空間意味的特徴ピラミッドネットワーク(S2-FPN)に蒸留することにより、時間的安定性、リアルタイム実行、ドリフトに対する堅牢性を確保しつつ、生成モデルの豊富な幾何学的先行性を維持できる。
論文 参考訳(メタデータ) (2026-02-12T13:30:24Z) - Bidirectional Feature-aligned Motion Transformation for Efficient Dynamic Point Cloud Compression [97.66080040613726]
特徴空間における動きを暗黙的にモデル化する双方向特徴整合運動変換(Bi-FMT)フレームワークを提案する。
Bi-FMTは、時間的に一貫した潜在表現を生成するために、過去と将来の両方のフレームで機能を調整する。
圧縮効率とランタイムの両方において, Bi-FMT が D-DPCC と AdaDPCC を上回っていることを示す。
論文 参考訳(メタデータ) (2025-09-18T03:51:06Z) - Nonprehensile Riemannian Motion Predictive Control [57.295751294224765]
本稿では,リアル・ツー・シムの報酬分析手法を導入し,リアルなロボット・プラットフォームに対する行動の可能性を確実に予測する。
連続的なアクション空間でオブジェクトを反応的にプッシュするクローズドループコントローラを作成します。
我々は,RMPCが乱雑な環境だけでなく,乱雑な環境においても頑健であり,ベースラインよりも優れていることを観察した。
論文 参考訳(メタデータ) (2021-11-15T18:50:04Z) - Risk-Averse MPC via Visual-Inertial Input and Recurrent Networks for
Online Collision Avoidance [95.86944752753564]
本稿では,モデル予測制御(MPC)の定式化を拡張したオンライン経路計画アーキテクチャを提案する。
我々のアルゴリズムは、状態推定の共分散を推論するリカレントニューラルネットワーク(RNN)とオブジェクト検出パイプラインを組み合わせる。
本手法のロバスト性は, 複雑な四足歩行ロボットの力学で検証され, ほとんどのロボットプラットフォームに適用可能である。
論文 参考訳(メタデータ) (2020-07-28T07:34:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。