論文の概要: Towards Robot Skill Learning and Adaptation with Gaussian Processes
- arxiv url: http://arxiv.org/abs/2603.01480v1
- Date: Mon, 02 Mar 2026 05:44:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.814973
- Title: Towards Robot Skill Learning and Adaptation with Gaussian Processes
- Title(参考訳): ガウス過程によるロボットスキル学習と適応に向けて
- Authors: A K M Nadimul Haque, Fouad Sukkar, Sheila Sujipto, Cedric Le Gentil, Marc G. Carmichael, Teresa Vidal-Calleja,
- Abstract要約: 一般的なロボットのスキル適応には、様々なタスク構成に頑健な表現が必要である。
初期構成と観測構成のばらつきを考慮に入れた3つの適応手法を提案する。
提案手法は,すべてのベンチマークを成功率で上回る結果を得た。
- 参考スコア(独自算出の注目度): 6.123517215024762
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: General robot skill adaptation requires expressive representations robust to varying task configurations. While recent learning-based skill adaptation methods refined via Reinforcement Learning (RL), have shown success, existing skill models often lack sufficient representational capacity for anything beyond minor environmental changes. In contrast, Gaussian Process (GP)-based skill modelling provides an expressive representation with useful analytical properties; however, adaptation of GP-based skills remains underexplored. This paper proposes a novel, robust skill adaptation framework that utilises GPs with sparse via-points for compact and expressive modelling. The model considers the trajectory's poses and leverages its first and second analytical derivatives to preserve the skill's kinematic profile. We present three adaptation methods to cater for the variability between initial and observed configurations. Firstly, an optimisation agent that adjusts the path's via-points while preserving the demonstration velocity. Second, a behaviour cloning agent trained to replicate output trajectories from the optimisation agent. Lastly, an RL agent that has learnt to modify via-points whilst maintaining the kinematic profile and enabling online capabilities. Evaluated across three tasks (drawer opening, cube-pushing and bar manipulation) in both simulation and hardware, our proposed methods outperform every benchmark in success rates. Furthermore, the results demonstrate that the GP-based representation enables all three methods to attain high cosine similarity and low velocity magnitude errors, indicating strong preservation of the kinematic profile. Overall, our formulation provides a compact representation capable of adapting to large deviations from a single demonstrated skill.
- Abstract(参考訳): 一般的なロボットのスキル適応には、様々なタスク構成に頑健な表現が必要である。
近年,Reinforcement Learning (RL) を通じて改良された学習に基づくスキル適応手法が成功している一方で,既存のスキルモデルでは,小さな環境変化を超えて,十分な表現能力が欠如している場合が多い。
対照的に、Gaussian Process(GP)ベースのスキルモデリングは有用な分析的性質を持つ表現表現を提供するが、GPベースのスキルの適応は未解明のままである。
本稿では,コンパクトかつ表現力のあるモデリングのために,GPをスパースなバイスポイントで活用する,新しい,堅牢なスキル適応フレームワークを提案する。
モデルは、軌跡のポーズを考慮し、その第1および第2の分析微分を利用して、スキルの運動プロファイルを保存する。
初期構成と観測構成のばらつきを考慮に入れた3つの適応手法を提案する。
第一に、実証速度を保ちながら経路の通過点を調整する最適化エージェント。
第2に、最適化剤から出力軌跡を複製するように訓練された行動クローニング剤。
最後に、キネマティックプロファイルを維持し、オンライン機能を有効にしながら、インターポイントを変更することを学習したRLエージェント。
シミュレーションとハードウェアの3つのタスク(開き、立方体プッシング、バー操作)で評価し、提案手法は成功率のベンチマークで比較した。
さらに,GPに基づく表現により,3つの手法で高いコサイン類似性と低速度大小誤差を達成できることが示され,運動学的プロファイルの保存性が強いことが示唆された。
全体として、我々の定式化は、単一の実演スキルから大きな逸脱に適応できるコンパクトな表現を提供する。
関連論文リスト
- Implicit Neural Representation-Based Continuous Single Image Super Resolution: An Empirical Study [50.15623093332659]
入射神経表現(INR)は任意のスケール画像超解像(ASSR)の標準的アプローチとなっている
既存の手法を多様な設定で比較し、複数の画像品質指標に対して集計結果を示す。
トレーニング中, エッジ, テクスチャ, 細部を保存しながら, 強度変化をペナライズする新たな損失関数について検討した。
論文 参考訳(メタデータ) (2026-01-25T07:09:20Z) - Fine-grained Image Retrieval via Dual-Vision Adaptation [38.41312409147845]
Fine-Grained Image Retrieval (FGIR)は、識別的視覚表現を学習し、類似した微細な特徴を持つ画像を検索する際の課題に直面している。
本稿では,FGIRのFGIRモデルに対するDual-Vision Adaptation (DVA)アプローチを提案する。
論文 参考訳(メタデータ) (2025-06-19T12:46:55Z) - SMLE: Safe Machine Learning via Embedded Overapproximation [4.129133569151574]
本研究は,デザイナ・ちょうせん特性を満たすことが保証される識別可能なMLモデルを訓練する作業について考察する。
現代のニューラルモデルにおけるコンプライアンスの厳格な検証と実施という計算複雑性のため、これは非常に難しい。
1)保守的なセマンティクスによる効率的な検証を可能にする汎用的,シンプルなアーキテクチャ。
回帰における線形不等式によって定義される特性と、多重ラベル分類における相互排他的クラスに対するアプローチを評価する。
論文 参考訳(メタデータ) (2024-09-30T17:19:57Z) - Parameter-Efficient and Memory-Efficient Tuning for Vision Transformer: A Disentangled Approach [87.8330887605381]
本稿では,学習可能なパラメータをわずかに限定して,事前学習した視覚変換器を下流認識タスクに適用する方法を示す。
学習可能で軽量なモジュールを用いてタスク固有のクエリを合成する。
本手法はメモリ制約下での最先端性能を実現し,実環境における適用性を示す。
論文 参考訳(メタデータ) (2024-07-09T15:45:04Z) - Constrained Equation Learner Networks for Precision-Preserving
Extrapolation of Robotic Skills [6.144680854063937]
本稿では,実証によるプログラミングにおける軌道適応問題に対処する,教師付き学習フレームワークを提案する。
方程式学習ネットワークを用いて解析式を学習し,基礎関数として利用する。
提案手法は, ロボット軌道の適応における3つの課題に対処する。1) 軌道の歪みを最小限に抑えること,2) 適応の精度を保つこと,3) 基本機能の構造に関する直観の欠如に対処すること。
論文 参考訳(メタデータ) (2023-11-04T18:16:18Z) - Dynamic Iterative Refinement for Efficient 3D Hand Pose Estimation [87.54604263202941]
本稿では,従来の推定値の修正に部分的レイヤを反復的に活用する,小さなディープニューラルネットワークを提案する。
学習したゲーティング基準を用いて、ウェイトシェアリングループから抜け出すかどうかを判断し、モデルにサンプルごとの適応を可能にする。
提案手法は,広く使用されているベンチマークの精度と効率の両面から,最先端の2D/3Dハンドポーズ推定手法より一貫して優れている。
論文 参考訳(メタデータ) (2021-11-11T23:31:34Z) - Few-shot Quality-Diversity Optimization [50.337225556491774]
品質多様性(QD)の最適化は、強化学習における知覚的最小値とスパース報酬を扱う上で効果的なツールであることが示されている。
本稿では,タスク分布の例から,パラメータ空間の最適化によって得られる経路の情報を利用して,未知の環境でQD手法を初期化する場合,数発の適応が可能であることを示す。
ロボット操作とナビゲーションベンチマークを用いて、疎密な報酬設定と密集した報酬設定の両方で実施された実験は、これらの環境でのQD最適化に必要な世代数を著しく削減することを示している。
論文 参考訳(メタデータ) (2021-09-14T17:12:20Z) - Self-supervised Augmentation Consistency for Adapting Semantic
Segmentation [56.91850268635183]
本稿では,実用的かつ高精度な意味セグメンテーションのためのドメイン適応手法を提案する。
私たちは標準データ拡張技術である$-$フォトメトリックノイズ、フリップとスケーリング$-$を採用し、セマンティック予測の一貫性を保証する。
適応後の最先端セグメンテーション精度を大幅に改善し、バックボーンアーキテクチャと適応シナリオの異なる選択に整合性を持たせる。
論文 参考訳(メタデータ) (2021-04-30T21:32:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。