論文の概要: Constrained Equation Learner Networks for Precision-Preserving
Extrapolation of Robotic Skills
- arxiv url: http://arxiv.org/abs/2311.02475v1
- Date: Sat, 4 Nov 2023 18:16:18 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-07 17:31:02.857910
- Title: Constrained Equation Learner Networks for Precision-Preserving
Extrapolation of Robotic Skills
- Title(参考訳): ロボットスキルの精度保存外挿のための制約付き方程式学習ネットワーク
- Authors: Hector Perez-Villeda, Justus Piater, and Matteo Saveriano
- Abstract要約: 本稿では,実証によるプログラミングにおける軌道適応問題に対処する,教師付き学習フレームワークを提案する。
方程式学習ネットワークを用いて解析式を学習し,基礎関数として利用する。
提案手法は, ロボット軌道の適応における3つの課題に対処する。1) 軌道の歪みを最小限に抑えること,2) 適応の精度を保つこと,3) 基本機能の構造に関する直観の欠如に対処すること。
- 参考スコア(独自算出の注目度): 6.144680854063937
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In Programming by Demonstration, the robot learns novel skills from human
demonstrations. After learning, the robot should be able not only to reproduce
the skill, but also to generalize it to shifted domains without collecting new
training data. Adaptation to similar domains has been investigated in the
literature; however, an open problem is how to adapt learned skills to
different conditions that are outside of the data distribution, and, more
important, how to preserve the precision of the desired adaptations. This paper
presents a novel supervised learning framework called Constrained Equation
Learner Networks that addresses the trajectory adaptation problem in
Programming by Demonstrations from a constrained regression perspective. While
conventional approaches for constrained regression use one kind of basis
function, e.g., Gaussian, we exploit Equation Learner Networks to learn a set
of analytical expressions and use them as basis functions. These basis
functions are learned from demonstration with the objective to minimize
deviations from the training data while imposing constraints that represent the
desired adaptations, like new initial or final points or maintaining the
trajectory within given bounds. Our approach addresses three main difficulties
in adapting robotic trajectories: 1) minimizing the distortion of the
trajectory for new adaptations; 2) preserving the precision of the adaptations;
and 3) dealing with the lack of intuition about the structure of basis
functions. We validate our approach both in simulation and in real experiments
in a set of robotic tasks that require adaptation due to changes in the
environment, and we compare obtained results with two existing approaches.
Performed experiments show that Constrained Equation Learner Networks
outperform state of the art approaches by increasing generalization and
adaptability of robotic skills.
- Abstract(参考訳): デモンストレーションによるプログラミングでは、ロボットは人間のデモから新しいスキルを学ぶ。
学習後、ロボットはスキルを再現するだけでなく、新たなトレーニングデータを集めることなく、シフトしたドメインに一般化できるべきである。
類似領域への適応は文献で研究されているが、オープンな問題は、データ分布の外にある異なる条件に学習スキルをどのように適応するか、そしてもっと重要なことは、望ましい適応の精度を保つかである。
本稿では,制約付き回帰の観点からの演題によるプログラミングにおける軌道適応問題に対処する,制約付き方程式学習ネットワークと呼ばれる新しい教師付き学習フレームワークを提案する。
制約付き回帰に対する従来のアプローチでは、例えばガウスでは、方程式学習ネットワークを利用して分析式を学習し、基底関数として使用する。
これらの基礎関数は、トレーニングデータからの逸脱を最小限に抑えることを目的として、新しい初期点や最終点のような望ましい適応を表す制約を課す。
ロボット軌道の適応には3つの課題がある。
1) 新しい適応のための軌道の歪みを最小限にすること
2) 適応の正確性を維持すること,及び
3)基礎関数の構造に関する直観の欠如に対処すること。
本研究では,環境変化による適応を必要とするロボット作業のシミュレーションと実実験の両方において,本手法の有効性を検証し,既存の2つの手法との比較を行った。
実験の結果,制約付き等式学習者ネットワークは,ロボットスキルの一般化と適応性の向上により,芸術的アプローチの状態を上回っていることがわかった。
関連論文リスト
- DeepONet as a Multi-Operator Extrapolation Model: Distributed Pretraining with Physics-Informed Fine-Tuning [6.635683993472882]
マルチオペレータ学習を実現するためのファインチューニング手法を提案する。
本手法は,事前学習における各種演算子からのデータを分散学習と組み合わせ,物理インフォームド手法によりゼロショット微調整が可能となる。
論文 参考訳(メタデータ) (2024-11-11T18:58:46Z) - PETScML: Second-order solvers for training regression problems in Scientific Machine Learning [0.22499166814992438]
近年、分析のためのデータ駆動ツールとして、科学機械学習の出現を目撃している。
我々は、ディープラーニングソフトウェアと従来の機械学習技術とのギャップを埋めるために、Portable and Extensible Toolkit for Scientific計算上に構築されたソフトウェアを紹介します。
論文 参考訳(メタデータ) (2024-03-18T18:59:42Z) - In-Context Convergence of Transformers [63.04956160537308]
勾配降下法により訓練したソフトマックスアテンションを有する一層変圧器の学習力学について検討した。
不均衡な特徴を持つデータに対しては、学習力学が段階的に収束する過程をとることを示す。
論文 参考訳(メタデータ) (2023-10-08T17:55:33Z) - Continual Learning with Pretrained Backbones by Tuning in the Input
Space [44.97953547553997]
ディープラーニングモデルを非定常環境に適用することの本質的な困難さは、ニューラルネットワークの実際のタスクへの適用性を制限している。
ネットワークの事前学習部分の更新を回避し、通常の分類ヘッドだけでなく、新たに導入した学習可能なパラメータのセットも学習することで、微調整手順をより効果的にするための新しい戦略を提案する。
論文 参考訳(メタデータ) (2023-06-05T15:11:59Z) - Resilient Constrained Learning [94.27081585149836]
本稿では,学習課題を同時に解決しながら,要求に適応する制約付き学習手法を提案する。
我々はこの手法を、その操作を変更することで破壊に適応する生態システムを記述する用語に因んで、レジリエントな制約付き学習と呼ぶ。
論文 参考訳(メタデータ) (2023-06-04T18:14:18Z) - Real-to-Sim: Predicting Residual Errors of Robotic Systems with Sparse
Data using a Learning-based Unscented Kalman Filter [65.93205328894608]
我々は,動的・シミュレータモデルと実ロボット間の残差を学習する。
学習した残差誤差により、動的モデル、シミュレーション、および実際のハードウェア間の現実的ギャップをさらに埋めることができることを示す。
論文 参考訳(メタデータ) (2022-09-07T15:15:12Z) - Learning Neural Network Subspaces [74.44457651546728]
近年の観測は,ニューラルネットワーク最適化の展望の理解を深めている。
1つのモデルのトレーニングと同じ計算コストで、高精度ニューラルネットワークの線、曲線、単純軸を学習します。
1つのモデルのトレーニングと同じ計算コストで、高精度ニューラルネットワークの線、曲線、単純軸を学習します。
論文 参考訳(メタデータ) (2021-02-20T23:26:58Z) - Adaptive Risk Minimization: Learning to Adapt to Domain Shift [109.87561509436016]
ほとんどの機械学習アルゴリズムの基本的な前提は、トレーニングとテストデータは、同じ基礎となる分布から引き出されることである。
本研究では,学習データをドメインに構造化し,複数のテスト時間シフトが存在する場合の領域一般化の問題点について考察する。
本稿では、適応リスク最小化(ARM)の枠組みを紹介し、モデルがトレーニング領域に適応することを学ぶことで、効果的な適応のために直接最適化される。
論文 参考訳(メタデータ) (2020-07-06T17:59:30Z) - Minimax Lower Bounds for Transfer Learning with Linear and One-hidden
Layer Neural Networks [27.44348371795822]
転送学習の限界を特徴付けるための統計的ミニマックスフレームワークを開発する。
ラベル付きソース数とターゲットデータの関数として,任意のアルゴリズムで達成可能なターゲット一般化誤差に対して,低いバウンドを導出する。
論文 参考訳(メタデータ) (2020-06-16T22:49:26Z) - Never Stop Learning: The Effectiveness of Fine-Tuning in Robotic
Reinforcement Learning [109.77163932886413]
本稿では,ロボットによるロボット操作ポリシーを,政治以外の強化学習を通じて微調整することで,新たなバリエーションに適応する方法を示す。
この適応は、タスクをゼロから学習するために必要なデータの0.2%未満を使用する。
事前訓練されたポリシーを適用するという私たちのアプローチは、微調整の過程で大きなパフォーマンス向上につながります。
論文 参考訳(メタデータ) (2020-04-21T17:57:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。