論文の概要: Bayesian Optimization for Developmental Robotics with Meta-Learning by
Parameters Bounds Reduction
- arxiv url: http://arxiv.org/abs/2007.15375v1
- Date: Thu, 30 Jul 2020 10:55:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-05 13:41:11.890081
- Title: Bayesian Optimization for Developmental Robotics with Meta-Learning by
Parameters Bounds Reduction
- Title(参考訳): パラメータ境界によるメタラーニングによる開発ロボティクスのベイズ最適化
- Authors: Maxime Petit, Emmanuel Dellandrea and Liming Chen
- Abstract要約: 本稿では,長期記憶と推論モジュールに基づく開発フレームワークを提案する(ベイジアン最適化,視覚的類似性,パラメータ境界縮小)。
シミュレーションでは8つの異なるオブジェクトのビンピッキングタスク(シミュレーションでは7つ,実際のセットアップでは1つ,他の類似したオブジェクトからのエクスペリエンスを伴わないメタラーニング)を作成するために,非常に小さな最適化予算にもかかわらず,成果を達成できた。
- 参考スコア(独自算出の注目度): 6.19424794628672
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In robotics, methods and softwares usually require optimizations of
hyperparameters in order to be efficient for specific tasks, for instance
industrial bin-picking from homogeneous heaps of different objects. We present
a developmental framework based on long-term memory and reasoning modules
(Bayesian Optimisation, visual similarity and parameters bounds reduction)
allowing a robot to use meta-learning mechanism increasing the efficiency of
such continuous and constrained parameters optimizations. The new optimization,
viewed as a learning for the robot, can take advantage of past experiences
(stored in the episodic and procedural memories) to shrink the search space by
using reduced parameters bounds computed from the best optimizations realized
by the robot with similar tasks of the new one (e.g. bin-picking from an
homogenous heap of a similar object, based on visual similarity of objects
stored in the semantic memory). As example, we have confronted the system to
the constrained optimizations of 9 continuous hyperparameters for a
professional software (Kamido) in industrial robotic arm bin-picking tasks, a
step that is needed each time to handle correctly new object. We used a
simulator to create bin-picking tasks for 8 different objects (7 in simulation
and one with real setup, without and with meta-learning with experiences coming
from other similar objects) achieving goods results despite a very small
optimization budget, with a better performance reached when meta-learning is
used (84.3% vs 78.9% of success overall, with a small budget of 30 iterations
for each optimization) for every object tested (p-value=0.036).
- Abstract(参考訳): ロボット工学において、メソッドやソフトウェアは通常、特定のタスク、例えば異なるオブジェクトの均質なヒープからの産業用ビンピッキングのためにハイパーパラメータの最適化を必要とする。
本稿では,長期記憶と推論モジュール(ベイジアン最適化,視覚的類似性,パラメータ境界化)に基づく開発フレームワークを提案する。
新しい最適化は、ロボットの学習として見なされ、過去の経験(エピソディクスと手続き記憶に格納されている)を利用して、ロボットが新しいものと同様のタスクで実現した最善の最適化から計算されたパラメータ境界(例えば、セマンティックメモリに格納されたオブジェクトの視覚的類似性に基づいて、類似したオブジェクトの均質なヒープからのビンピッキング)を用いて、探索空間を縮小することができる。
例えば、産業用ロボットアームのビンピッキングタスクにおいて、9つのプロ用ソフトウェア(カミド)に対する9つの連続ハイパーパラメータの制約付き最適化に直面する。
我々は8つの異なるオブジェクトに対してビンピッキングタスクを作成するためにシミュレータを使用し(シミュレーションでは7つ、実際のセットアップでは1つ、他の類似したオブジェクトから来た経験を伴わないメタラーニング)、非常に小さな最適化予算にもかかわらず、商品の成果を達成することができ、メタラーニングが使われるとき(全体の84.3%対78.9%、各最適化では30回の小さな予算で、p-value=0.036)、より良いパフォーマンスを得ることができた。
関連論文リスト
- Unlearning as multi-task optimization: A normalized gradient difference approach with an adaptive learning rate [105.86576388991713]
正規化勾配差(NGDiff)アルゴリズムを導入し、目的間のトレードオフをよりよく制御できるようにする。
本研究では,TOFUおよびMUSEデータセットにおける最先端の未学習手法において,NGDiffの優れた性能を実証的に実証し,理論的解析を行った。
論文 参考訳(メタデータ) (2024-10-29T14:41:44Z) - CURE: Simulation-Augmented Auto-Tuning in Robotics [15.943773140929856]
本稿では、因果的な設定オプションを識別するCUREを提案する。
CUREは、様々な構成オプションとロボットのパフォーマンス目標との間の因果関係を抽象化する。
物理ロボットとシミュレーションの両方で実験を行うことにより,CUREの有効性と伝達性を示す。
論文 参考訳(メタデータ) (2024-02-08T04:27:14Z) - AdaLomo: Low-memory Optimization with Adaptive Learning Rate [59.64965955386855]
大規模言語モデルに対する適応学習率(AdaLomo)を用いた低メモリ最適化を提案する。
AdaLomoはAdamWと同等の結果を得ると同時に、メモリ要件を大幅に削減し、大きな言語モデルをトレーニングするためのハードウェア障壁を低くする。
論文 参考訳(メタデータ) (2023-10-16T09:04:28Z) - Design Optimizer for Planar Soft-Growing Robot Manipulators [1.1888144645004388]
本研究は,ソフト成長ロボットの設計最適化のための新しいアプローチを提案する。
ソフトマニピュレータのキネマティックチェーンを最適化し、ターゲットに到達し、材料や資源の不要な過剰使用を避ける。
提案手法を最適性にアクセスするために, 提案手法を検証したところ, 解法の性能は著しく向上した。
論文 参考訳(メタデータ) (2023-10-05T08:23:17Z) - Energy-efficient Task Adaptation for NLP Edge Inference Leveraging
Heterogeneous Memory Architectures [68.91874045918112]
Adapter-ALBERTは、様々なタスクにわたる最大データ再利用のための効率的なモデル最適化である。
検証されたNLPエッジアクセラレータ上でシミュレーションを行うことにより、モデルを不均一なオンチップメモリアーキテクチャにマッピングする利点を実証する。
論文 参考訳(メタデータ) (2023-03-25T14:40:59Z) - Agent-based Collaborative Random Search for Hyper-parameter Tuning and
Global Function Optimization [0.0]
本稿では,機械学習モデルにおける任意のハイパーパラメータの任意の集合に対する近似値を求めるためのエージェントベース協調手法を提案する。
提案モデルの動作,特に設計パラメータの変化に対して,機械学習およびグローバル関数最適化アプリケーションの両方で検討する。
論文 参考訳(メタデータ) (2023-03-03T21:10:17Z) - Visualization and Optimization Techniques for High Dimensional Parameter
Spaces [4.111899441919165]
本稿では,直接最適化手法と視覚分析研究を組み合わせた,ストレージシステムの最適化のための自動チューニングフレームワークを提案する。
本システムは,システムパフォーマンス研究者グループとの緊密なコラボレーションによって開発され,専門家インタビュー,比較ユーザスタディ,および2つのケーススタディによって最終効果が評価された。
論文 参考訳(メタデータ) (2022-04-28T23:01:15Z) - DiffSkill: Skill Abstraction from Differentiable Physics for Deformable
Object Manipulations with Tools [96.38972082580294]
DiffSkillは、変形可能なオブジェクト操作タスクを解決するために、スキル抽象化に微分可能な物理シミュレータを使用する新しいフレームワークである。
特に、勾配に基づくシミュレーターから個々のツールを用いて、まず短距離のスキルを得る。
次に、RGBD画像を入力として取り込む実演軌跡から、ニューラルネットワークの抽象体を学習する。
論文 参考訳(メタデータ) (2022-03-31T17:59:38Z) - Conservative Objective Models for Effective Offline Model-Based
Optimization [78.19085445065845]
計算設計の問題は、合成生物学からコンピュータアーキテクチャまで、様々な場面で発生している。
本研究では,分布外入力に対する接地的目標の実際の値を低くする目的関数のモデルを学習する手法を提案する。
COMは、様々なMBO問題に対して、既存のメソッドの実装と性能の面では単純である。
論文 参考訳(メタデータ) (2021-07-14T17:55:28Z) - Bayesian Optimization with High-Dimensional Outputs [42.311308135418805]
実際には、多くの相関した結果(またはタスク)に対して定義された目的を最適化したいと望んでいます。
共分散行列におけるKronecker構造とMatheronの同一性を組み合わせた,正確なマルチタスクGPサンプリングのための効率的な手法を考案する。
これは、科学と工学の様々なタスクにまたがって、ベイズ最適化のための新しい種類のアプリケーションを、どのように解き放つかを実証する。
論文 参考訳(メタデータ) (2021-06-24T13:15:12Z) - AutoSimulate: (Quickly) Learning Synthetic Data Generation [70.82315853981838]
目的の新たな微分可能近似に基づく最適な合成データ生成法を提案する。
提案手法は,学習データ生成の高速化(最大50Times$)と,実世界のテストデータセットの精度向上(+8.7%$)を実現している。
論文 参考訳(メタデータ) (2020-08-16T11:36:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。