論文の概要: Learning Optimal Decision Making for an Industrial Truck Unloading Robot
using Minimal Simulator Runs
- arxiv url: http://arxiv.org/abs/2105.05019v1
- Date: Sat, 13 Mar 2021 06:22:23 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-08 06:24:51.647825
- Title: Learning Optimal Decision Making for an Industrial Truck Unloading Robot
using Minimal Simulator Runs
- Title(参考訳): ミニマムシミュレータランを用いた産業用トラック荷降ろしロボットの最適意思決定の学習
- Authors: Manash Pratim Das, Anirudh Vemula, Mayank Pathak, Sandip Aine, Maxim
Likhachev
- Abstract要約: 私たちのような高忠実なロボットシミュレータのほとんどは、時間がかかる。
トラックの降ろし問題に対して, 実験により, シミュレーター走行の大幅な削減が達成できることが示唆された。
- 参考スコア(独自算出の注目度): 15.208516853395453
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Consider a truck filled with boxes of varying size and unknown mass and an
industrial robot with end-effectors that can unload multiple boxes from any
reachable location. In this work, we investigate how would the robot with the
help of a simulator, learn to maximize the number of boxes unloaded by each
action. Most high-fidelity robotic simulators like ours are time-consuming.
Therefore, we investigate the above learning problem with a focus on minimizing
the number of simulation runs required. The optimal decision-making problem
under this setting can be formulated as a multi-class classification problem.
However, to obtain the outcome of any action requires us to run the
time-consuming simulator, thereby restricting the amount of training data that
can be collected. Thus, we need a data-efficient approach to learn the
classifier and generalize it with a minimal amount of data. A high-fidelity
physics-based simulator is common in general for complex manipulation tasks
involving multi-body interactions. To this end, we train an optimal decision
tree as the classifier, and for each branch of the decision tree, we reason
about the confidence in the decision using a Probably Approximately Correct
(PAC) framework to determine whether more simulator data will help reach a
certain confidence level. This provides us with a mechanism to evaluate when
simulation can be avoided for certain decisions, and when simulation will
improve the decision making. For the truck unloading problem, our experiments
show that a significant reduction in simulator runs can be achieved using the
proposed method as compared to naively running the simulator to collect data to
train equally performing decision trees.
- Abstract(参考訳): さまざまな大きさと未知の質量の箱で満たされたトラックと、到達可能な場所から複数の箱を降ろすことができるエンドエフェクターを備えた産業用ロボットを考えてみよう。
本研究では,ロボットがシミュレーターの助けを借りて,各アクションでアンロードされるボックスの数を最大化する方法について検討する。
私たちのような高精細なロボットシミュレータのほとんどは、時間を要する。
そこで,本研究では,必要なシミュレーション実行回数を最小限に抑えながら,上記の学習問題を考察する。
この設定下での最適意思決定問題は、多クラス分類問題として定式化することができる。
しかし,行動の結果を得るためには,時間を要するシミュレータを実行し,収集可能なトレーニングデータの量を制限する必要がある。
したがって、分類器を学習し、最小限のデータで一般化するためには、データ効率のよいアプローチが必要である。
高忠実度物理に基づくシミュレータは、多体相互作用を含む複雑な操作タスクに一般的に用いられる。
この目的のために、最適な決定木を分類器として訓練し、決定木の各枝について、確率的近似(PAC)フレームワークを用いて決定の信頼性を判断し、より多くのシミュレータデータが一定の信頼度に達するかどうかを判断する。
これにより、ある決定に対してシミュレーションを回避でき、いつシミュレーションが意思決定を改善するかを評価するメカニズムが提供される。
トラックの荷降ろし問題に対して,提案手法を用いてシミュレータの実行量を大幅に削減できることを示す実験を行った。
関連論文リスト
- Autonomous Vehicle Controllers From End-to-End Differentiable Simulation [60.05963742334746]
そこで我々は,AVコントローラのトレーニングにAPG(analytic Policy gradients)アプローチを適用可能なシミュレータを提案し,その設計を行う。
提案するフレームワークは, エージェントがより根底的なポリシーを学ぶのを助けるために, 環境力学の勾配を役立てる, エンド・ツー・エンドの訓練ループに, 微分可能シミュレータを組み込む。
ダイナミクスにおけるパフォーマンスとノイズに対する堅牢性の大幅な改善と、全体としてより直感的なヒューマンライクな処理が見られます。
論文 参考訳(メタデータ) (2024-09-12T11:50:06Z) - Waymax: An Accelerated, Data-Driven Simulator for Large-Scale Autonomous
Driving Research [76.93956925360638]
Waymaxは、マルチエージェントシーンにおける自動運転のための新しいデータ駆動シミュレータである。
TPU/GPUなどのハードウェアアクセラレータで完全に動作し、トレーニング用のグラフ内シミュレーションをサポートする。
我々は、一般的な模倣と強化学習アルゴリズムのスイートをベンチマークし、異なる設計決定に関するアブレーション研究を行った。
論文 参考訳(メタデータ) (2023-10-12T20:49:15Z) - Continual learning autoencoder training for a particle-in-cell
simulation via streaming [52.77024349608834]
今後のエクサスケール時代は 次世代の物理シミュレーションを 高解像度で提供します
これらのシミュレーションは高解像度であり、ディスク上に大量のシミュレーションデータを格納することはほぼ不可能であるため、機械学習モデルのトレーニングに影響を与える。
この研究は、ディスク上のデータなしで、実行中のシミュレーションにニューラルネットワークを同時にトレーニングするアプローチを示す。
論文 参考訳(メタデータ) (2022-11-09T09:55:14Z) - Obstacle Avoidance for Robotic Manipulator in Joint Space via Improved
Proximal Policy Optimization [6.067589886362815]
本稿では,6-DoFマニピュレータのタスク空間から関節空間にマップするために,改良されたPPOアルゴリズムを用いて深層ニューラルネットワークを訓練する。
実ロボットでそのようなタスクを訓練するのは時間を要するので、モデルを訓練するためのシミュレーション環境を開発する。
実験結果から,ロボットは非構造環境下で1つの目標をトラッキングしたり,複数の目標に到達することができた。
論文 参考訳(メタデータ) (2022-10-03T10:21:57Z) - DiSECt: A Differentiable Simulator for Parameter Inference and Control
in Robotic Cutting [71.50844437057555]
軟質材料を切断するための最初の微分可能シミュレータであるDiSECtについて述べる。
シミュレータは、符号付き距離場に基づく連続接触モデルにより有限要素法を増強する。
このシミュレータは, 最先端の商用解法を用いて, 結果の力やフィールドに適合するようにキャリブレーションできることを示す。
論文 参考訳(メタデータ) (2022-03-19T07:27:19Z) - Online Planning in POMDPs with Self-Improving Simulators [17.722070992253638]
私たちはオンラインで、時間とともに改善する近似的だがはるかに高速なシミュレータを学びます。
近似シミュレータが学習中に確実に効率的に計画を行うため,シミュレーション毎にどのシミュレータを使うかを適応的に決定する手法を開発した。
2つの大きなドメインの実験的結果は、POMCPと統合すると、我々のアプローチは時間とともに効率を向上して計画できることを示している。
論文 参考訳(メタデータ) (2022-01-27T09:41:59Z) - Towards Optimal Strategies for Training Self-Driving Perception Models
in Simulation [98.51313127382937]
合成ドメインのみにおけるラベルの使用に焦点を当てる。
提案手法では,ニューラル不変表現の学習方法と,シミュレータからデータをサンプリングする方法に関する理論的にインスピレーションを得た視点を導入する。
マルチセンサーデータを用いた鳥眼視車両分割作業におけるアプローチについて紹介する。
論文 参考訳(メタデータ) (2021-11-15T18:37:43Z) - Robot Learning from Randomized Simulations: A Review [59.992761565399185]
ディープラーニングがロボティクス研究のパラダイムシフトを引き起こし、大量のデータを必要とする方法が好まれている。
最先端のアプローチは、データ生成が高速かつ安価であるシミュレーションで学ぶ。
本稿では,ランダム化シミュレーションから学習する手法である「領域ランダム化」に焦点をあてる。
論文 参考訳(メタデータ) (2021-11-01T13:55:41Z) - An Active Learning Framework for Constructing High-fidelity Mobility
Maps [0.0]
本稿では,機械学習分類器の学習に必要なシミュレーション数を,精度を犠牲にすることなく大幅に削減する,能動的学習パラダイムを提案する。
実験結果から, ランダムサンプリングと比較した場合のシミュレーション回数の半分以下を用いて, ニューラルネットワークを高精度に学習できることが示唆された。
論文 参考訳(メタデータ) (2020-03-07T04:50:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。