論文の概要: Using a Variational Autoencoder to Learn Valid Search Spaces of Safely
Monitored Autonomous Robots for Last-Mile Delivery
- arxiv url: http://arxiv.org/abs/2303.03211v1
- Date: Mon, 6 Mar 2023 15:13:35 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-07 15:36:47.850870
- Title: Using a Variational Autoencoder to Learn Valid Search Spaces of Safely
Monitored Autonomous Robots for Last-Mile Delivery
- Title(参考訳): 変分オートエンコーダを用いた安全監視型自律ロボットのラストミル配送における有効探索空間の学習
- Authors: Peter J. Bentley, Soo Ling Lim, Paolo Arcaini, Fuyuki Ishikawa
- Abstract要約: 現実の世界では、自律ロボットは安全のために人間の監督を必要とする。
我々は、配達を最大化するために自律ロボットのタイミングを最適化する現実的な問題に取り組む。
適切な数のロボットが同時に動作する有効なソリューションを見つけることができるのはCOILのみである。
- 参考スコア(独自算出の注目度): 4.06954791852512
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The use of autonomous robots for delivery of goods to customers is an
exciting new way to provide a reliable and sustainable service. However, in the
real world, autonomous robots still require human supervision for safety
reasons. We tackle the realworld problem of optimizing autonomous robot timings
to maximize deliveries, while ensuring that there are never too many robots
running simultaneously so that they can be monitored safely. We assess the use
of a recent hybrid machine-learningoptimization approach COIL (constrained
optimization in learned latent space) and compare it with a baseline genetic
algorithm for the purposes of exploring variations of this problem. We also
investigate new methods for improving the speed and efficiency of COIL. We show
that only COIL can find valid solutions where appropriate numbers of robots run
simultaneously for all problem variations tested. We also show that when COIL
has learned its latent representation, it can optimize 10% faster than the GA,
making it a good choice for daily re-optimization of robots where delivery
requests for each day are allocated to robots while maintaining safe numbers of
robots running at once.
- Abstract(参考訳): 顧客に商品を届けるための自律ロボットの利用は、信頼性と持続可能なサービスを提供するためのエキサイティングな新しい方法だ。
しかし、現実の世界では、自律ロボットは安全のために人間の監督を必要とする。
我々は、自律ロボットのタイミングを最適化して配達を最大化する現実的な問題に取り組み、安全に監視できるように、同時に走るロボットが多すぎることを保証する。
我々は,最近のハイブリッド機械学習最適化手法であるCOIL (Constrained optimization in learn latent space) を用いて,この問題のバリエーションを探索するためのベースライン遺伝的アルゴリズムと比較した。
また,COILの高速化と効率向上のための新しい手法についても検討した。
テストされた全ての問題に対して,適切な数のロボットが同時に動作するような有効な解はCOILでのみ見つかることを示す。
また,COILが遅延表現を学習した場合には,GAよりも10%高速に最適化できることが示され,毎日の配達要求をロボットに割り当てるロボットの再最適化において,同時に走るロボットの安全数を確保できる。
関連論文リスト
- Robotic warehousing operations: a learn-then-optimize approach to large-scale neighborhood search [84.39855372157616]
本稿では,ワークステーションの注文処理,アイテムポッドの割り当て,ワークステーションでの注文処理のスケジュールを最適化することで,ウェアハウジングにおけるロボット部品対ピッカー操作を支援する。
そこで我々は, 大規模近傍探索を用いて, サブプロブレム生成に対する学習を最適化する手法を提案する。
Amazon Roboticsと共同で、我々のモデルとアルゴリズムは、最先端のアプローチよりも、実用的な問題に対するより強力なソリューションを生み出していることを示す。
論文 参考訳(メタデータ) (2024-08-29T20:22:22Z) - Leveraging Hyperbolic Embeddings for Coarse-to-Fine Robot Design [40.01142267374432]
マルチセルロボットの設計は、多様なタスクを実行するために効率的に制御できる多数のセルからなるロボットを作ることを目的としている。
これまでの研究では、さまざまなタスクのためのロボットを生成する能力が実証されてきたが、これらのアプローチは、広大なデザイン空間でロボットを直接最適化することが多い。
本稿では,多細胞ロボットを設計するための新しい粗粒化手法を提案する。
論文 参考訳(メタデータ) (2023-11-01T11:56:32Z) - ImitationNet: Unsupervised Human-to-Robot Motion Retargeting via Shared Latent Space [9.806227900768926]
本稿では,ロボットの動きに対する新しいディープラーニング手法を提案する。
本手法では,新しいロボットへの翻訳を容易にする,人間とロボットのペアデータを必要としない。
我々のモデルは、効率と精度の観点から、人間とロボットの類似性に関する既存の研究よりも優れています。
論文 参考訳(メタデータ) (2023-09-11T08:55:04Z) - Self-Improving Robots: End-to-End Autonomous Visuomotor Reinforcement
Learning [54.636562516974884]
模倣と強化学習において、人間の監督コストは、ロボットが訓練できるデータの量を制限する。
本研究では,自己改善型ロボットシステムのための新しい設計手法であるMEDAL++を提案する。
ロボットは、タスクの実施と解除の両方を学ぶことで、自律的にタスクを練習し、同時にデモンストレーションから報酬関数を推論する。
論文 参考訳(メタデータ) (2023-03-02T18:51:38Z) - Decentralised construction of a global coordinate system in a large
swarm of minimalistic robots [0.8701566919381223]
本研究では,最小主義的エラー発生ロボット群における位置自己認識を可能にするアルゴリズムを提案する。
受信メッセージのベアリングを計測できないにもかかわらず、アルゴリズムを実行しているロボットは、定期的に配置されたSwarm内の位置を計算することができる。
我々のソリューションは最先端のアルゴリズムよりも少ない要件を持ち、総合的なノイズフィルタリング機構を含んでいる。
論文 参考訳(メタデータ) (2023-02-28T14:14:17Z) - GLSO: Grammar-guided Latent Space Optimization for Sample-efficient
Robot Design Automation [16.96128900256427]
設計自動化を低次元連続最適化問題に変換するフレームワークであるGrammar-Guided Latent Space Optimization (GLSO)を提案する。
本研究では,グラフ構造設計空間と連続潜在空間とのマッピングを学習するために,グラフ変分オートエンコーダ(VAE)を訓練することにより,設計自動化を低次元連続最適化問題に変換するフレームワークを提案する。
論文 参考訳(メタデータ) (2022-09-23T17:48:24Z) - Fleet-DAgger: Interactive Robot Fleet Learning with Scalable Human
Supervision [72.4735163268491]
ロボットの商業的および産業的な展開は、実行中にリモートの人間のテレオペレーターにフォールバックすることが多い。
我々は対話型フリートラーニング(Interactive Fleet Learning, IFL)の設定を定式化し、複数のロボットが対話型クエリを行い、複数の人間スーパーバイザーから学習する。
IFLアルゴリズムのファミリーであるFleet-DAggerを提案し、新しいFleet-DAggerアルゴリズムをシミュレーションで4つのベースラインと比較する。
論文 参考訳(メタデータ) (2022-06-29T01:23:57Z) - REvolveR: Continuous Evolutionary Models for Robot-to-robot Policy
Transfer [57.045140028275036]
本研究では,運動学や形態学など,異なるパラメータを持つ2つの異なるロボット間でポリシーを伝達する問題を考察する。
模倣学習手法を含む動作や状態遷移の分布を一致させることで、新しいポリシーを訓練する既存のアプローチは、最適な動作や/または状態分布が異なるロボットでミスマッチしているために失敗する。
本稿では,物理シミュレータに実装されたロボット政策伝達に連続的進化モデルを用いることで,$RevolveR$という新しい手法を提案する。
論文 参考訳(メタデータ) (2022-02-10T18:50:25Z) - Lifelong Robotic Reinforcement Learning by Retaining Experiences [61.79346922421323]
多くのマルチタスク強化学習は、ロボットが常にすべてのタスクからデータを収集できると仮定している。
本研究では,物理ロボットシステムの実用的制約を動機として,現実的なマルチタスクRL問題について検討する。
我々は、ロボットのスキルセットを累積的に成長させるために、過去のタスクで学んだデータとポリシーを効果的に活用するアプローチを導出する。
論文 参考訳(メタデータ) (2021-09-19T18:00:51Z) - Show Me What You Can Do: Capability Calibration on Reachable Workspace
for Human-Robot Collaboration [83.4081612443128]
本稿では,REMPを用いた短時間キャリブレーションにより,ロボットが到達できると考える非専門家と地道とのギャップを効果的に埋めることができることを示す。
この校正手順は,ユーザ認識の向上だけでなく,人間とロボットのコラボレーションの効率化にも寄与することを示す。
論文 参考訳(メタデータ) (2021-03-06T09:14:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。