論文の概要: Scalable Multi-Agent Reinforcement Learning for Warehouse Logistics with
Robotic and Human Co-Workers
- arxiv url: http://arxiv.org/abs/2212.11498v2
- Date: Fri, 7 Jul 2023 17:20:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-10 15:43:19.482323
- Title: Scalable Multi-Agent Reinforcement Learning for Warehouse Logistics with
Robotic and Human Co-Workers
- Title(参考訳): ロボットと人間の同僚による倉庫ロジスティクスのためのスケーラブルなマルチエージェント強化学習
- Authors: Aleksandar Krnjaic, Raul D. Steleac, Jonathan D. Thomas, Georgios
Papoudakis, Lukas Sch\"afer, Andrew Wing Keung To, Kuan-Ho Lao, Murat
Cubuktepe, Matthew Haley, Peter B\"orsting, Stefano V. Albrecht
- Abstract要約: 我々は、多数の移動ロボットと人間のピッカーが協力して倉庫内でアイテムを収集、配達する倉庫を構想する。
我々は、マネージャが労働者エージェントに目標を割り当てる階層的MARLアルゴリズムを開発し、管理者と労働者の政策は、グローバルな目的を最大化するために協調訓練される。
我々の階層的アルゴリズムは、多様な倉庫構成において、サンプル効率とベースラインMARLアルゴリズムの全体的な選択率を大幅に向上させる。
- 参考スコア(独自算出の注目度): 51.71901155656791
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We envision a warehouse in which dozens of mobile robots and human pickers
work together to collect and deliver items within the warehouse. The
fundamental problem we tackle, called the order-picking problem, is how these
worker agents must coordinate their movement and actions in the warehouse to
maximise performance (e.g. order throughput). Established industry methods
using heuristic approaches require large engineering efforts to optimise for
innately variable warehouse configurations. In contrast, multi-agent
reinforcement learning (MARL) can be flexibly applied to diverse warehouse
configurations (e.g. size, layout, number/types of workers, item replenishment
frequency), as the agents learn through experience how to optimally cooperate
with one another. We develop hierarchical MARL algorithms in which a manager
assigns goals to worker agents, and the policies of the manager and workers are
co-trained toward maximising a global objective (e.g. pick rate). Our
hierarchical algorithms achieve significant gains in sample efficiency and
overall pick rates over baseline MARL algorithms in diverse warehouse
configurations, and substantially outperform two established industry
heuristics for order-picking systems.
- Abstract(参考訳): 我々は、多数の移動ロボットと人間のピッカーが協力して倉庫内でアイテムを収集、配達する倉庫を構想する。
私たちが取り組んだ基本的な問題は、オーダーピッキング問題(英語版)と呼ばれ、これらの労働者エージェントは、パフォーマンスを最大化するために倉庫内での動きと動作を調整する必要がある。
ヒューリスティックなアプローチを用いた産業手法の確立には、自然に変化する倉庫構成を最適化するために大規模なエンジニアリング作業が必要である。
対照的に、マルチエージェント強化学習(MARL)は、さまざまな倉庫構成(例えば、サイズ、レイアウト、労働者の数/種類、アイテム補充頻度)に柔軟に適用することができる。
我々は,マネージャが労働者エージェントに目標を割り当てる階層的marlアルゴリズムを開発し,マネージャと労働者の方針はグローバルな目標(ピックレートなど)を最大化するために共訓練される。
我々の階層的アルゴリズムは, 多様な倉庫構成において, サンプル効率とベースラインMARLアルゴリズムの全体的な選択率を大幅に向上させ, オーダーピッキングシステムにおいて, 2つの確立された業界ヒューリスティックを著しく上回っている。
関連論文リスト
- Dynamic AGV Task Allocation in Intelligent Warehouses [1.519321208145928]
急成長するAGV業界は、その効率性、信頼性、費用対効果のために広く採用されている。
本稿では,AGVの戦略的利用を通じて,小規模・中規模の倉庫で普及するピッカー・ツー・パートシステムの向上に焦点をあてる。
本稿では,人間AGV労働者の混成チームをコーディネートするためのニューラル動的プログラミング手法を提案する。
論文 参考訳(メタデータ) (2023-12-26T12:28:25Z) - Agents meet OKR: An Object and Key Results Driven Agent System with
Hierarchical Self-Collaboration and Self-Evaluation [25.308341461293857]
OKR-Agentは、タスク解決におけるLarge Language Models(LLM)の機能を強化するように設計されている。
我々のフレームワークには、階層オブジェクトとキー結果の生成とマルチレベル評価という、2つの新しいモジュールが含まれています。
論文 参考訳(メタデータ) (2023-11-28T06:16:30Z) - Multi-Robot Coordination and Layout Design for Automated Warehousing [55.150593161240444]
我々は、最先端のMAPFアルゴリズムであっても、人間設計のレイアウトは、多数のロボットを持つ倉庫の混雑を招きかねないことを示す。
倉庫のレイアウトを最適化するために,既存のシナリオ自動生成手法を拡張した。
その結果,(1)交通渋滞の低減とスループットの向上,(2)ロボットの数を2倍にすることで自動倉庫のスケーラビリティの向上,(3)ユーザが特定した多様性対策でレイアウトを生成できることが示唆された。
論文 参考訳(メタデータ) (2023-05-10T20:00:06Z) - Learning Reward Machines in Cooperative Multi-Agent Tasks [75.79805204646428]
本稿では,MARL(Multi-Agent Reinforcement Learning)に対する新しいアプローチを提案する。
これは、協調的なタスク分解と、サブタスクの構造をコードする報酬機(RM)の学習を組み合わせる。
提案手法は、部分的に観測可能な環境下での報酬の非マルコフ的性質に対処するのに役立つ。
論文 参考訳(メタデータ) (2023-03-24T15:12:28Z) - Multi-Agent Reinforcement Learning for Microprocessor Design Space
Exploration [71.95914457415624]
マイクロプロセッサアーキテクトは、高性能でエネルギー効率の追求において、ドメイン固有のカスタマイズにますます頼っている。
この問題に対処するために,Multi-Agent RL (MARL) を利用した別の定式化を提案する。
評価の結果,MARLの定式化は単エージェントRLのベースラインよりも一貫して優れていた。
論文 参考訳(メタデータ) (2022-11-29T17:10:24Z) - Multi-agent Deep Covering Skill Discovery [50.812414209206054]
本稿では,複数エージェントの結合状態空間の予測被覆時間を最小化し,マルチエージェントオプションを構築するマルチエージェントDeep Covering Option Discoveryを提案する。
また、MARLプロセスにマルチエージェントオプションを採用するための新しいフレームワークを提案する。
提案アルゴリズムは,アテンション機構とエージェントの相互作用を効果的に把握し,マルチエージェントオプションの同定に成功した。
論文 参考訳(メタデータ) (2022-10-07T00:40:59Z) - LDSA: Learning Dynamic Subtask Assignment in Cooperative Multi-Agent
Reinforcement Learning [122.47938710284784]
協調型MARLにおける動的サブタスク代入(LDSA)を学習するための新しいフレームワークを提案する。
エージェントを異なるサブタスクに合理的に割り当てるために,能力に基づくサブタスク選択戦略を提案する。
LDSAは、より優れたコラボレーションのために、合理的で効果的なサブタスクの割り当てを学習していることを示す。
論文 参考訳(メタデータ) (2022-05-05T10:46:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。