論文の概要: Learning Multi-agent Multi-machine Tending by Mobile Robots
- arxiv url: http://arxiv.org/abs/2408.16875v1
- Date: Thu, 29 Aug 2024 19:57:52 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-02 17:08:59.115007
- Title: Learning Multi-agent Multi-machine Tending by Mobile Robots
- Title(参考訳): 移動ロボットによるマルチエージェント・マルチマシン・テンディングの学習
- Authors: Abdalwhab Abdalwhab, Giovanni Beltrame, Samira Ebrahimi Kahou, David St-Onge,
- Abstract要約: 本稿では,MARL(Multi-agent Reinforcement Learning)技術に基づく移動ロボットによるマルチエージェント型マルチマシン学習フレームワークを提案する。
マルチエージェント・プロキシ・ポリシー・オプティマイゼーション(MAPPO)アルゴリズムにアテンションベースの符号化機構を開発し,その性能を高める。
我々のモデル (AB-MAPPO) は, タスク成功, 安全性, 資源利用の観点から, MAPPO よりも優れていた。
- 参考スコア(独自算出の注目度): 13.812524211429444
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Robotics can help address the growing worker shortage challenge of the manufacturing industry. As such, machine tending is a task collaborative robots can tackle that can also highly boost productivity. Nevertheless, existing robotics systems deployed in that sector rely on a fixed single-arm setup, whereas mobile robots can provide more flexibility and scalability. In this work, we introduce a multi-agent multi-machine tending learning framework by mobile robots based on Multi-agent Reinforcement Learning (MARL) techniques with the design of a suitable observation and reward. Moreover, an attention-based encoding mechanism is developed and integrated into Multi-agent Proximal Policy Optimization (MAPPO) algorithm to boost its performance for machine tending scenarios. Our model (AB-MAPPO) outperformed MAPPO in this new challenging scenario in terms of task success, safety, and resources utilization. Furthermore, we provided an extensive ablation study to support our various design decisions.
- Abstract(参考訳): ロボティクスは、製造業における労働者不足の増大に対処するのに役立つ。
そのため、ロボットによる協調作業は、生産性を高く向上させることができる。
それでも、そのセクターに展開されている既存のロボットシステムは、固定された単一アームのセットアップに依存している。
本研究では,MARL(Multi-agent Reinforcement Learning)技術に基づく移動ロボットによるマルチエージェント・マルチマシン・テンディング学習フレームワークを提案する。
さらに,マルチエージェント・プロキシ・ポリシー・オプティマイゼーション(MAPPO)アルゴリズムに注目に基づく符号化機構を開発し,機械学習シナリオの性能向上を図る。
我々のモデル (AB-MAPPO) は, タスク成功, 安全性, 資源利用の観点から, MAPPO よりも優れていた。
さらに, 様々な設計決定を支援するために, 広範囲にわたるアブレーション研究を行った。
関連論文リスト
- $\textbf{EMOS}$: $\textbf{E}$mbodiment-aware Heterogeneous $\textbf{M}$ulti-robot $\textbf{O}$perating $\textbf{S}$ystem with LLM Agents [33.77674812074215]
異種ロボット間の効果的な協調を実現するための新しいマルチエージェントフレームワークを提案する。
エージェントがロボットURDFファイルを理解し、ロボットキネマティクスツールを呼び出し、その物理能力の記述を生成する。
Habitat-MASベンチマークは、マルチエージェントフレームワークがエンボディメント認識推論を必要とするタスクをどのように処理するかを評価するように設計されている。
論文 参考訳(メタデータ) (2024-10-30T03:20:01Z) - Robotic warehousing operations: a learn-then-optimize approach to large-scale neighborhood search [84.39855372157616]
本稿では,ワークステーションの注文処理,アイテムポッドの割り当て,ワークステーションでの注文処理のスケジュールを最適化することで,ウェアハウジングにおけるロボット部品対ピッカー操作を支援する。
そこで我々は, 大規模近傍探索を用いて, サブプロブレム生成に対する学習を最適化する手法を提案する。
Amazon Roboticsと共同で、我々のモデルとアルゴリズムは、最先端のアプローチよりも、実用的な問題に対するより強力なソリューションを生み出していることを示す。
論文 参考訳(メタデータ) (2024-08-29T20:22:22Z) - BMW Agents -- A Framework For Task Automation Through Multi-Agent Collaboration [0.0]
我々は、様々なドメインにわたる複雑なユースケースアプリケーションを扱う柔軟なエージェントエンジニアリングフレームワークの設計に重点を置いている。
提案するフレームワークは,産業用アプリケーションの信頼性を提供し,複数の自律エージェントに対して,スケーラブルでフレキシブルで協調的なワークフローを保証するためのテクニックを提供する。
論文 参考訳(メタデータ) (2024-06-28T16:39:20Z) - An Interactive Agent Foundation Model [49.77861810045509]
本稿では,AIエージェントを訓練するための新しいマルチタスクエージェントトレーニングパラダイムを用いた対話型エージェント基礎モデルを提案する。
トレーニングパラダイムは、視覚マスク付きオートエンコーダ、言語モデリング、次世代の予測など、多様な事前学習戦略を統一する。
私たちは、ロボティクス、ゲームAI、ヘルスケアという3つの異なる領域でフレームワークのパフォーマンスを実演します。
論文 参考訳(メタデータ) (2024-02-08T18:58:02Z) - RoboGen: Towards Unleashing Infinite Data for Automated Robot Learning via Generative Simulation [68.70755196744533]
RoboGenはジェネレーティブなロボットエージェントで、ジェネレーティブなシミュレーションを通じて、さまざまなロボットのスキルを自動的に学習する。
我々の研究は、大規模モデルに埋め込まれた広範囲で多目的な知識を抽出し、それらをロボット工学の分野に移す試みである。
論文 参考訳(メタデータ) (2023-11-02T17:59:21Z) - Leveraging Hyperbolic Embeddings for Coarse-to-Fine Robot Design [40.01142267374432]
マルチセルロボットの設計は、多様なタスクを実行するために効率的に制御できる多数のセルからなるロボットを作ることを目的としている。
これまでの研究では、さまざまなタスクのためのロボットを生成する能力が実証されてきたが、これらのアプローチは、広大なデザイン空間でロボットを直接最適化することが多い。
本稿では,多細胞ロボットを設計するための新しい粗粒化手法を提案する。
論文 参考訳(メタデータ) (2023-11-01T11:56:32Z) - RoboAgent: Generalization and Efficiency in Robot Manipulation via
Semantic Augmentations and Action Chunking [54.776890150458385]
マルチタスク操作能力を持つユニバーサルエージェントを訓練するための効率的なシステムを開発した。
私たちは、12のスキルを持つ1つのエージェントを訓練することができ、38のタスクでその一般化を実証することができます。
平均すると、RoboAgentは目に見えない状況において、従来の方法よりも40%以上性能が高い。
論文 参考訳(メタデータ) (2023-09-05T03:14:39Z) - A Capability and Skill Model for Heterogeneous Autonomous Robots [69.50862982117127]
機能モデリングは、異なるマシンが提供する機能を意味的にモデル化するための有望なアプローチと考えられている。
この貢献は、製造から自律ロボットの分野への能力モデルの適用と拡張の仕方について考察する。
論文 参考訳(メタデータ) (2022-09-22T10:13:55Z) - Learning to Coordinate for a Worker-Station Multi-robot System in Planar
Coverage Tasks [16.323122275188354]
ランダムな動的干渉器を有する大規模平面領域におけるマルチロボットカバレッジパス計画問題に着目する。
本稿では,実際の作業に必要なリソースが限られている複数の作業者と,資源補給に十分なリソースを持つ1つのステーションからなる作業者ステーションMSSを紹介する。
本稿では、労働者のカバレッジプランニングと駅のランデブープランニングを同時に解決する、エンドツーエンドの分散オンラインプランニング手法を提案する。
論文 参考訳(メタデータ) (2022-08-05T05:36:42Z) - Bayesian Meta-Learning for Few-Shot Policy Adaptation Across Robotic
Platforms [60.59764170868101]
強化学習手法は、重要な性能を達成できるが、同じロボットプラットフォームで収集される大量のトレーニングデータを必要とする。
私たちはそれを、さまざまなロボットプラットフォームで共有される共通の構造を捉えるモデルを見つけることを目標とする、数ショットのメタラーニング問題として定式化します。
我々は,400個のロボットを用いて,実ロボットピッキング作業とシミュレーションリーチの枠組みを実験的に評価した。
論文 参考訳(メタデータ) (2021-03-05T14:16:20Z) - MAMBPO: Sample-efficient multi-robot reinforcement learning using
learned world models [4.84279798426797]
マルチロボットシステムは、少数の試験で行動を学ぶ強化学習(RL)アルゴリズムの恩恵を受けることができます。
マルチエージェントモデルベースポリシー最適化(MAMBPO)という新しいマルチエージェントモデルベースRLアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-03-05T13:37:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。