論文の概要: Learning Coordination Policies over Heterogeneous Graphs for Human-Robot
Teams via Recurrent Neural Schedule Propagation
- arxiv url: http://arxiv.org/abs/2301.13279v1
- Date: Mon, 30 Jan 2023 20:42:06 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-01 18:37:29.894225
- Title: Learning Coordination Policies over Heterogeneous Graphs for Human-Robot
Teams via Recurrent Neural Schedule Propagation
- Title(参考訳): リカレントニューラルネットワークによるロボットチームにおける異種グラフ上のコーディネーションの学習
- Authors: Batuhan Altundas, Zheyuan Wang, Joshua Bishop and Matthew Gombolay
- Abstract要約: HybridNetは、人間のロボットチームをスケジューリングするためのディープラーニングベースのフレームワークである。
マルチラウンド環境で混在するロボットチームのための仮想スケジューリング環境を開発する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As human-robot collaboration increases in the workforce, it becomes essential
for human-robot teams to coordinate efficiently and intuitively. Traditional
approaches for human-robot scheduling either utilize exact methods that are
intractable for large-scale problems and struggle to account for stochastic,
time varying human task performance, or application-specific heuristics that
require expert domain knowledge to develop. We propose a deep learning-based
framework, called HybridNet, combining a heterogeneous graph-based encoder with
a recurrent schedule propagator for scheduling stochastic human-robot teams
under upper- and lower-bound temporal constraints. The HybridNet's encoder
leverages Heterogeneous Graph Attention Networks to model the initial
environment and team dynamics while accounting for the constraints. By
formulating task scheduling as a sequential decision-making process, the
HybridNet's recurrent neural schedule propagator leverages Long Short-Term
Memory (LSTM) models to propagate forward consequences of actions to carry out
fast schedule generation, removing the need to interact with the environment
between every task-agent pair selection. The resulting scheduling policy
network provides a computationally lightweight yet highly expressive model that
is end-to-end trainable via Reinforcement Learning algorithms. We develop a
virtual task scheduling environment for mixed human-robot teams in a
multi-round setting, capable of modeling the stochastic learning behaviors of
human workers. Experimental results showed that HybridNet outperformed other
human-robot scheduling solutions across problem sizes for both deterministic
and stochastic human performance, with faster runtime compared to
pure-GNN-based schedulers.
- Abstract(参考訳): 人間とロボットのコラボレーションが労働力が増えるにつれて、人間とロボットのチームが効率的かつ直感的に協調することが不可欠になる。
従来のヒューマンロボットスケジューリングのアプローチは、大規模な問題に対して難解であり、確率的、時間的変化、あるいは専門的なドメイン知識を必要とするアプリケーション固有のヒューリスティックスを考慮に入れるのに苦労する厳密な方法を使うかのどちらかである。
本稿では,ヘテロジニアスグラフベースのエンコーダと,確率的ヒューマンロボットチームを上界および下界の時間制約下でスケジューリングするための反復スケジュールプロパゲータを組み合わせた,ディープラーニングベースのフレームワークであるhybridnetを提案する。
HybridNetのエンコーダは異種グラフ注意ネットワークを利用して、制約を考慮しながら初期環境とチームダイナミクスをモデル化する。
タスクスケジューリングをシーケンシャルな意思決定プロセスとして定式化することにより、HybridNetのリカレントなニューラルスケジュールプロパゲータは、Long Short-Term Memory(LSTM)モデルを活用して、アクションの結果を伝播して高速なスケジュール生成を実行し、タスクとエージェントのペアの選択毎に環境と対話する必要がなくなる。
結果として生じるスケジューリングポリシネットワークは、計算的に軽量で表現力の高いモデルを提供し、Reinforcement Learningアルゴリズムを介してエンドツーエンドでトレーニングできる。
作業者の確率的学習行動のモデル化が可能な,混在するロボットチームのための仮想タスクスケジューリング環境を複数ラウンドで構築する。
実験の結果、hybridnetは、pure-gnnベースのスケジューラよりも高速なランタイムで、決定論的および確率的な人間のパフォーマンスの両方において、問題サイズにわたる他のヒューマンロボットスケジューリングソリューションよりも優れていた。
関連論文リスト
- Prediction-Assisted Online Distributed Deep Learning Workload Scheduling in GPU Clusters [24.845122459974466]
本稿では,A-SRPT(Adaptive Shortest-Remaining-Time-first)スケジューリングアルゴリズムを提案する。
ヘテロジニアスディープニューラルネットワーク(DNN)モデルに対応するグラフとして各ジョブをモデル化することにより、A-SRPTはジョブを利用可能なGPUに戦略的に割り当てる。
A-SRPTは複雑なスケジューリング問題を単一マシンのインスタンスにマッピングし、プリエンプティブな "shortest-remaining-processing-time-first" 戦略によって最適に対処する。
論文 参考訳(メタデータ) (2025-01-09T20:19:01Z) - Robotic warehousing operations: a learn-then-optimize approach to large-scale neighborhood search [84.39855372157616]
本稿では,ワークステーションの注文処理,アイテムポッドの割り当て,ワークステーションでの注文処理のスケジュールを最適化することで,ウェアハウジングにおけるロボット部品対ピッカー操作を支援する。
そこで我々は, 大規模近傍探索を用いて, サブプロブレム生成に対する学習を最適化する手法を提案する。
Amazon Roboticsと共同で、我々のモデルとアルゴリズムは、最先端のアプローチよりも、実用的な問題に対するより強力なソリューションを生み出していることを示す。
論文 参考訳(メタデータ) (2024-08-29T20:22:22Z) - Dynamic Scheduling for Federated Edge Learning with Streaming Data [56.91063444859008]
我々は,長期的エネルギー制約のある分散エッジデバイスにおいて,トレーニングデータを時間とともにランダムに生成するフェデレーションエッジ学習(FEEL)システムを検討する。
限られた通信リソースとレイテンシ要件のため、各イテレーションでローカルトレーニングプロセスに参加するのはデバイスのサブセットのみである。
論文 参考訳(メタデータ) (2023-05-02T07:41:16Z) - It Takes Two: Learning to Plan for Human-Robot Cooperative Carrying [0.6981715773998527]
本研究では,協調型ロボットチームにおけるテーブルキャリング作業における現実的な動作計画の予測手法を提案する。
変動リカレントニューラルネットワーク(VRNN)を用いて、時間とともに人間のロボットチームの軌道の変動をモデル化する。
本モデルでは, ベースライン型集中型サンプリングベースプランナに比べて, より人間的な動きを生成できることを示す。
論文 参考訳(メタデータ) (2022-09-26T17:59:23Z) - Model Predictive Control for Fluid Human-to-Robot Handovers [50.72520769938633]
人間の快適さを考慮に入れた計画運動は、人間ロボットのハンドオーバプロセスの一部ではない。
本稿では,効率的なモデル予測制御フレームワークを用いてスムーズな動きを生成することを提案する。
ユーザ数名の多様なオブジェクトに対して,人間とロボットのハンドオーバ実験を行う。
論文 参考訳(メタデータ) (2022-03-31T23:08:20Z) - Semantic-Aware Collaborative Deep Reinforcement Learning Over Wireless
Cellular Networks [82.02891936174221]
複数のエージェントが無線ネットワーク上で協調できるコラボレーティブディープ強化学習(CDRL)アルゴリズムは有望なアプローチである。
本稿では,リソース制約のある無線セルネットワーク上で,意味的にリンクされたDRLタスクを持つ未学習エージェントのグループを効率的に協調させる,新しい意味認識型CDRL手法を提案する。
論文 参考訳(メタデータ) (2021-11-23T18:24:47Z) - SABER: Data-Driven Motion Planner for Autonomously Navigating
Heterogeneous Robots [112.2491765424719]
我々は、データ駆動型アプローチを用いて、異種ロボットチームをグローバルな目標に向けてナビゲートする、エンドツーエンドのオンラインモーションプランニングフレームワークを提案する。
モデル予測制御(SMPC)を用いて,ロボット力学を満たす制御入力を計算し,障害物回避時の不確実性を考慮した。
リカレントニューラルネットワークは、SMPC有限時間地平線解における将来の状態の不確かさを素早く推定するために用いられる。
ディープQ学習エージェントがハイレベルパスプランナーとして機能し、SMPCにロボットを望ましいグローバルな目標に向けて移動させる目標位置を提供する。
論文 参考訳(メタデータ) (2021-08-03T02:56:21Z) - Rosella: A Self-Driving Distributed Scheduler for Heterogeneous Clusters [7.206919625027208]
異種クラスタにおけるタスクスケジューリングのための,新たな自律分散アプローチであるRosellaを紹介する。
Rosellaは自動的に計算環境を学習し、スケジューリングポリシーをリアルタイムで調整する。
32ノードのAWSクラスタ上で、さまざまなワークロードでRosellaを評価します。
論文 参考訳(メタデータ) (2020-10-28T20:12:29Z) - Modeling Human Temporal Uncertainty in Human-Agent Teams [0.0]
本稿では,集団労働者の集団から人的タイミングの不確実性のモデルを構築した。
重み付き分布は人間の時間的不確実性の最良のモデルであると結論付けている。
我々は,これらの結果と協調的なオンラインゲームが,ロボットの流速を改善するためのスケジューリングの今後の探索にどのように役立つかについて議論する。
論文 参考訳(メタデータ) (2020-10-09T23:43:59Z) - Dynamic Multi-Robot Task Allocation under Uncertainty and Temporal
Constraints [52.58352707495122]
本稿では,不確実性およびマルチエージェント協調の下での逐次意思決定における重要な計算課題を分離するマルチロボット割当アルゴリズムを提案する。
都市におけるマルチアームコンベヤベルトピック・アンド・プレイスとマルチドローン配送ディスパッチの2つの異なる領域における広範囲なシミュレーション結果について検証を行った。
論文 参考訳(メタデータ) (2020-05-27T01:10:41Z) - DeepSoCS: A Neural Scheduler for Heterogeneous System-on-Chip (SoC)
Resource Scheduling [0.0]
システム・オン・チップ(SoC)システムのための新しいスケジューリングソリューションを提案する。
我々のDeep Reinforcement Learning (DRL)ベースのスケジューリング(DeepSoCS)はルールベースのスケジューラの脆さを克服する。
論文 参考訳(メタデータ) (2020-05-15T17:31:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。