論文の概要: ScheduleNet: Learn to solve multi-agent scheduling problems with
reinforcement learning
- arxiv url: http://arxiv.org/abs/2106.03051v1
- Date: Sun, 6 Jun 2021 07:08:58 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-08 18:19:59.121121
- Title: ScheduleNet: Learn to solve multi-agent scheduling problems with
reinforcement learning
- Title(参考訳): schedulenet:強化学習によるマルチエージェントスケジューリング問題の解法を学ぶ
- Authors: Junyoung Park, Sanjar Bakhtiyar, Jinkyoo Park
- Abstract要約: 我々は、複数のエージェントを効果的に調整してタスクを完了させる分散意思決定ポリシーであるScheduleNetを学ぶ。
各種マルチエージェントスケジューリングタスクの一般的な学習ベーススケジューラとしてのScheduleNetの有効性を検証する。
- 参考スコア(独自算出の注目度): 10.16257074782054
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose ScheduleNet, a RL-based real-time scheduler, that can solve
various types of multi-agent scheduling problems. We formulate these problems
as a semi-MDP with episodic reward (makespan) and learn ScheduleNet, a
decentralized decision-making policy that can effectively coordinate multiple
agents to complete tasks. The decision making procedure of ScheduleNet
includes: (1) representing the state of a scheduling problem with the
agent-task graph, (2) extracting node embeddings for agent and tasks nodes, the
important relational information among agents and tasks, by employing the
type-aware graph attention (TGA), and (3) computing the assignment probability
with the computed node embeddings. We validate the effectiveness of ScheduleNet
as a general learning-based scheduler for solving various types of multi-agent
scheduling tasks, including multiple salesman traveling problem (mTSP) and job
shop scheduling problem (JSP).
- Abstract(参考訳): 様々なタイプのマルチエージェントスケジューリング問題を解決するためのrlベースのリアルタイムスケジューラである schedulenet を提案する。
我々は,これらの問題を擬似報酬付きセミMDP(makespan)として定式化し,複数のエージェントを効果的に協調してタスクを完了させる分散型意思決定ポリシーであるScheduleNetを学習する。
スケジュールネットの意思決定手順は、(1)エージェントタスクグラフによるスケジューリング問題の状態を表現し、(2)エージェントとタスクノードのノード埋め込みを抽出し、(2)エージェントとタスク間の重要な関係情報を、タイプ認識グラフ注意(TGA)を用いて、(3)計算ノード埋め込みによる割り当て確率を計算する。
本稿では,マルチセールスマン旅行問題 (mtsp) やジョブショップスケジューリング問題 (jsp) など多種多様なマルチエージェントスケジューリング課題を解決するための汎用学習型スケジューラとして schedulenet の有効性を検証する。
関連論文リスト
- Agent-Oriented Planning in Multi-Agent Systems [54.429028104022066]
本稿では,高速なタスク分解とアロケーションプロセスを活用するマルチエージェントシステムにおけるエージェント指向計画のための新しいフレームワークを提案する。
提案フレームワークにフィードバックループを組み込んで,そのような問題解決プロセスの有効性と堅牢性をさらに向上させる。
論文 参考訳(メタデータ) (2024-10-03T04:07:51Z) - Reinforcement Learning with Success Induced Task Prioritization [68.8204255655161]
本稿では,自動カリキュラム学習のためのフレームワークであるSuccess induced Task Prioritization (SITP)を紹介する。
アルゴリズムはエージェントに最速の学習を提供するタスクの順序を選択する。
我々は,SITPが他のカリキュラム設計手法と一致するか,あるいは上回っていることを実証する。
論文 参考訳(メタデータ) (2022-12-30T12:32:43Z) - Meta-learning with an Adaptive Task Scheduler [93.63502984214918]
既存のメタ学習アルゴリズムは、一様確率でランダムにメタトレーニングタスクをサンプリングする。
タスクは、限られた数のメタトレーニングタスクを考えると、ノイズや不均衡に有害である可能性が高い。
メタトレーニングプロセスのための適応タスクスケジューラ(ATS)を提案する。
論文 参考訳(メタデータ) (2021-10-26T22:16:35Z) - An Evolutionary Algorithm for Task Scheduling in Crowdsourced Software
Development [10.373891804761376]
本稿では,クラウドソーシングソフトウェア開発のための進化的アルゴリズムに基づくタスクスケジューリング手法を提案する。
4つのプロジェクトの実験結果から,提案手法はプロジェクト期間を33~78%短縮できる可能性が示された。
論文 参考訳(メタデータ) (2021-07-05T18:07:26Z) - Better than the Best: Gradient-based Improper Reinforcement Learning for
Network Scheduling [60.48359567964899]
パケット遅延を最小限に抑えるため,制約付き待ち行列ネットワークにおけるスケジューリングの問題を考える。
我々は、利用可能な原子ポリシーよりも優れたスケジューラを生成するポリシー勾配に基づく強化学習アルゴリズムを使用する。
論文 参考訳(メタデータ) (2021-05-01T10:18:34Z) - Scheduling Plans of Tasks [0.0]
タスクのスケジューリング計画の問題を解決するアルゴリズムを提案する。
提案アルゴリズムは,計画計画数を最大化する実行可能なスケジュールを探索する。
論文 参考訳(メタデータ) (2021-02-06T10:14:54Z) - Scalable Anytime Planning for Multi-Agent MDPs [37.69939216970677]
動的協調を必要とする大規模マルチエージェント連続的決定問題に対するスケーラブルな木探索計画アルゴリズムを提案する。
提案アルゴリズムは,モンテカルロ木探索 (MCTS) を用いたオンライン計画,協調グラフを用いた局所エージェント相互作用の因子表現,および協調行動選択のための反復マックスプラス法からなる。
論文 参考訳(メタデータ) (2021-01-12T22:50:17Z) - A Machine Learning Approach for Task and Resource Allocation in Mobile
Edge Computing Based Networks [108.57859531628264]
無線ネットワークにおいて,共同作業,スペクトル,送信電力配分問題について検討する。
提案アルゴリズムは、標準Q-ラーニングアルゴリズムと比較して、収束に必要なイテレーション数と全ユーザの最大遅延を最大18%、11.1%削減することができる。
論文 参考訳(メタデータ) (2020-07-20T13:46:42Z) - Dynamic Multi-Robot Task Allocation under Uncertainty and Temporal
Constraints [52.58352707495122]
本稿では,不確実性およびマルチエージェント協調の下での逐次意思決定における重要な計算課題を分離するマルチロボット割当アルゴリズムを提案する。
都市におけるマルチアームコンベヤベルトピック・アンド・プレイスとマルチドローン配送ディスパッチの2つの異なる領域における広範囲なシミュレーション結果について検証を行った。
論文 参考訳(メタデータ) (2020-05-27T01:10:41Z) - A Novel Multi-Agent System for Complex Scheduling Problems [2.294014185517203]
本稿では,様々な問題領域に適用可能なマルチエージェントシステムの概念と実装について述べる。
提案手法の有効性を示すため,NP-hardスケジューリング問題をシミュレートする。
本稿では,レイアウトの複雑さの低減,複雑なシステムの制御の改善,拡張性など,エージェントベースのアプローチの利点を強調した。
論文 参考訳(メタデータ) (2020-04-20T14:04:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。