論文の概要: Dynamic neighbourhood optimisation for task allocation using multi-agent
- arxiv url: http://arxiv.org/abs/2102.08307v1
- Date: Tue, 16 Feb 2021 17:49:14 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-17 15:06:32.809460
- Title: Dynamic neighbourhood optimisation for task allocation using multi-agent
- Title(参考訳): マルチエージェントを用いたタスク割当の動的近傍最適化
- Authors: Niall Creech, Natalia Criado Pacheco, Simon Miles
- Abstract要約: 大規模システムでは、タスク割り当てに集中型技術を使用する場合、課題がある。
本稿では,これらの問題を解決する4つのアルゴリズムを提案する。
システム接続に影響を及ぼす場合、非知識保持アプローチよりも5倍のパフォーマンス回復を提供する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In large-scale systems there are fundamental challenges when centralised
techniques are used for task allocation. The number of interactions is limited
by resource constraints such as on computation, storage, and network
communication. We can increase scalability by implementing the system as a
distributed task-allocation system, sharing tasks across many agents. However,
this also increases the resource cost of communications and synchronisation,
and is difficult to scale.
In this paper we present four algorithms to solve these problems. The
combination of these algorithms enable each agent to improve their task
allocation strategy through reinforcement learning, while changing how much
they explore the system in response to how optimal they believe their current
strategy is, given their past experience. We focus on distributed agent systems
where the agents' behaviours are constrained by resource usage limits, limiting
agents to local rather than system-wide knowledge. We evaluate these algorithms
in a simulated environment where agents are given a task composed of multiple
subtasks that must be allocated to other agents with differing capabilities, to
then carry out those tasks. We also simulate real-life system effects such as
networking instability. Our solution is shown to solve the task allocation
problem to 6.7% of the theoretical optimal within the system configurations
considered. It provides 5x better performance recovery over no-knowledge
retention approaches when system connectivity is impacted, and is tested
against systems up to 100 agents with less than a 9% impact on the algorithms'
performance.
- Abstract(参考訳): 大規模システムでは、タスク割り当てに集中型技術を使用する場合、根本的な課題がある。
インタラクションの数は、計算、ストレージ、ネットワーク通信などのリソース制約によって制限されます。
分散タスク割り当てシステムとしてシステムを実装することでスケーラビリティを向上させることができ、多くのエージェント間でタスクを共有することができる。
しかし、これは通信と同期のリソースコストを増加させ、スケールアップが困難である。
本稿では,これらの問題を解くための4つのアルゴリズムを提案する。
これらのアルゴリズムの組み合わせにより、各エージェントは強化学習を通じてタスク割り当て戦略を改善し、過去の経験から、現在の戦略がどの程度最適かに応じて、システムの探索量を変更することができます。
エージェントの振る舞いがリソースの使用制限によって制限される分散エージェントシステムに注目し,エージェントをシステム全体の知識よりもローカルに制限する。
エージェントが複数のサブタスクからなるタスクを、異なる能力を持つ他のエージェントに割り当てなければならないというシミュレーション環境で、これらのアルゴリズムを評価し、そのタスクを実行する。
また,ネットワーク不安定性などの実生活システム効果をシミュレートする。
提案手法は,システム構成の理論的最適値の6.7%までタスク割当問題を解決できることが示される。
システム接続が影響を受ける場合、知識を持たない保持アプローチよりも5倍パフォーマンスを回復し、アルゴリズムのパフォーマンスに9%未満の影響のある最大100のエージェントに対してテストされる。
関連論文リスト
- Heterogeneous Graph Reinforcement Learning for Dependency-aware Multi-task Allocation in Spatial Crowdsourcing [33.915222518617085]
本稿では,依存性を考慮したマルチタスクアロケーション(DMA)の問題点を公式に検討する。
Heterogeneous Graph Reinforcement Learning-based Task Allocation (HGRL-TA)として知られる、それを解決するためのよく設計されたフレームワークを提供する。
実験結果は、提案されたHGRL-TAのDMA問題を解決する効果と一般性を示し、メタヒューリスティック法を用いて達成したよりも21.78%高い平均利益をもたらす。
論文 参考訳(メタデータ) (2024-10-20T17:00:45Z) - Agent-Oriented Planning in Multi-Agent Systems [54.429028104022066]
本稿では,高速なタスク分解とアロケーションプロセスを活用するマルチエージェントシステムにおけるエージェント指向計画のための新しいフレームワークを提案する。
提案フレームワークにフィードバックループを組み込んで,そのような問題解決プロセスの有効性と堅牢性をさらに向上させる。
論文 参考訳(メタデータ) (2024-10-03T04:07:51Z) - A Two-stage Reinforcement Learning-based Approach for Multi-entity Task Allocation [27.480892280342417]
意思決定者は、さまざまなシナリオで合理的にエンティティをタスクに割り当てなければならない。
従来のメソッドは静的な属性とタスクやエンティティの数を前提としており、しばしば動的プログラミングとソリューションのアルゴリズムに依存している。
類似性に基づく2段階のタスク割り当てアルゴリズムを提案し、強化学習を利用してアロケーション戦略を学習する。
論文 参考訳(メタデータ) (2024-06-29T17:13:44Z) - Decentralized Learning Strategies for Estimation Error Minimization with Graph Neural Networks [94.2860766709971]
統計的に同一性を持つ無線ネットワークにおける自己回帰的マルコフ過程のサンプリングとリモート推定の課題に対処する。
我々のゴールは、分散化されたスケーラブルサンプリングおよび送信ポリシーを用いて、時間平均推定誤差と/または情報の年齢を最小化することである。
論文 参考訳(メタデータ) (2024-04-04T06:24:11Z) - Adaptive Resource Allocation for Virtualized Base Stations in O-RAN with
Online Learning [60.17407932691429]
基地局(vBS)を備えたオープンラジオアクセスネットワークシステムは、柔軟性の向上、コスト削減、ベンダーの多様性、相互運用性のメリットを提供する。
本研究では,予期せぬ「混み合う」環境下であっても,効率的なスループットとvBSエネルギー消費のバランスをとるオンライン学習アルゴリズムを提案する。
提案手法は, 課題のある環境においても, 平均最適性ギャップをゼロにすることで, サブ線形後悔を実現する。
論文 参考訳(メタデータ) (2023-09-04T17:30:21Z) - Multi-Agent Reinforcement Learning for Long-Term Network Resource
Allocation through Auction: a V2X Application [7.326507804995567]
我々は,自律エージェント間の分散意思決定として,移動エージェントの動的グループ(自動車など)からの計算タスクのオフロードを定式化する。
我々は、競争と協力のバランスをとることで、そのようなエージェントにプライベートとシステム目標の整合を動機付けるインタラクションメカニズムを設計する。
本稿では,部分的,遅延,ノイズの多い状態情報を用いて学習する,新しいマルチエージェントオンライン学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-07-29T10:29:06Z) - Semantic-Aware Collaborative Deep Reinforcement Learning Over Wireless
Cellular Networks [82.02891936174221]
複数のエージェントが無線ネットワーク上で協調できるコラボレーティブディープ強化学習(CDRL)アルゴリズムは有望なアプローチである。
本稿では,リソース制約のある無線セルネットワーク上で,意味的にリンクされたDRLタスクを持つ未学習エージェントのグループを効率的に協調させる,新しい意味認識型CDRL手法を提案する。
論文 参考訳(メタデータ) (2021-11-23T18:24:47Z) - Computation Resource Allocation Solution in Recommender Systems [19.456109814747048]
限られた計算資源と応答時間でビジネス目標を最大化する計算資源割当ソリューション(CRAS)を提案します。
本手法の有効性はtaobao.comの実データに基づく広範囲な実験により検証された。
論文 参考訳(メタデータ) (2021-03-03T08:41:43Z) - Resource allocation in dynamic multiagent systems [0.0]
MG-RAOアルゴリズムは,マルチエージェントシステムにおける資源配分問題を解決するために開発された。
シミュレーション環境における固定リソース割り当てに対する23~28%の改善を示す。
また、揮発性システムでは、mg-raoアルゴリズムを用いて、子エージェントがすべてのエージェントのリソース割り当てをモデル化するように構成されているため、複数のエージェント群をモデル化するときのパフォーマンスは46.5%である。
論文 参考訳(メタデータ) (2021-02-16T17:56:23Z) - A Machine Learning Approach for Task and Resource Allocation in Mobile
Edge Computing Based Networks [108.57859531628264]
無線ネットワークにおいて,共同作業,スペクトル,送信電力配分問題について検討する。
提案アルゴリズムは、標準Q-ラーニングアルゴリズムと比較して、収束に必要なイテレーション数と全ユーザの最大遅延を最大18%、11.1%削減することができる。
論文 参考訳(メタデータ) (2020-07-20T13:46:42Z) - Dynamic Multi-Robot Task Allocation under Uncertainty and Temporal
Constraints [52.58352707495122]
本稿では,不確実性およびマルチエージェント協調の下での逐次意思決定における重要な計算課題を分離するマルチロボット割当アルゴリズムを提案する。
都市におけるマルチアームコンベヤベルトピック・アンド・プレイスとマルチドローン配送ディスパッチの2つの異なる領域における広範囲なシミュレーション結果について検証を行った。
論文 参考訳(メタデータ) (2020-05-27T01:10:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。