論文の概要: Dependency-Aware CAV Task Scheduling via Diffusion-Based Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2411.18230v1
- Date: Wed, 27 Nov 2024 11:07:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-28 15:25:45.914943
- Title: Dependency-Aware CAV Task Scheduling via Diffusion-Based Reinforcement Learning
- Title(参考訳): 拡散型強化学習による依存性を考慮したCAVタスクスケジューリング
- Authors: Xiang Cheng, Zhi Mao, Ying Wang, Wen Wu,
- Abstract要約: 動的無人航空機支援型コネクテッド自動運転車(CAV)のための新しい依存性を考慮したタスクスケジューリング手法を提案する。
平均タスク完了時間を最小化することを目的として,共同スケジューリング優先度とサブタスク割り当て最適化問題を定式化する。
本稿では,Synthetic DDQNをベースとしたSubtasks Schedulingという拡散型強化学習アルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 12.504232513881828
- License:
- Abstract: In this paper, we propose a novel dependency-aware task scheduling strategy for dynamic unmanned aerial vehicle-assisted connected autonomous vehicles (CAVs). Specifically, different computation tasks of CAVs consisting of multiple dependency subtasks are judiciously assigned to nearby CAVs or the base station for promptly completing tasks. Therefore, we formulate a joint scheduling priority and subtask assignment optimization problem with the objective of minimizing the average task completion time. The problem aims at improving the long-term system performance, which is reformulated as a Markov decision process. To solve the problem, we further propose a diffusion-based reinforcement learning algorithm, named Synthetic DDQN based Subtasks Scheduling, which can make adaptive task scheduling decision in real time. A diffusion model-based synthetic experience replay is integrated into the reinforcement learning framework, which can generate sufficient synthetic data in experience replay buffer, thereby significantly accelerating convergence and improving sample efficiency. Simulation results demonstrate the effectiveness of the proposed algorithm on reducing task completion time, comparing to benchmark schemes.
- Abstract(参考訳): 本稿では,動的無人航空機支援型コネクテッド・オートモービル(CAV)のための,依存性を考慮したタスクスケジューリング手法を提案する。
具体的には、複数の依存サブタスクからなるCAVの異なる計算タスクを、近隣のCAVまたは基地局に任意に割り当て、タスクを迅速に完了させる。
そこで我々は,タスク完了時間を最小化する目的で,共同スケジューリング優先度とサブタスク割り当て最適化問題を定式化する。
この問題は、マルコフ決定プロセスとして再編成される長期的なシステム性能を改善することを目的としている。
この問題を解決するために,Synthetic DDQN ベースの Subtasks Scheduling という拡散型強化学習アルゴリズムを提案する。
拡散モデルに基づく合成経験再生を強化学習フレームワークに統合し、経験再生バッファにおいて十分な合成データを生成可能とし、収束を著しく加速し、試料効率を向上させる。
シミュレーションの結果は,提案アルゴリズムがベンチマーク手法と比較してタスク完了時間を短縮する効果を示した。
関連論文リスト
- Unlearning as multi-task optimization: A normalized gradient difference approach with an adaptive learning rate [105.86576388991713]
正規化勾配差(NGDiff)アルゴリズムを導入し、目的間のトレードオフをよりよく制御できるようにする。
本研究では,TOFUおよびMUSEデータセットにおける最先端の未学習手法において,NGDiffの優れた性能を実証的に実証し,理論的解析を行った。
論文 参考訳(メタデータ) (2024-10-29T14:41:44Z) - TS-EoH: An Edge Server Task Scheduling Algorithm Based on Evolution of Heuristic [0.6827423171182154]
本稿では,EC理論と進化的アルゴリズムに基づく新しいタスクスケジューリング手法を提案する。
実験の結果,タスクスケジューリングアルゴリズムは従来の強化学習法よりも優れていた。
論文 参考訳(メタデータ) (2024-09-04T10:00:32Z) - DNN Partitioning, Task Offloading, and Resource Allocation in Dynamic Vehicular Networks: A Lyapunov-Guided Diffusion-Based Reinforcement Learning Approach [49.56404236394601]
本稿では,Vehicular Edge Computingにおける共同DNNパーティショニング,タスクオフロード,リソース割り当ての問題を定式化する。
我々の目標は、時間とともにシステムの安定性を保証しながら、DNNベースのタスク完了時間を最小化することである。
拡散モデルの革新的利用を取り入れたマルチエージェント拡散に基づく深層強化学習(MAD2RL)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-06-11T06:31:03Z) - Switchable Decision: Dynamic Neural Generation Networks [98.61113699324429]
本稿では,各データインスタンスのリソースを動的に割り当てることで,推論を高速化するスイッチブルな決定を提案する。
提案手法は, 同一の精度を維持しながら, 推論時のコスト低減に有効である。
論文 参考訳(メタデータ) (2024-05-07T17:44:54Z) - Distributed Allocation and Scheduling of Tasks with Cross-Schedule
Dependencies for Heterogeneous Multi-Robot Teams [2.294915015129229]
本稿では,異なるロボットのタスクが時間的・優先的な制約に強く結びついているミッションに対して,タスク割り当てとスケジューリングを行うアルゴリズムを提案する。
マルチロボットシステムによって維持される温室の実用ユースケースへの計画手順の適用。
論文 参考訳(メタデータ) (2021-09-07T13:44:28Z) - On-edge Multi-task Transfer Learning: Model and Practice with
Data-driven Task Allocation [20.20889051697198]
マルチタスク・トランスファー・ラーニング(MTL)におけるタスク・アロケーションは,NP完全Knapsack問題の変種であることを示す。
我々は,データ駆動型協調作業割当(DCTA)アプローチを提案し,高い計算効率でTATIMを解く。
我々のDCTAは処理時間の3.24倍を削減し、TATIMを解く際の最先端技術と比較して48.4%の省エネを図っている。
論文 参考訳(メタデータ) (2021-07-06T08:24:25Z) - Multi-task Over-the-Air Federated Learning: A Non-Orthogonal
Transmission Approach [52.85647632037537]
複数の学習タスクがエッジサーバ(ES)の協調の下でデータ収集および学習モデルのためのエッジデバイスを共有するマルチタスク・オーバーテア・フェデレーション・ラーニング(MOAFL)フレームワークを提案する。
収束解析と数値計算の両方の結果から,MOAFLフレームワークは学習性能を著しく低下させることなく,複数のタスクのアップリンク帯域幅の消費を大幅に削減できることが示された。
論文 参考訳(メタデータ) (2021-06-27T13:09:32Z) - Better than the Best: Gradient-based Improper Reinforcement Learning for
Network Scheduling [60.48359567964899]
パケット遅延を最小限に抑えるため,制約付き待ち行列ネットワークにおけるスケジューリングの問題を考える。
我々は、利用可能な原子ポリシーよりも優れたスケジューラを生成するポリシー勾配に基づく強化学習アルゴリズムを使用する。
論文 参考訳(メタデータ) (2021-05-01T10:18:34Z) - Deep Reinforcement Learning for Delay-Oriented IoT Task Scheduling in
Space-Air-Ground Integrated Network [24.022108191145527]
宇宙空間統合ネットワーク(SAGIN)における遅延指向モノのインターネット(IoT)サービスにおけるタスクスケジューリング問題について検討する。
検討されたシナリオでは、無人航空機(UAV)がIoTデバイスからコンピューティングタスクを収集し、オンラインのオフロード決定を行う。
我々の目的は、UAVエネルギー容量の制約により、タスクのオフロードと計算遅延を最小限に抑えるタスクスケジューリングポリシーを設計することである。
論文 参考訳(メタデータ) (2020-10-04T02:58:03Z) - Combining Deep Learning and Optimization for Security-Constrained
Optimal Power Flow [94.24763814458686]
セキュリティに制約のある最適電力フロー(SCOPF)は、電力システムの基本である。
SCOPF問題におけるAPRのモデル化は、複雑な大規模混合整数プログラムをもたらす。
本稿では,ディープラーニングとロバスト最適化を組み合わせた新しい手法を提案する。
論文 参考訳(メタデータ) (2020-07-14T12:38:21Z) - Submodular Meta-Learning [43.15332631500541]
将来的なタスクのパフォーマンス向上のために,メタラーニングフレームワークの個別版を導入する。
我々のアプローチは、事前データ、すなわち、以前に訪れたタスクを使用して、適切な初期ソリューションセットをトレーニングすることを目的としている。
我々のフレームワークは、性能損失を小さく抑えながら、新しいタスクを解く際に、計算の複雑さを著しく低減させることを示した。
論文 参考訳(メタデータ) (2020-07-11T21:02:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。