論文の概要: Fractional Deep Reinforcement Learning for Age-Minimal Mobile Edge
Computing
- arxiv url: http://arxiv.org/abs/2312.10418v2
- Date: Tue, 19 Dec 2023 13:11:49 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-20 12:34:21.206676
- Title: Fractional Deep Reinforcement Learning for Age-Minimal Mobile Edge
Computing
- Title(参考訳): 年代最小モバイルエッジコンピューティングのためのフラクショナルディープ強化学習
- Authors: Lyudong Jin, Ming Tang, Meng Zhang, Hao Wang
- Abstract要約: 本研究は,AOI( Age-of-Information)によって測定された計算集約更新の時系列に焦点をあてる。
我々は,AoIのタスク更新とオフロードポリシを分断形式で共同で最適化する方法について検討する。
実験の結果,提案アルゴリズムは,いくつかの非フラクタルベンチマークと比較して平均AoIを57.6%削減できることがわかった。
- 参考スコア(独自算出の注目度): 11.403989519949173
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Mobile edge computing (MEC) is a promising paradigm for real-time
applications with intensive computational needs (e.g., autonomous driving), as
it can reduce the processing delay. In this work, we focus on the timeliness of
computational-intensive updates, measured by Age-ofInformation (AoI), and study
how to jointly optimize the task updating and offloading policies for AoI with
fractional form. Specifically, we consider edge load dynamics and formulate a
task scheduling problem to minimize the expected time-average AoI. The
uncertain edge load dynamics, the nature of the fractional objective, and
hybrid continuous-discrete action space (due to the joint optimization) make
this problem challenging and existing approaches not directly applicable. To
this end, we propose a fractional reinforcement learning(RL) framework and
prove its convergence. We further design a model-free fractional deep RL (DRL)
algorithm, where each device makes scheduling decisions with the hybrid action
space without knowing the system dynamics and decisions of other devices.
Experimental results show that our proposed algorithms reduce the average AoI
by up to 57.6% compared with several non-fractional benchmarks.
- Abstract(参考訳): モバイルエッジコンピューティング(MEC)は、処理遅延を低減できるため、集中的な計算を必要とするリアルタイムアプリケーション(例えば自律運転)に期待できるパラダイムである。
本研究では,AOI(Age-ofInformation)によって測定された計算集約更新のタイムラインに着目し,AoIのタスク更新とオフロードポリシを分断形式で協調的に最適化する方法を検討する。
具体的には,エッジ負荷のダイナミクスを考慮し,タスクスケジューリング問題を定式化し,期待時間平均aoiを最小化する。
不確実なエッジ負荷ダイナミクス、分数目的の性質、および(共同最適化による)ハイブリッド連続離散アクション空間はこの問題を難しくし、既存のアプローチは直接適用できない。
そこで本研究では,分数強化学習(rl)フレームワークを提案し,その収束性を証明する。
我々はさらに,各デバイスがシステムダイナミクスや他のデバイスの意思決定を知らずに,ハイブリッド動作空間でスケジューリング決定を行うモデルフリー分数分数型ディープrl(drl)アルゴリズムも設計する。
実験の結果,提案手法は非フラクショナルベンチマークと比較して平均aoiを57.6%削減できることがわかった。
関連論文リスト
- Split Federated Learning Over Heterogeneous Edge Devices: Algorithm and Optimization [7.013344179232109]
Split Learning(SL)は、リソース制約のあるデバイスが生データを共有せずにモデルをトレーニングできるようにする、有望なコラボレーティブ機械学習アプローチである。
現在のSLアルゴリズムは、トレーニング効率の限界に直面し、長時間のレイテンシに悩まされている。
本稿では、リソース制約のあるクライアントが、パーソナライズされたクライアントサイドモデルを並列にトレーニングできる、異種分散フェデレーションラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2024-11-21T07:46:01Z) - Asynchronous Fractional Multi-Agent Deep Reinforcement Learning for Age-Minimal Mobile Edge Computing [14.260646140460187]
計算集約的な更新のタイムラインを調査し、AoIを最小化するためにタスク更新とオフロードポリシーを共同で最適化する。
具体的には、エッジ負荷のダイナミクスを考慮し、期待時間平均AoIを最小化するためにタスクスケジューリング問題を定式化する。
提案アルゴリズムは,実験における最良基準アルゴリズムと比較して平均AoIを最大52.6%削減する。
論文 参考訳(メタデータ) (2024-09-25T11:33:32Z) - When to Sense and Control? A Time-adaptive Approach for Continuous-Time RL [37.58940726230092]
離散時間マルコフ決定過程(MDP)の最適化における強化学習(RL)の特長
この課題に対処するRLフレームワークであるTime-Adaptive Control & Sensing(TaCoS)を形式化する。
我々は、TaCoSで訓練された最先端のRLアルゴリズムが、その離散時間に対する相互作用量を劇的に削減できることを実証した。
論文 参考訳(メタデータ) (2024-06-03T09:57:18Z) - Switchable Decision: Dynamic Neural Generation Networks [98.61113699324429]
本稿では,各データインスタンスのリソースを動的に割り当てることで,推論を高速化するスイッチブルな決定を提案する。
提案手法は, 同一の精度を維持しながら, 推論時のコスト低減に有効である。
論文 参考訳(メタデータ) (2024-05-07T17:44:54Z) - Offloading and Quality Control for AI Generated Content Services in 6G Mobile Edge Computing Networks [18.723955271182007]
本稿では, 逆拡散段階における拡散モデルのオフロード決定, 計算時間, 拡散ステップに対する共同最適化アルゴリズムを提案する。
実験結果から,提案アルゴリズムはベースラインよりも優れた継手最適化性能が得られることが示された。
論文 参考訳(メタデータ) (2023-12-11T08:36:27Z) - Age-Based Scheduling for Mobile Edge Computing: A Deep Reinforcement
Learning Approach [58.911515417156174]
我々は情報時代(AoI)の新たな定義を提案し、再定義されたAoIに基づいて、MECシステムにおけるオンラインAoI問題を定式化する。
本稿では,システム力学の部分的知識を活用するために,PDS(Post-Decision State)を導入する。
また、PSDと深いRLを組み合わせることで、アルゴリズムの適用性、スケーラビリティ、堅牢性をさらに向上します。
論文 参考訳(メタデータ) (2023-12-01T01:30:49Z) - A Multi-Head Ensemble Multi-Task Learning Approach for Dynamical
Computation Offloading [62.34538208323411]
共有バックボーンと複数の予測ヘッド(PH)を組み合わせたマルチヘッドマルチタスク学習(MEMTL)手法を提案する。
MEMTLは、追加のトレーニングデータを必要とせず、推測精度と平均平方誤差の両方でベンチマーク手法より優れている。
論文 参考訳(メタデータ) (2023-09-02T11:01:16Z) - Dynamic Scheduling for Federated Edge Learning with Streaming Data [56.91063444859008]
我々は,長期的エネルギー制約のある分散エッジデバイスにおいて,トレーニングデータを時間とともにランダムに生成するフェデレーションエッジ学習(FEEL)システムを検討する。
限られた通信リソースとレイテンシ要件のため、各イテレーションでローカルトレーニングプロセスに参加するのはデバイスのサブセットのみである。
論文 参考訳(メタデータ) (2023-05-02T07:41:16Z) - MCDS: AI Augmented Workflow Scheduling in Mobile Edge Cloud Computing
Systems [12.215537834860699]
近年,エッジコンピューティングプラットフォームの低応答時間を利用してアプリケーション品質・オブ・サービス(QoS)を最適化するスケジューリング手法が提案されている。
本稿では,Deep Surrogate Models を用いたモンテカルロ学習を用いて,モバイルエッジクラウドコンピューティングシステムにおけるワークフローアプリケーションを効率的にスケジューリングする手法を提案する。
論文 参考訳(メタデータ) (2021-12-14T10:00:01Z) - Edge Federated Learning Via Unit-Modulus Over-The-Air Computation
(Extended Version) [64.76619508293966]
本稿では,効率の良いエッジフェデレーション学習を実現するために,UM-AirCompフレームワークを提案する。
ローカルモデルパラメータを同時にアップロードし、アナログビームフォーミングを通じてグローバルモデルパラメータを更新する。
車両間自動運転シミュレーションプラットフォームにおけるUM-AirCompの実装を実演する。
論文 参考訳(メタデータ) (2021-01-28T15:10:22Z) - Combining Deep Learning and Optimization for Security-Constrained
Optimal Power Flow [94.24763814458686]
セキュリティに制約のある最適電力フロー(SCOPF)は、電力システムの基本である。
SCOPF問題におけるAPRのモデル化は、複雑な大規模混合整数プログラムをもたらす。
本稿では,ディープラーニングとロバスト最適化を組み合わせた新しい手法を提案する。
論文 参考訳(メタデータ) (2020-07-14T12:38:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。