論文の概要: Fast Adaptive Task Offloading in Edge Computing based on Meta
Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2008.02033v5
- Date: Sat, 24 Oct 2020 10:04:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-02 18:58:32.852168
- Title: Fast Adaptive Task Offloading in Edge Computing based on Meta
Reinforcement Learning
- Title(参考訳): メタ強化学習に基づくエッジコンピューティングにおける高速適応タスクオフロード
- Authors: Jin Wang, Jia Hu, Geyong Min, Albert Y. Zomaya, Nektarios Georgalas
- Abstract要約: マルチアクセスエッジコンピューティング(MEC)は、クラウドサービスをネットワークエッジに拡張して、ネットワークトラフィックとサービスレイテンシを低減することを目的としている。
MECの基本的な問題は、モバイルアプリケーションの異種タスクをユーザ機器(UE)からMECホストに効率的にオフロードする方法である。
本稿では,メタ強化学習に基づくタスクオフロード手法を提案する。
- 参考スコア(独自算出の注目度): 44.81038225683222
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-access edge computing (MEC) aims to extend cloud service to the network
edge to reduce network traffic and service latency. A fundamental problem in
MEC is how to efficiently offload heterogeneous tasks of mobile applications
from user equipment (UE) to MEC hosts. Recently, many deep reinforcement
learning (DRL) based methods have been proposed to learn offloading policies
through interacting with the MEC environment that consists of UE, wireless
channels, and MEC hosts. However, these methods have weak adaptability to new
environments because they have low sample efficiency and need full retraining
to learn updated policies for new environments. To overcome this weakness, we
propose a task offloading method based on meta reinforcement learning, which
can adapt fast to new environments with a small number of gradient updates and
samples. We model mobile applications as Directed Acyclic Graphs (DAGs) and the
offloading policy by a custom sequence-to-sequence (seq2seq) neural network. To
efficiently train the seq2seq network, we propose a method that synergizes the
first order approximation and clipped surrogate objective. The experimental
results demonstrate that this new offloading method can reduce the latency by
up to 25% compared to three baselines while being able to adapt fast to new
environments.
- Abstract(参考訳): マルチアクセスエッジコンピューティング(MEC)は、クラウドサービスをネットワークエッジに拡張して、ネットワークトラフィックとサービスレイテンシを低減することを目的としている。
MECの基本的な問題は、モバイルアプリケーションの異種タスクをユーザ機器(UE)からMECホストに効率的にオフロードする方法である。
近年, UE, 無線チャネル, MECホストで構成されるMEC環境と対話することで, オフロードポリシを学習するためのDRLに基づく多くの手法が提案されている。
しかし、これらの手法はサンプル効率が低く、新しい環境のポリシーを学習するために完全な再訓練が必要であるため、新しい環境への適応性が弱い。
この弱点を克服するために,メタ強化学習に基づくタスクオフロード手法を提案する。
モバイルアプリケーションをDAG(Directed Acyclic Graphs)としてモデル化し、カスタムシーケンス対シーケンス(seq2seq)ニューラルネットワークによるオフロードポリシをモデル化する。
seq2seqネットワークを効率的にトレーニングするために,第1次近似とクリップ型サロゲート目標を併用する手法を提案する。
実験の結果,新しいオフロード方式は,3つのベースラインと比較して最大25%の遅延を低減し,新しい環境に迅速に適応できることがわかった。
関連論文リスト
- A Multi-Head Ensemble Multi-Task Learning Approach for Dynamical
Computation Offloading [62.34538208323411]
共有バックボーンと複数の予測ヘッド(PH)を組み合わせたマルチヘッドマルチタスク学習(MEMTL)手法を提案する。
MEMTLは、追加のトレーニングデータを必要とせず、推測精度と平均平方誤差の両方でベンチマーク手法より優れている。
論文 参考訳(メタデータ) (2023-09-02T11:01:16Z) - Resource Allocation in Multicore Elastic Optical Networks: A Deep
Reinforcement Learning Approach [47.187609203210705]
新しい環境はOpenAIのGymと互換性がある。
ネットワーク状態と物理層関連の側面を考慮してエージェントアクションを処理する。
ベストパフォーマンス剤は、ブロッキング確率の4倍の低下を達成する。
論文 参考訳(メタデータ) (2022-07-05T14:24:21Z) - Adapting to Dynamic LEO-B5G Systems: Meta-Critic Learning Based
Efficient Resource Scheduling [38.733584547351796]
オーバーロードされたLEO地上システムにおける2つの実用的課題に対処する。
最初の課題は、膨大な数の接続されたユーザに対して、リソースを効率的にスケジュールする方法です。
第2の課題は、動的無線環境への適応において、アルゴリズムによるソリューションをよりレジリエントにする方法だ。
論文 参考訳(メタデータ) (2021-10-13T15:21:38Z) - Learning to Continuously Optimize Wireless Resource in a Dynamic
Environment: A Bilevel Optimization Perspective [52.497514255040514]
この研究は、データ駆動メソッドが動的環境でリソース割り当て戦略を継続的に学び、最適化することを可能にする新しいアプローチを開発しています。
学習モデルが新たなエピソードに段階的に適応できるように、連続学習の概念を無線システム設計に組み込むことを提案する。
我々の設計は、異なるデータサンプルにまたがる公平性を保証する、新しい二段階最適化定式化に基づいている。
論文 参考訳(メタデータ) (2021-05-03T07:23:39Z) - Efficient Feature Transformations for Discriminative and Generative
Continual Learning [98.10425163678082]
継続的学習のための簡易タスク特化機能マップ変換戦略を提案する。
これらは新しいタスクを学習するための強力な柔軟性を提供し、ベースアーキテクチャに最小パラメータを追加することで実現される。
本手法の有効性と効率を,判別(cifar-100およびimagenet-1k)および生成的タスクの一連の実験を用いて実証する。
論文 参考訳(メタデータ) (2021-03-25T01:48:14Z) - Online Service Migration in Edge Computing with Incomplete Information:
A Deep Recurrent Actor-Critic Method [18.891775769665102]
マルチアクセスエッジコンピューティング(MEC)は、クラウドコンピューティングをネットワークエッジに拡張する新興コンピューティングパラダイムである。
サービス移行には,qos(quality-of-service)を維持するためのユーザサービスの移行場所を決定する必要がある
本稿では,ユーザ中心で効果的なオンライン移行決定が可能な,新たな学習駆動型手法である深層反復型アクタクリティックベースサービスマイグレーション(dracm)を提案する。
論文 参考訳(メタデータ) (2020-12-16T00:16:24Z) - Learning to Continuously Optimize Wireless Resource In Episodically
Dynamic Environment [55.91291559442884]
この研究は、データ駆動型手法が動的環境で継続的に学習し、最適化できる方法論を開発する。
本稿では,無線システム学習のモデリングプロセスに連続学習の概念を構築することを提案する。
我々の設計は、異なるデータサンプル間で「一定の公正性を保証する」新しいmin-maxの定式化に基づいている。
論文 参考訳(メタデータ) (2020-11-16T08:24:34Z) - Deep Reinforcement Learning for Adaptive Network Slicing in 5G for
Intelligent Vehicular Systems and Smart Cities [19.723551683930776]
エッジコントローラ(EC)と協調したフォグノードのクラスタ(FN)に基づくネットワークスライシングモデルを開発する。
クラスタ内の各サービスリクエストに対して、ECは、どのFNがタスクを実行し、エッジでローカルにリクエストをサーブするか、あるいはタスクを拒否し、それをクラウドに参照するかを決定する。
本稿では,最適スライシングポリシーを適応的に学習する深層強化学習(DRL)ソリューションを提案する。
論文 参考訳(メタデータ) (2020-10-19T23:30:08Z) - Meta Reinforcement Learning with Autonomous Inference of Subtask
Dependencies [57.27944046925876]
本稿では,タスクがサブタスクグラフによって特徴づけられるような,新しい数発のRL問題を提案し,対処する。
メタ政治を直接学習する代わりに、Subtask Graph Inferenceを使ったメタラーナーを開発した。
実験の結果,2つのグリッドワールド領域とStarCraft II環境において,提案手法が潜在タスクパラメータを正確に推定できることが確認された。
論文 参考訳(メタデータ) (2020-01-01T17:34:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。