論文の概要: Hybrid Learning for Orchestrating Deep Learning Inference in Multi-user
Edge-cloud Networks
- arxiv url: http://arxiv.org/abs/2202.11098v1
- Date: Mon, 21 Feb 2022 21:50:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-24 14:28:30.963298
- Title: Hybrid Learning for Orchestrating Deep Learning Inference in Multi-user
Edge-cloud Networks
- Title(参考訳): ハイブリッド学習によるマルチユーザエッジクラウドネットワークにおけるディープラーニング推論のオーケストレーション
- Authors: Sina Shahhosseini, Tianyi Hu, Dongjoo Seo, Anil Kanduri, Bryan
Donyanavard, Amir M.Rahmani, Nikil Dutt
- Abstract要約: ディープラーニングのためのコラボレーション型のエッジクラウドコンピューティングは、さまざまなパフォーマンスと効率を提供する。
ディープラーニング推論オーケストレーション戦略では、最適なオーケストレーションポリシを見つけるために強化学習を採用している。
我々は、最先端のRLベースの推論オーケストレーションを実験的に比較することで、HL戦略の有効性を実証する。
- 参考スコア(独自算出の注目度): 3.7630209350186807
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Deep-learning-based intelligent services have become prevalent in
cyber-physical applications including smart cities and health-care.
Collaborative end-edge-cloud computing for deep learning provides a range of
performance and efficiency that can address application requirements through
computation offloading. The decision to offload computation is a
communication-computation co-optimization problem that varies with both system
parameters (e.g., network condition) and workload characteristics (e.g.,
inputs). Identifying optimal orchestration considering the cross-layer
opportunities and requirements in the face of varying system dynamics is a
challenging multi-dimensional problem. While Reinforcement Learning (RL)
approaches have been proposed earlier, they suffer from a large number of
trial-and-errors during the learning process resulting in excessive time and
resource consumption. We present a Hybrid Learning orchestration framework that
reduces the number of interactions with the system environment by combining
model-based and model-free reinforcement learning. Our Deep Learning inference
orchestration strategy employs reinforcement learning to find the optimal
orchestration policy. Furthermore, we deploy Hybrid Learning (HL) to accelerate
the RL learning process and reduce the number of direct samplings. We
demonstrate efficacy of our HL strategy through experimental comparison with
state-of-the-art RL-based inference orchestration, demonstrating that our HL
strategy accelerates the learning process by up to 166.6x.
- Abstract(参考訳): ディープラーニングベースのインテリジェントサービスは、スマートシティやヘルスケアなど、サイバー物理アプリケーションで普及している。
ディープラーニングのためのコラボレーション型のエッジクラウドコンピューティングは、計算のオフロードを通じてアプリケーション要求に対処できる、さまざまなパフォーマンスと効率を提供する。
オフロード計算の決定は、システムパラメータ(ネットワーク条件など)とワークロード特性(入力など)の両方によって異なる、通信計算の共最適化問題である。
様々なシステムダイナミクスに直面した層間機会と要件を考慮した最適オーケストレーションの同定は、困難な多次元問題である。
強化学習(RL)アプローチは以前から提案されていたが,学習プロセス中に大量の試行錯誤が発生し,時間と資源消費が過剰になる。
本稿では,モデルベースとモデルフリー強化学習を組み合わせることで,システム環境とのインタラクション数を削減できるハイブリッド学習オーケストレーションフレームワークを提案する。
当社のディープラーニング推論オーケストレーション戦略では、強化学習を使用して、最適なオーケストレーションポリシを見つけます。
さらに,rl学習プロセスを高速化し,直接サンプリング回数を削減するために,ハイブリッド学習(hl)を展開する。
我々は、最先端のRLベースの推論オーケストレーションを実験的に比較し、HL戦略が学習プロセスを最大166.6倍加速することを示す。
関連論文リスト
- Offline reinforcement learning for job-shop scheduling problems [1.3927943269211593]
本稿では,複雑な制約を伴う最適化問題に対して,新しいオフラインRL法を提案する。
我々のアプローチは、エッジ属性のアクションを符号化し、専門家ソリューションの模倣と期待される報酬のバランスをとる。
本手法がジョブショップスケジューリングおよびフレキシブルジョブショップスケジューリングベンチマークに与える影響を実証する。
論文 参考訳(メタデータ) (2024-10-21T07:33:42Z) - RLIF: Interactive Imitation Learning as Reinforcement Learning [56.997263135104504]
我々は,対話型模倣学習と類似するが,さらに実践的な仮定の下で,非政治強化学習によってパフォーマンスが向上できることを実証する。
提案手法は,ユーザ介入信号を用いた強化学習を報奨として利用する。
このことは、インタラクティブな模倣学習において介入する専門家がほぼ最適であるべきだという仮定を緩和し、アルゴリズムが潜在的に最適でない人間の専門家よりも改善される行動を学ぶことを可能にする。
論文 参考訳(メタデータ) (2023-11-21T21:05:21Z) - Online Network Source Optimization with Graph-Kernel MAB [62.6067511147939]
大規模ネットワークにおける最適なソース配置をオンラインで学習するためのグラフカーネルマルチアームバンディットアルゴリズムであるGrab-UCBを提案する。
適応グラフ辞書モデルを用いて,ネットワークプロセスを記述する。
我々は、ネットワークパラメータに依存する性能保証を導出し、シーケンシャルな意思決定戦略の学習曲線にさらに影響を及ぼす。
論文 参考訳(メタデータ) (2023-07-07T15:03:42Z) - MARLIN: Soft Actor-Critic based Reinforcement Learning for Congestion
Control in Real Networks [63.24965775030673]
そこで本研究では,汎用的な渋滞制御(CC)アルゴリズムを設計するための新しい強化学習(RL)手法を提案する。
我々の解であるMARLINは、Soft Actor-Criticアルゴリズムを用いてエントロピーとリターンの両方を最大化する。
我々は,MARLINを実ネットワーク上で訓練し,実ミスマッチを克服した。
論文 参考訳(メタデータ) (2023-02-02T18:27:20Z) - Predictive GAN-powered Multi-Objective Optimization for Hybrid Federated
Split Learning [56.125720497163684]
無線ネットワークにおけるハイブリッド・フェデレーション・スプリット・ラーニング・フレームワークを提案する。
ラベル共有のないモデル分割のための並列計算方式を設計し,提案方式が収束速度に与える影響を理論的に解析する。
論文 参考訳(メタデータ) (2022-09-02T10:29:56Z) - Online Learning for Orchestration of Inference in Multi-User
End-Edge-Cloud Networks [3.6076391721440633]
ディープラーニングのためのコラボレーション型のエッジクラウドコンピューティングは、さまざまなパフォーマンスと効率を提供する。
本稿では、最適オフロードポリシーを学習する強化学習に基づく計算オフロードソリューションを提案する。
我々のソリューションは、平均応答時間において、0.9%未満の精度で、最先端技術と比較して35%のスピードアップを提供する。
論文 参考訳(メタデータ) (2022-02-21T21:41:29Z) - Hyperparameter Tuning for Deep Reinforcement Learning Applications [0.3553493344868413]
本稿では,分散可変長遺伝的アルゴリズムを用いて,様々なRLアプリケーションに対してハイパーパラメータをチューニングする手法を提案する。
以上の結果から, より世代を要し, トレーニングエピソードが少なく, 計算コストも安価で, デプロイの堅牢性も高い最適解が得られた。
論文 参考訳(メタデータ) (2022-01-26T20:43:13Z) - A Heuristically Assisted Deep Reinforcement Learning Approach for
Network Slice Placement [0.7885276250519428]
本稿では,Deep Reinforcement Learning(DRL)に基づくハイブリッド配置ソリューションと,Power of Two Choices原則に基づく専用最適化を提案する。
提案したHuristically-Assisted DRL (HA-DRL) は,他の最先端手法と比較して学習プロセスの高速化と資源利用の促進を可能にする。
論文 参考訳(メタデータ) (2021-05-14T10:04:17Z) - Deep Multi-Task Learning for Cooperative NOMA: System Design and
Principles [52.79089414630366]
我々は,近年のディープラーニング(DL)の進歩を反映した,新しいディープ・コラボレーティブなNOMAスキームを開発する。
我々は,システム全体を包括的に最適化できるように,新しいハイブリッドカスケードディープニューラルネットワーク(DNN)アーキテクチャを開発した。
論文 参考訳(メタデータ) (2020-07-27T12:38:37Z) - Neuromodulated Neural Architectures with Local Error Signals for
Memory-Constrained Online Continual Learning [4.2903672492917755]
我々は,局所学習とニューロ変調を取り入れた,生物学的にインスパイアされた軽量ニューラルネットワークアーキテクチャを開発した。
一つの課題と連続的な学習環境の両方にアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2020-07-16T07:41:23Z) - Subset Sampling For Progressive Neural Network Learning [106.12874293597754]
プログレッシブニューラルネットワーク学習は、ネットワークのトポロジを漸進的に構築し、トレーニングデータに基づいてパラメータを最適化するアルゴリズムのクラスである。
段階的なトレーニングステップ毎にトレーニングデータのサブセットを活用することで,このプロセスの高速化を提案する。
オブジェクト,シーン,顔の認識における実験結果から,提案手法が最適化手順を大幅に高速化することを示す。
論文 参考訳(メタデータ) (2020-02-17T18:57:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。