論文の概要: Learning Resource Scheduling with High Priority Users using Deep
Deterministic Policy Gradients
- arxiv url: http://arxiv.org/abs/2304.09488v1
- Date: Wed, 19 Apr 2023 08:18:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-20 15:08:33.794888
- Title: Learning Resource Scheduling with High Priority Users using Deep
Deterministic Policy Gradients
- Title(参考訳): Deep Deterministic Policy Gradientsを用いた高優先度ユーザによるリソーススケジューリングの学習
- Authors: Steffen Gracla, Edgar Beck, Carsten Bockelmann, Armin Dekorsy
- Abstract要約: 本稿では,通信資源スケジューリングアルゴリズムの学習にDeep Deterministic Policy Gradient(ddpg)法を適用した。
一般的なDeep-Q-Networkメソッドとは異なり、ddpgは連続的に評価された出力を生成することができる。
- 参考スコア(独自算出の注目度): 7.570246812206769
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Advances in mobile communication capabilities open the door for closer
integration of pre-hospital and in-hospital care processes. For example,
medical specialists can be enabled to guide on-site paramedics and can, in
turn, be supplied with live vitals or visuals. Consolidating such
performance-critical applications with the highly complex workings of mobile
communications requires solutions both reliable and efficient, yet easy to
integrate with existing systems. This paper explores the application of Deep
Deterministic Policy Gradient~(\ddpg) methods for learning a communications
resource scheduling algorithm with special regards to priority users. Unlike
the popular Deep-Q-Network methods, the \ddpg is able to produce
continuous-valued output. With light post-processing, the resulting scheduler
is able to achieve high performance on a flexible sum-utility goal.
- Abstract(参考訳): モバイルコミュニケーション能力の進歩は、病院前および病院内ケアプロセスの緊密な統合の扉を開く。
例えば、医療専門家は現場の救急隊員をガイドすることができ、その代わりに生のバイタルや視覚を提供することができる。
このようなパフォーマンスクリティカルなアプリケーションと非常に複雑なモバイル通信の動作を統合するには、信頼性と効率の両立が必要だが、既存のシステムとの統合は容易である。
本稿では,通信資源スケジューリングアルゴリズムを優先的に学習するためのDeep Deterministic Policy Gradient~(\ddpg)手法の適用について検討する。
一般的なディープqネットワーク法とは異なり、 \ddpgは連続値出力を生成することができる。
軽量な後処理により、結果のスケジューラはフレキシブルな和ユーティリティゴールで高いパフォーマンスを達成することができる。
関連論文リスト
- Large Language Models for Power Scheduling: A User-Centric Approach [6.335540414370735]
本稿では、任意のユーザの音声要求(VRQ)をリソース割り当てベクトルに変換することで、リソーススケジューリング問題に対する新しいアーキテクチャを提案する。
具体的には、要求を最適化問題(OP)に変換するためのLLM意図認識エージェント、LLM OPパラメータ識別エージェント、OP解決エージェントを設計する。
論文 参考訳(メタデータ) (2024-06-29T15:47:28Z) - Pruning the Way to Reliable Policies: A Multi-Objective Deep Q-Learning Approach to Critical Care [46.2482873419289]
我々は、より信頼性の高いクリティカルケアポリシーを得るための深いQ-ラーニングアプローチを導入する。
本手法を,集中治療室のシミュレーション環境と実際の健康記録を用いて,オフライン・オフ・セッティングで評価した。
論文 参考訳(メタデータ) (2023-06-13T18:02:57Z) - Dynamic Scheduling for Federated Edge Learning with Streaming Data [56.91063444859008]
我々は,長期的エネルギー制約のある分散エッジデバイスにおいて,トレーニングデータを時間とともにランダムに生成するフェデレーションエッジ学習(FEEL)システムを検討する。
限られた通信リソースとレイテンシ要件のため、各イテレーションでローカルトレーニングプロセスに参加するのはデバイスのサブセットのみである。
論文 参考訳(メタデータ) (2023-05-02T07:41:16Z) - Computation Offloading and Resource Allocation in F-RANs: A Federated
Deep Reinforcement Learning Approach [67.06539298956854]
フォグ無線アクセスネットワーク(フォグ無線アクセスネットワーク、F-RAN)は、ユーザのモバイルデバイス(MD)が計算タスクを近くのフォグアクセスポイント(F-AP)にオフロードできる有望な技術である。
論文 参考訳(メタデータ) (2022-06-13T02:19:20Z) - Planning to Practice: Efficient Online Fine-Tuning by Composing Goals in
Latent Space [76.46113138484947]
汎用ロボットは、現実世界の非構造環境において困難なタスクを完了するために、多様な行動レパートリーを必要とする。
この問題に対処するため、目標条件強化学習は、コマンド上の幅広いタスクの目標に到達可能なポリシーを取得することを目的としている。
本研究では,長期的課題に対する目標条件付き政策を実践的に訓練する手法であるPlanning to Practiceを提案する。
論文 参考訳(メタデータ) (2022-05-17T06:58:17Z) - Learning Robust Scheduling with Search and Attention [6.217548079545464]
物理層リソースをチャネル品質、バッファサイズ、要求および制約に基づいてユーザに割り当てることは、無線リソースの管理における中心的な最適化問題の1つである。
MU-MIMOスケジューリングでは、スケジューラが複数のユーザを同じ時間周波数の物理リソースに割り当てることができる。
本稿では,MU-MIMOスケジューリング問題を木構造問題として扱うとともに,AlphaGo Zeroの最近の成功から借用して,最高の実行ソリューションを探す可能性について検討する。
論文 参考訳(メタデータ) (2021-11-15T20:46:26Z) - Deep Reinforcement Model Selection for Communications Resource
Allocation in On-Site Medical Care [8.564319625930892]
本稿では、スケジューラが接続されたユーザ間で混合性能指標のバランスをとる必要があるリソース割り当てシナリオについて検討する。
本稿では,異なるモデルベーススケジューリングアルゴリズムを適応的に切り替えるスケジューラを提案する。
結果として得られるアンサンブルスケジューラは、その構成アルゴリズムを組み合わせて、総コスト関数を最大化することができる。
論文 参考訳(メタデータ) (2021-11-12T12:04:53Z) - C-Planning: An Automatic Curriculum for Learning Goal-Reaching Tasks [133.40619754674066]
ゴール条件強化学習は、ナビゲーションや操作を含む幅広い領域のタスクを解決できる。
本研究では,学習時間における探索を用いて,中間状態を自動生成する遠隔目標獲得タスクを提案する。
E-stepはグラフ検索を用いて最適な経路点列を計画することに対応し、M-stepはそれらの経路点に到達するための目標条件付きポリシーを学習することを目的としている。
論文 参考訳(メタデータ) (2021-10-22T22:05:31Z) - Accelerating Federated Edge Learning via Optimized Probabilistic Device
Scheduling [57.271494741212166]
本稿では,通信時間最小化問題を定式化し,解決する。
最適化されたポリシーは、トレーニングプロセスが進むにつれて、残りの通信ラウンドの抑制から、ラウンドごとのレイテンシの低減へと、徐々に優先順位を転換している。
提案手法の有効性は,自律運転における協調的3次元目標検出のユースケースを通じて実証される。
論文 参考訳(メタデータ) (2021-07-24T11:39:17Z) - Better than the Best: Gradient-based Improper Reinforcement Learning for
Network Scheduling [60.48359567964899]
パケット遅延を最小限に抑えるため,制約付き待ち行列ネットワークにおけるスケジューリングの問題を考える。
我々は、利用可能な原子ポリシーよりも優れたスケジューラを生成するポリシー勾配に基づく強化学習アルゴリズムを使用する。
論文 参考訳(メタデータ) (2021-05-01T10:18:34Z) - Modular approach to data preprocessing in ALOHA and application to a
smart industry use case [0.0]
データ前処理と変換パイプラインをサポートするために、ALOHAツールフローに統合されたモジュラーアプローチに対処する。
提案手法の有効性を示すために,キーワードスポッティングのユースケースに関する実験結果を示す。
論文 参考訳(メタデータ) (2021-02-02T06:48:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。