論文の概要: Efficient Learning-based Scheduling for Information Freshness in
Wireless Networks
- arxiv url: http://arxiv.org/abs/2101.00257v1
- Date: Fri, 1 Jan 2021 15:59:59 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-17 11:12:00.456669
- Title: Efficient Learning-based Scheduling for Information Freshness in
Wireless Networks
- Title(参考訳): 無線ネットワークにおける情報鮮度のための効率的な学習ベーススケジューリング
- Authors: Bin Li
- Abstract要約: 無線ネットワークを介して複数のセンシングソースから中央コントローラにパケットをスケジューリングする問題を検討する。
我々は,AoIメトリクスとアッパー信頼境界推定を組み合わせたパラメータ化最大重値型スケジューリングポリシーを開発した。
提案アルゴリズムは,実行平均総年齢を最大$O(N2eta)$とすることを示す。
- 参考スコア(独自算出の注目度): 5.1394452241209185
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Motivated by the recent trend of integrating artificial intelligence into the
Internet-of-Things (IoT), we consider the problem of scheduling packets from
multiple sensing sources to a central controller over a wireless network. Here,
packets from different sensing sources have different values or degrees of
importance to the central controller for intelligent decision making. In such a
setup, it is critical to provide timely and valuable information for the
central controller. In this paper, we develop a parameterized maximum-weight
type scheduling policy that combines both the AoI metrics and Upper Confidence
Bound (UCB) estimates in its weight measure with parameter $\eta$. Here, UCB
estimates balance the tradeoff between exploration and exploitation in learning
and are critical for yielding a small cumulative regret. We show that our
proposed algorithm yields the running average total age at most by
$O(N^2\eta)$. We also prove that our proposed algorithm achieves the cumulative
regret over time horizon $T$ at most by $O(NT/\eta+\sqrt{NT\log T})$. This
reveals a tradeoff between the cumulative regret and the running average total
age: when increasing $\eta$, the cumulative regret becomes smaller, but is at
the cost of increasing running average total age. Simulation results are
provided to evaluate the efficiency of our proposed algorithm.
- Abstract(参考訳): 人工知能をIoT(Internet-of-Things)に統合する最近のトレンドに触発されて、複数のセンサソースから無線ネットワーク上の中央コントローラにパケットをスケジューリングする問題を考える。
ここで、異なるセンシングソースからのパケットは、インテリジェントな意思決定のための中央コントローラの値や重要性が異なる。
このような設定では、中央のコントローラにタイムリーで価値のある情報を提供することが重要です。
本稿では,AoI 測定値とアッパー信頼境界(UCB)推定値をパラメータ $\eta$ と組み合わせたパラメータ化最大重み型スケジューリングポリシーを開発する。
ここでは、UCBの推定は、学習における探索と搾取の間のトレードオフをバランスさせ、最小限の累積的後悔をもたらすために重要である。
提案アルゴリズムは,最大実行平均総年齢が$O(N^2\eta)$であることを示す。
また,提案アルゴリズムは時間的地平線上での累積後悔を$O(NT/\eta+\sqrt{NT\log T})$で証明する。
これは累積的後悔とランニング平均総年齢とのトレードオフを示している: $\eta$ を増加させると累積的後悔は小さくなるが、平均総年齢を増加させるコストになる。
提案アルゴリズムの効率を評価するためのシミュレーション結果を提供する。
関連論文リスト
- Learning RL-Policies for Joint Beamforming Without Exploration: A Batch
Constrained Off-Policy Approach [1.0080317855851213]
本稿では,ネットワークにおけるパラメータキャンセル最適化の問題点について考察する。
探索と学習のために実世界でアルゴリズムをデプロイすることは、探索せずにデータによって達成できることを示す。
論文 参考訳(メタデータ) (2023-10-12T18:36:36Z) - A Fast Algorithm for Moderating Critical Nodes via Edge Removal [19.130541561303293]
対象ノードの情報集中度を最小限に抑えるために,ネットワークから$k$エッジを除去する問題について検討する。
ランダムウォークに基づくシュア補数近似や高速和推定などの新しい手法を用いて、3つの近似グリードアルゴリズムを提案する。
理論的解析を補完するため、100万以上のノードを持つ合成および実ネットワークに関する包括的な実験を行う。
論文 参考訳(メタデータ) (2023-09-09T13:54:34Z) - Efficient Dataset Distillation Using Random Feature Approximation [109.07737733329019]
本稿では,ニューラルネットワークガウス過程(NNGP)カーネルのランダム特徴近似(RFA)を用いた新しいアルゴリズムを提案する。
我々のアルゴリズムは、KIP上で少なくとも100倍のスピードアップを提供し、1つのGPUで実行できる。
RFA蒸留 (RFAD) と呼ばれる本手法は, 大規模データセットの精度において, KIP や他のデータセット凝縮アルゴリズムと競合して動作する。
論文 参考訳(メタデータ) (2022-10-21T15:56:13Z) - Communication-Efficient Adam-Type Algorithms for Distributed Data Mining [93.50424502011626]
我々はスケッチを利用した新しい分散Adam型アルゴリズムのクラス(例:SketchedAMSGrad)を提案する。
我々の新しいアルゴリズムは、反復毎に$O(frac1sqrtnT + frac1(k/d)2 T)$の高速収束率を$O(k log(d))$の通信コストで達成する。
論文 参考訳(メタデータ) (2022-10-14T01:42:05Z) - A Learning-Based Trajectory Planning of Multiple UAVs for AoI
Minimization in IoT Networks [13.2742178284328]
textitAge of Information (AoI)は、情報のタイムライン、すなわち受信した情報の更新やステータス更新を定量化するメトリクスである。
受信メッセージのAoIを最小化しながら、UAVの軌道を共同で計画する最適化問題を定式化する。
複素最適化問題は、深部強化学習(DRL)アルゴリズムを用いて効率よく解かれる。
論文 参考訳(メタデータ) (2022-09-13T12:39:23Z) - Implementing Reinforcement Learning Datacenter Congestion Control in NVIDIA NICs [64.26714148634228]
渋滞制御 (CC) アルゴリズムの設計は非常に困難になる。
現在、計算能力に制限があるため、ネットワークデバイスにAIモデルをデプロイすることはできない。
我々は,近年の強化学習CCアルゴリズムに基づく計算軽度解を構築した。
論文 参考訳(メタデータ) (2022-07-05T20:42:24Z) - Breaking the Sample Complexity Barrier to Regret-Optimal Model-Free
Reinforcement Learning [52.76230802067506]
漸進的強化学習における後悔を最小限に抑えるために,新しいモデルフリーアルゴリズムを提案する。
提案アルゴリズムは、2つのQ-ラーニングシーケンスの助けを借りて、初期設定された参照更新ルールを用いる。
初期の分散還元法の設計原理は、他のRL設定とは独立した関心を持つかもしれない。
論文 参考訳(メタデータ) (2021-10-09T21:13:48Z) - Regret Analysis of Distributed Online LQR Control for Unknown LTI
Systems [8.832969171530056]
線形時間不変(LTI)系に対する分散オンライン線形2次レギュレータ(LQR)問題について研究する。
本稿では,各エージェントが探索段階でシステム推定を計算するオンラインlqrアルゴリズムの分散型を提案する。
我々は,提案アルゴリズムが$tildeO(T2/3)$をスケールしていることを証明する。
論文 参考訳(メタデータ) (2021-05-15T23:02:58Z) - Coded Stochastic ADMM for Decentralized Consensus Optimization with Edge
Computing [113.52575069030192]
セキュリティ要件の高いアプリケーションを含むビッグデータは、モバイルデバイスやドローン、車両など、複数の異種デバイスに収集され、格納されることが多い。
通信コストとセキュリティ要件の制限のため、核融合センターにデータを集約するのではなく、分散的に情報を抽出することが最重要となる。
分散エッジノードを介してデータを局所的に処理するマルチエージェントシステムにおいて,モデルパラメータを学習する問題を考える。
分散学習モデルを開発するために,乗算器アルゴリズムの最小バッチ交互方向法(ADMM)のクラスについて検討した。
論文 参考訳(メタデータ) (2020-10-02T10:41:59Z) - Learning Centric Power Allocation for Edge Intelligence [84.16832516799289]
分散データを収集し、エッジで機械学習を実行するエッジインテリジェンスが提案されている。
本稿では,経験的分類誤差モデルに基づいて無線リソースを割り当てるLCPA法を提案する。
実験の結果,提案したLCPAアルゴリズムは,他のパワーアロケーションアルゴリズムよりも有意に優れていた。
論文 参考訳(メタデータ) (2020-07-21T07:02:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。