Fugu-MT 論文翻訳(概要): Aging Bandits: Regret Analysis and Order-Optimal Learning Algorithm for Wireless Networks with Stochastic Arrivals

論文の概要: Aging Bandits: Regret Analysis and Order-Optimal Learning Algorithm for Wireless Networks with Stochastic Arrivals

arxiv url: http://arxiv.org/abs/2012.08682v2
Date: Mon, 21 Dec 2020 20:03:47 GMT
ステータス: 翻訳完了
システム内更新日: 2021-05-03 03:01:57.259947
Title: Aging Bandits: Regret Analysis and Order-Optimal Learning Algorithm for Wireless Networks with Stochastic Arrivals
Title（参考訳）: 高齢化帯域:確率条件付き無線ネットワークにおけるレギュレット解析と順序最適学習アルゴリズム
Authors: Eray Unsal Atay, Igor Kadota and Eytan Modiano
Abstract要約: 信頼できないチャネルに時間感知情報を送信するソースを持つシングルホップ無線ネットワークを検討する。学習アルゴリズムは1つのペア(ソース、チャネル)を選択し、選択されたソースは選択されたチャネルを介してパケットを送信しようとする。学習アルゴリズムの目的は、ネットワーク内の年齢情報(AoI)を$ T$のタイムスロットで最小化することです。
参考スコア（独自算出の注目度）: 24.897224064639406
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We consider a single-hop wireless network with sources transmitting time-sensitive information to the destination over multiple unreliable channels. Packets from each source are generated according to a stochastic process with known statistics and the state of each wireless channel (ON/OFF) varies according to a stochastic process with unknown statistics. The reliability of the wireless channels is to be learned through observation. At every time slot, the learning algorithm selects a single pair (source, channel) and the selected source attempts to transmit its packet via the selected channel. The probability of a successful transmission to the destination depends on the reliability of the selected channel. The goal of the learning algorithm is to minimize the Age-of-Information (AoI) in the network over $T$ time slots. To analyze the performance of the learning algorithm, we introduce the notion of AoI regret, which is the difference between the expected cumulative AoI of the learning algorithm under consideration and the expected cumulative AoI of a genie algorithm that knows the reliability of the channels a priori. The AoI regret captures the penalty incurred by having to learn the statistics of the channels over the $T$ time slots. The results are two-fold: first, we consider learning algorithms that employ well-known solutions to the stochastic multi-armed bandit problem (such as $\epsilon$-Greedy, Upper Confidence Bound, and Thompson Sampling) and show that their AoI regret scales as $\Theta(\log T)$; second, we develop a novel learning algorithm and show that it has $O(1)$ regret. To the best of our knowledge, this is the first learning algorithm with bounded AoI regret.
Abstract（参考訳）: 我々は、複数の信頼できないチャンネル上で、送信元が目的地にタイムセンシティブな情報を伝達するシングルホップ無線ネットワークを考える。各ソースからのパケットは、既知の統計の確率過程に従って生成され、各無線チャネルの状態(ON/OFF)は、未知の統計の確率過程によって変化する。無線チャネルの信頼性は観測を通して学ぶ必要がある。学習アルゴリズムは1つのペア(ソース、チャネル)を選択し、選択されたソースは選択されたチャネルを介してパケットを送信しようとする。送信先への送信成功の確率は、選択されたチャネルの信頼性に依存する。学習アルゴリズムの目標は、ネットワークのaoi( age-of-information)を$t$のタイムスロットで最小化することである。学習アルゴリズムの性能を分析するために,学習アルゴリズムの期待累積aoiと,先行するチャネルの信頼性を知っているgenieアルゴリズムの期待累積aoiとの差であるaoi regretの概念を導入する。 aoi regretは、t$タイムスロット上でチャネルの統計を学習することによって発生するペナルティをキャプチャする。まず、確率的多重武装バンディット問題(例えば、$\epsilon$-Greedy、Upper Confidence Bound、Thompson Sampling)によく知られた解を用いる学習アルゴリズムを検討し、彼らのAoIが後悔して$\Theta(\log T)$にスケールしたことを示す。私たちの知る限りでは、これはAoI境界を持つ最初の学習アルゴリズムです。

関連論文リスト

Age Optimal Sampling for Unreliable Channels under Unknown Channel Statistics [25.04993246830622]
本研究では,センサが受信機にステータスを転送するシステムについて検討し,受信機は信頼性の高いチャネルを介して送信結果をセンサに送信する。受信機におけるステータス情報のタイムラインを評価するために、Age of Informationのメトリクスを用いる。この問題を解決するためにRobins-Monroアルゴリズムを提案し、最適しきい値をほぼ確実に近似できることを実証する。
論文参考訳（メタデータ） (2024-12-24T03:06:22Z)
Meta-Learning from Learning Curves for Budget-Limited Algorithm Selection [11.409496019407067]
予算制限のシナリオでは、アルゴリズム候補を慎重に選択し、それを訓練するための予算を割り当てることが不可欠である。本稿では,エージェントが十分に訓練されるまで待たずに,最も有望なアルゴリズムを学習する過程において,エージェントが選択しなければならない新しい枠組みを提案する。
論文参考訳（メタデータ） (2024-10-10T08:09:58Z)
An Adaptive Algorithm for Learning with Unknown Distribution Drift [6.599344783327055]
本研究では,未知分布のドリフトで学習する一般的な手法を開発し,解析する。我々の技術は漂流の大きさに関する事前の知識を必要としない。本稿では,2進分類と線形回帰という2つの基本的な学習シナリオにおいて,本手法の適用例を示す。
論文参考訳（メタデータ） (2023-05-03T16:37:32Z)
Generalized Differentiable RANSAC [95.95627475224231]
$nabla$-RANSACは、ランダム化された堅牢な推定パイプライン全体を学ぶことができる、微分可能なRANSACである。 $nabla$-RANSACは、精度という点では最先端のシステムよりも優れているが、精度は低い。
論文参考訳（メタデータ） (2022-12-26T15:13:13Z)
Revisiting Random Channel Pruning for Neural Network Compression [159.99002793644163]
チャネル(または3Dフィルタ)プルーニングは、ニューラルネットワークの推論を加速する有効な方法である。本稿では,ランダムな探索により,プルーンドモデルのチャネル構成を決定することを試みる。この単純な戦略は、他のチャネルプルーニング手法と比較して非常にうまく機能することを示す。
論文参考訳（メタデータ） (2022-05-11T17:59:04Z)
Efficiently Learning Any One Hidden Layer ReLU Network From Queries [27.428198343906352]
ネットワークへのブラックボックスアクセスを提供するニューラルネットワークアクティベーションを任意の1つの隠蔽層で学習するアルゴリズムを初めて提供する。最悪のネットワークであっても、完全時間で効率を保証できるのはこれが初めてです。
論文参考訳（メタデータ） (2021-11-08T18:59:40Z)
The Information Geometry of Unsupervised Reinforcement Learning [133.20816939521941]
教師なしスキル発見(英語: Unsupervised skill discovery)とは、報酬関数にアクセスせずに一連のポリシーを学ぶアルゴリズムのクラスである。教師なしのスキル発見アルゴリズムは、あらゆる報酬関数に最適なスキルを学習しないことを示す。
論文参考訳（メタデータ） (2021-10-06T13:08:36Z)
Machine Learning for Online Algorithm Selection under Censored Feedback [71.6879432974126]
オンラインアルゴリズム選択(OAS)では、アルゴリズム問題クラスのインスタンスがエージェントに次々に提示され、エージェントは、固定された候補アルゴリズムセットから、おそらく最高のアルゴリズムを迅速に選択する必要がある。 SAT(Satisfiability)のような決定問題に対して、品質は一般的にアルゴリズムのランタイムを指す。本研究では,OASのマルチアームバンディットアルゴリズムを再検討し,この問題に対処する能力について議論する。ランタイム指向の損失に適応し、時間的地平線に依存しない空間的・時間的複雑さを維持しながら、部分的に検閲されたデータを可能にする。
論文参考訳（メタデータ） (2021-09-13T18:10:52Z)
Learning and Planning in Average-Reward Markov Decision Processes [15.586087060535398]
我々は,平均回帰MDPの学習と計画アルゴリズムを導入する。全てのアルゴリズムは,平均報酬の推定値を更新する際に,従来の誤差よりも時間差誤差を用いている。
論文参考訳（メタデータ） (2020-06-29T19:03:24Z)
Meta-learning with Stochastic Linear Bandits [120.43000970418939]
我々は、よく知られたOFULアルゴリズムの正規化バージョンを実装するバンディットアルゴリズムのクラスを考える。我々は,タスク数の増加とタスク分散の分散が小さくなると,タスクを個別に学習する上で,我々の戦略が大きな優位性を持つことを理論的および実験的に示す。
論文参考訳（メタデータ） (2020-05-18T08:41:39Z)
Quantum algorithms for hedging and the learning of Ising models [6.346764987071066]
オンライン学習のためのパラダイムアルゴリズムは、FreundとSchapireのHedgeアルゴリズムである。この研究は、このようなオンライン学習のための量子アルゴリズムを論理的に提示する。
論文参考訳（メタデータ） (2020-02-14T12:48:53Z)
Channel Assignment in Uplink Wireless Communication using Machine Learning Approach [54.012791474906514]
本稿では,アップリンク無線通信システムにおけるチャネル割り当て問題について検討する。我々の目標は、整数チャネル割り当て制約を受ける全ユーザの総和率を最大化することです。計算複雑性が高いため、機械学習アプローチは計算効率のよい解を得るために用いられる。
論文参考訳（メタデータ） (2020-01-12T15:54:20Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。