論文の概要: Exploiting Side Information for Improved Online Learning Algorithms in
Wireless Networks
- arxiv url: http://arxiv.org/abs/2202.11699v1
- Date: Wed, 16 Feb 2022 07:14:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-27 20:34:47.986387
- Title: Exploiting Side Information for Improved Online Learning Algorithms in
Wireless Networks
- Title(参考訳): 無線ネットワークにおけるオンライン学習アルゴリズムの改良のためのサイド情報公開
- Authors: Manjesh K. Hanawal and Sumit J. Darak
- Abstract要約: 無線ネットワークでは、達成率は、干渉レベル、ハードウェア障害、チャネルゲインなどの要因に依存する。
本研究では,側情報として達成される速度と非ゼロ相関を持つ測定可能な品質について検討する。
報酬と関連する側情報との相関の量に比例した利得を示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In wireless networks, the rate achieved depends on factors like level of
interference, hardware impairments, and channel gain. Often, instantaneous
values of some of these factors can be measured, and they provide useful
information about the instantaneous rate achieved. For example, higher
interference implies a lower rate. In this work, we treat any such measurable
quality that has a non-zero correlation with the rate achieved as
side-information and study how it can be exploited to quickly learn the channel
that offers higher throughput (reward). When the mean value of the
side-information is known, using control variate theory we develop algorithms
that require fewer samples to learn the parameters and can improve the learning
rate compared to cases where side-information is ignored. Specifically, we
incorporate side-information in the classical Upper Confidence Bound (UCB)
algorithm and quantify the gain achieved in the regret performance. We show
that the gain is proportional to the amount of the correlation between the
reward and associated side-information. We discuss in detail various
side-information that can be exploited in cognitive radio and air-to-ground
communication in $L-$band. We demonstrate that correlation between the reward
and side-information is often strong in practice and exploiting it improves the
throughput significantly.
- Abstract(参考訳): 無線ネットワークでは、その速度は干渉のレベル、ハードウェアの障害、チャネル利得などの要因に依存する。
多くの場合、これらの要因の瞬時に値を測定することができ、達成した瞬間率に関する有用な情報を提供する。
例えば、高い干渉は低いレートを意味する。
本研究では,サイドインフォメーションとして達成された速度と非ゼロ相関を持つ測定可能な品質を扱い,高いスループット(リワード)を提供するチャネルを迅速に学習する方法について検討する。
側情報の平均値が分かっている場合、制御変数理論を用いて、パラメータの学習に必要なサンプルが少ないアルゴリズムを開発し、側情報を無視した場合と比較して学習率を向上させる。
具体的には,古典的なuper confidence bound(ucb)アルゴリズムにサイド情報を取り込んで,後悔のパフォーマンスで得られた利益を定量化する。
その結果,ゲインは報酬と関連するサイド情報との相関の量に比例することがわかった。
我々は,l-$bandでコグニティブ無線や空対地通信で活用できる様々なサイド情報について詳細に論じる。
また,報奨とサイド情報との相関が強く,その利用によってスループットが著しく向上することを示す。
関連論文リスト
- FedDec: Peer-to-peer Aided Federated Learning [15.952956981784219]
フェデレートラーニング(FL)は、プライバシを損なうことなく、複数のエージェントのデータを活用する機械学習モデルのトレーニングを可能にした。
FLは、データ不均一性、部分的なデバイス参加、サーバとの頻繁な通信に弱いことが知られている。
FLの局所勾配更新間でのピアツーピア通信とパラメータ平均化をインターリーブするアルゴリズムであるFedDecを提案する。
論文 参考訳(メタデータ) (2023-06-11T16:30:57Z) - Ignorance is Bliss: Robust Control via Information Gating [60.17644038829572]
情報パーシモニーは、ノイズや突発的相関に頑健であることにより、より良い一般化を実現する学習表現に有用な帰納的バイアスを提供する。
本稿では,タスクに必要な最小限の情報を識別する類似表現を学習する手段として,テキスト情報ゲーティングを提案する。
論文 参考訳(メタデータ) (2023-03-10T18:31:50Z) - Offline Reinforcement Learning at Multiple Frequencies [62.08749079914275]
本研究では、オフライン強化学習アルゴリズムが、トレーニング中に複数の周波数を混合したデータに対応できるかどうかについて検討する。
学習を安定させるために$Q$-valueの更新率で一貫性を強制する、単純だが効果的なソリューションを提案する。
論文 参考訳(メタデータ) (2022-07-26T17:54:49Z) - SignalNet: A Low Resolution Sinusoid Decomposition and Estimation
Network [79.04274563889548]
本稿では,正弦波数を検出するニューラルネットワークアーキテクチャであるSignalNetを提案する。
基礎となるデータ分布と比較して,ネットワークの結果を比較するための最悪の学習しきい値を導入する。
シミュレーションでは、我々のアルゴリズムは常に3ビットデータのしきい値を超えることができるが、しばしば1ビットデータのしきい値を超えることはできない。
論文 参考訳(メタデータ) (2021-06-10T04:21:20Z) - Towards an Understanding of Benign Overfitting in Neural Networks [104.2956323934544]
現代の機械学習モデルは、しばしば膨大な数のパラメータを使用し、通常、トレーニング損失がゼロになるように最適化されている。
ニューラルネットワークの2層構成において、これらの良質な過適合現象がどのように起こるかを検討する。
本稿では,2層型ReLUネットワーク補間器を極小最適学習率で実現可能であることを示す。
論文 参考訳(メタデータ) (2021-06-06T19:08:53Z) - Can Active Learning Preemptively Mitigate Fairness Issues? [66.84854430781097]
データセットバイアスは、機械学習における不公平な原因の1つです。
不確実性に基づくALで訓練されたモデルが保護クラスの決定において公平であるかどうかを検討する。
また,勾配反転(GRAD)やBALDなどのアルゴリズム的公正性手法の相互作用についても検討する。
論文 参考訳(メタデータ) (2021-04-14T14:20:22Z) - On the Outsized Importance of Learning Rates in Local Update Methods [2.094022863940315]
我々は,多くのフェデレーション学習とメタ学習アルゴリズムを一般化する,局所的な更新手法と呼ばれるアルゴリズム群について検討する。
2次目的に対して、局所更新法は、正に特徴付けられる代理損失関数の勾配降下を実行することを証明した。
クライアント学習率の選択は、サロゲート損失の条件数と、サロゲート最小化関数と真の損失関数との距離を制御していることを示す。
論文 参考訳(メタデータ) (2020-07-02T04:45:55Z) - Improving Learning Efficiency for Wireless Resource Allocation with
Symmetric Prior [28.275250620630466]
本稿では、まず、ドメイン知識を利用するための2つのアプローチのクラスを、数学的モデルの導入とディープラーニングへの事前知識の2つにまとめる。
このような総合的な事前手法が学習効率の向上にどのように活用されているかを説明するために,我々はランク付けを頼りにしている。
システム性能を達成するために必要なトレーニングサンプルは,サブキャリア数やコンテンツ数によって減少することがわかった。
論文 参考訳(メタデータ) (2020-05-18T07:57:34Z) - DisCor: Corrective Feedback in Reinforcement Learning via Distribution
Correction [96.90215318875859]
ブートストラップに基づくQ-ラーニングアルゴリズムは必ずしも修正フィードバックの恩恵を受けないことを示す。
本稿では,この最適分布に対する近似を計算し,トレーニングに使用する遷移の重み付けに使用する新しいアルゴリズムであるDisCorを提案する。
論文 参考訳(メタデータ) (2020-03-16T16:18:52Z) - Centimeter-Level Indoor Localization using Channel State Information
with Recurrent Neural Networks [12.193558591962754]
本稿では,線形アンテナから収集した実CSIデータを用いて,センチメートルレベルの屋内位置推定を行うニューラルネットワーク手法を提案する。
チャネル応答の振幅または相関行列を入力として使用することにより、データサイズを大幅に削減し、ノイズを抑制することができる。
また、リカレントニューラルネットワーク(RNN)と信号雑音比(SNR)情報によるユーザ動作軌跡の整合性を利用して、推定精度をさらに向上する。
論文 参考訳(メタデータ) (2020-02-04T17:10:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。