論文の概要: To Supervise or Not: How to Effectively Learn Wireless Interference
Management Models?
- arxiv url: http://arxiv.org/abs/2112.14011v1
- Date: Tue, 28 Dec 2021 06:29:08 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-30 16:06:03.634116
- Title: To Supervise or Not: How to Effectively Learn Wireless Interference
Management Models?
- Title(参考訳): 無線干渉管理モデルを効果的に学ぶには、どうすればよいのか?
- Authors: Bingqing Song, Haoran Sun, Wenqiang Pu, Sijia Liu, and Mingyi Hong
- Abstract要約: 機械学習は、無線干渉管理問題の解決に成功している。
このような干渉管理モデルには、教師あり学習と教師なし学習の2つの一般的な訓練パラダイムがある。
特殊な電力制御問題に対して、教師なし学習は教師なし学習よりもはるかに悪い性能を発揮することを示す。
- 参考スコア(独自算出の注目度): 43.317056712257994
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine learning has become successful in solving wireless interference
management problems. Different kinds of deep neural networks (DNNs) have been
trained to accomplish key tasks such as power control, beamforming and
admission control. There are two popular training paradigms for such DNNs-based
interference management models: supervised learning (i.e., fitting labels
generated by an optimization algorithm) and unsupervised learning (i.e.,
directly optimizing some system performance measure). Although both of these
paradigms have been extensively applied in practice, due to the lack of any
theoretical understanding about these methods, it is not clear how to
systematically understand and compare their performance.
In this work, we conduct theoretical studies to provide some in-depth
understanding about these two training paradigms. First, we show a somewhat
surprising result, that for some special power control problem, the
unsupervised learning can perform much worse than its supervised counterpart,
because it is more likely to stuck at some low-quality local solutions. We then
provide a series of theoretical results to further understand the properties of
the two approaches. Generally speaking, we show that when high-quality labels
are available, then the supervised learning is less likely to be stuck at a
solution than its unsupervised counterpart. Additionally, we develop a
semi-supervised learning approach which properly integrates these two training
paradigms, and can effectively utilize limited number of labels to find
high-quality solutions. To our knowledge, these are the first set of
theoretical results trying to understand different training approaches in
learning-based wireless communication system design.
- Abstract(参考訳): 機械学習は、無線干渉管理問題の解決に成功している。
異なる種類のディープニューラルネットワーク(dnn)が、電力制御、ビームフォーミング、インシデント制御などの重要なタスクを達成するために訓練されている。
DNNベースの干渉管理モデルには、教師付き学習(最適化アルゴリズムによって生成されたラベルを適合させる)と教師なし学習(システムパフォーマンスの指標を直接最適化する)の2つの一般的な訓練パラダイムがある。
これらのパラダイムはいずれも実践的に広く適用されているが、これらの手法に関する理論的理解が欠如しているため、その性能を体系的に理解し比較する方法は明確ではない。
本研究は,これらの2つの学習パラダイムを深く理解するために,理論的研究を行う。
まず、いくつかの特別な電力制御問題に対して、教師なし学習は教師なし学習よりもずっと悪い結果をもたらすという、少々意外な結果を示す。
次に、2つのアプローチの特性をさらに理解するために、一連の理論的結果を提供する。
一般に、高品質なラベルが利用可能である場合、教師なし学習は教師なし学習よりもソリューションに留まる可能性が低いことを示す。
さらに,これらの2つの学習パラダイムを適切に統合し,限られた数のラベルを有効活用し,高品質な学習手法を提案する。
我々の知る限り、これらは学習に基づく無線通信システム設計における異なるトレーニングアプローチを理解するための最初の理論的結果である。
関連論文リスト
- Near-Optimal Solutions of Constrained Learning Problems [85.48853063302764]
機械学習システムでは、振る舞いを縮小する必要性がますます顕在化している。
これは、双対ロバスト性変数を満たすモデルの開発に向けた最近の進歩によって証明されている。
この結果から, 豊富なパラメトリゼーションは非次元的, 有限な学習問題を効果的に緩和することが示された。
論文 参考訳(メタデータ) (2024-03-18T14:55:45Z) - An Invitation to Deep Reinforcement Learning [24.807012576054504]
ターゲット目標を最大化するためにディープニューラルネットワークをトレーニングすることが、マシンラーニングの成功の標準的なレシピになっています。
共通目的として、連合(IoU)、二言語評価(BLEU)スコア、報酬は教師付き学習では最適化できない。
強化学習(Reinforcement Learning, RL)は、未分化の目的を最大化するために、ディープニューラルネットワークを最適化するための有望な代替手段として登場した。
論文 参考訳(メタデータ) (2023-12-13T18:57:23Z) - Hierarchically Structured Task-Agnostic Continual Learning [0.0]
本研究では,連続学習のタスク非依存的な視点を取り入れ,階層的情報理論の最適性原理を考案する。
我々は,情報処理経路の集合を作成することで,忘れを緩和する,Mixture-of-Variational-Experts層と呼ばれるニューラルネットワーク層を提案する。
既存の連続学習アルゴリズムのようにタスク固有の知識を必要としない。
論文 参考訳(メタデータ) (2022-11-14T19:53:15Z) - The least-control principle for learning at equilibrium [65.2998274413952]
我々は、平衡反復ニューラルネットワーク、深層平衡モデル、メタラーニングを学ぶための新しい原理を提案する。
私たちの結果は、脳がどのように学習するかを明らかにし、幅広い機械学習問題にアプローチする新しい方法を提供します。
論文 参考訳(メタデータ) (2022-07-04T11:27:08Z) - A Workflow for Offline Model-Free Robotic Reinforcement Learning [117.07743713715291]
オフライン強化学習(RL)は、オンラインインタラクションを伴わずに、事前の経験のみを活用することによって、学習制御ポリシを可能にする。
本研究では,教師付き学習問題に対して,比較的よく理解されたオフラインRLと類似した実践的ワークフローを開発する。
オンラインチューニングを伴わない効果的なポリシー作成におけるこのワークフローの有効性を実証する。
論文 参考訳(メタデータ) (2021-09-22T16:03:29Z) - Unsupervised Learning for Robust Fitting:A Reinforcement Learning
Approach [25.851792661168698]
堅牢なモデルフィッティングを解決するための新しいフレームワークを紹介します。
他の方法とは異なり、私たちの仕事は基本的な入力機能に無知です。
実験により,本手法が既存の学習手法より優れていることを示す。
論文 参考訳(メタデータ) (2021-03-05T07:14:00Z) - Learning Neural Network Subspaces [74.44457651546728]
近年の観測は,ニューラルネットワーク最適化の展望の理解を深めている。
1つのモデルのトレーニングと同じ計算コストで、高精度ニューラルネットワークの線、曲線、単純軸を学習します。
1つのモデルのトレーニングと同じ計算コストで、高精度ニューラルネットワークの線、曲線、単純軸を学習します。
論文 参考訳(メタデータ) (2021-02-20T23:26:58Z) - Improving Performance in Reinforcement Learning by Breaking
Generalization in Neural Networks [5.273501657421096]
オンラインNNトレーニングと干渉が強化学習においてどのように相互作用するかを示す。
入力を高次元空間に再マッピングするだけで学習速度とパラメータ感度が向上することがわかった。
NNトレーニングに簡単なアプローチを提供し、実装が容易で、追加の計算をほとんど必要としない。
論文 参考訳(メタデータ) (2020-03-16T19:21:08Z) - Deep Learning for Ultra-Reliable and Low-Latency Communications in 6G
Networks [84.2155885234293]
まず,データ駆動型教師付き深層学習と深部強化学習をURLLCに適用する方法を概説する。
このようなオープンな問題に対処するために、デバイスインテリジェンス、エッジインテリジェンス、およびURLLCのためのクラウドインテリジェンスを可能にするマルチレベルアーキテクチャを開発した。
論文 参考訳(メタデータ) (2020-02-22T14:38:11Z) - Convergence of End-to-End Training in Deep Unsupervised Contrastive
Learning [3.8073142980733]
教師なしのコントラスト学習は、ラベルのないデータから表現を学習するための強力な方法であることが証明されている。
この研究は、これらの教師なし手法の実践的成功に関する理論的知見を提供する。
論文 参考訳(メタデータ) (2020-02-17T14:35:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。