論文の概要: A General Deep Learning Framework for Wireless Resource Allocation under Discrete Constraints
- arxiv url: http://arxiv.org/abs/2603.19322v1
- Date: Tue, 17 Mar 2026 07:10:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 19:48:38.795249
- Title: A General Deep Learning Framework for Wireless Resource Allocation under Discrete Constraints
- Title(参考訳): 離散制約下での無線リソース割り当てのための一般ディープラーニングフレームワーク
- Authors: Yikun Wang, Yang Li, Yik-Chung Wu, Rui Zhang,
- Abstract要約: 本稿では,離散変数を扱うための一般的なディープラーニングフレームワークを提案する。
提案手法は,システム性能と計算効率の両面で,既存のベースラインを一貫して上回ることを示す。
- 参考スコア(独自算出の注目度): 22.464820932996588
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While deep learning (DL)-based methods have achieved remarkable success in continuous wireless resource allocation, efficient solutions for problems involving discrete variables remain challenging. This is primarily due to the zero-gradient issue in backpropagation, the difficulty of enforcing intricate constraints with discrete variables, and the inability in generating solutions with non-same-parameter-same-decision (non-SPSD) property. To address these challenges, this paper proposes a general DL framework by introducing the support set to represent the discrete variables. We model the elements of the support set as random variables and learn their joint probability distribution. By factorizing the joint probability as the product of conditional probabilities, each conditional probability is sequentially learned. This probabilistic modeling directly tackles all the aforementioned challenges of DL for handling discrete variables. By operating on probability distributions instead of hard binary decisions, the framework naturally avoids the zero-gradient issue. During the learning of the conditional probabilities, discrete constraints can be seamlessly enforced by masking out infeasible solutions. Moreover, with a dynamic context embedding that captures the evolving discrete solutions, the non-SPSD property is inherently provided by the proposed framework. We apply the proposed framework to two representative mixed-discrete wireless resource allocation problems: (a) joint user association and beamforming in cell-free systems, and (b) joint antenna positioning and beamforming in movable antenna-aided systems. Simulation results demonstrate that the proposed DL framework consistently outperforms existing baselines in terms of both system performance and computational efficiency.
- Abstract(参考訳): ディープラーニング(DL)ベースの手法は、連続的な無線リソース割り当てにおいて顕著な成功を収めてきたが、離散変数に関わる問題に対する効率的な解決策は依然として難しいままである。
これは主に、バックプロパゲーションにおけるゼロ段階の問題、離散変数との複雑な制約を強制することの難しさ、非Same-parameter-same-same-decision(非SPSD)特性の解を生成することができないことによる。
これらの課題に対処するために,離散変数を表現するためのサポートセットを導入することで,汎用的なDLフレームワークを提案する。
サポートセットの要素を確率変数としてモデル化し,その結合確率分布を学習する。
条件確率の積として関節確率を分解することにより、各条件確率を順次学習する。
この確率的モデリングは、離散変数を扱う上で、前述のDLのすべての課題に直接取り組む。
ハードバイナリ決定の代わりに確率分布を操作することで、このフレームワークは自然にゼロ段階の問題を避けることができる。
条件付き確率の学習において、離散的な制約は、実現不可能な解をマスキングすることでシームレスに強制することができる。
さらに、進化する離散解をキャプチャする動的コンテキスト埋め込みにより、非SPSD特性は本質的に提案されたフレームワークによって提供される。
提案手法を2つの代表的混合離散無線リソース割り当て問題に適用する。
(a)無細胞システムにおけるジョイントユーザアソシエーションとビームフォーミング
(b)移動アンテナ支援システムにおける継手アンテナ位置決めとビームフォーミング
シミュレーションの結果,提案するDLフレームワークは,システム性能と計算効率の両面で,既存のベースラインを一貫して上回っていることがわかった。
関連論文リスト
- Not All Preferences Are Created Equal: Stability-Aware and Gradient-Efficient Alignment for Reasoning Models [52.48582333951919]
ポリシー更新の信号対雑音比を最大化することにより、アライメントの信頼性を高めるために設計された動的フレームワークを提案する。
SAGE(Stability-Aware Gradient Efficiency)は、モデル能力に基づいて候補プールをリフレッシュする粗いきめ細かいカリキュラムメカニズムを統合する。
複数の数学的推論ベンチマークの実験により、SAGEは収束を著しく加速し、静的ベースラインを上回っていることが示された。
論文 参考訳(メタデータ) (2026-02-01T12:56:10Z) - Uncertainty-driven Embedding Convolution [16.523816971857787]
不確実性駆動型埋め込み畳み込み(UEC)を提案する。
UECは決定論的埋め込みをポストホックな方法で確率論的に変換する。
その後、埋め込みの不確実性に基づいて適応アンサンブル重みを計算する。
論文 参考訳(メタデータ) (2025-07-28T11:15:25Z) - Backscatter Device-aided Integrated Sensing and Communication: A Pareto Optimization Framework [59.30060797118097]
統合センシング・通信(ISAC)システムは、密集した都市非視線シナリオにおいて大きな性能劣化に遭遇する可能性がある。
本稿では,自然環境に分散した受動的BDを利用した後方散乱近似(BD)支援ISACシステムを提案する。
論文 参考訳(メタデータ) (2025-07-12T17:11:06Z) - End-to-End Probabilistic Framework for Learning with Hard Constraints [43.297232073870866]
ProbHardE2Eは,ハード操作・物理制約を組み込んだ確率予測フレームワークである。
我々の手法は、幅広いニューラルネットワークアーキテクチャと組み合わせられる新しい微分可能確率射影層(DPPL)を用いている。
論文 参考訳(メタデータ) (2025-06-08T05:29:50Z) - Learning Controlled Stochastic Differential Equations [61.82896036131116]
本研究では,非一様拡散を伴う連続多次元非線形微分方程式のドリフト係数と拡散係数の両方を推定する新しい手法を提案する。
我々は、(L2)、(Linfty)の有限サンプル境界や、係数の正則性に適応する学習率を持つリスクメトリクスを含む、強力な理論的保証を提供する。
当社のメソッドはオープンソースPythonライブラリとして利用可能です。
論文 参考訳(メタデータ) (2024-11-04T11:09:58Z) - Generalization Bounds of Surrogate Policies for Combinatorial Optimization Problems [53.03951222945921]
我々はスムーズな(摂動された)ポリシーを解析し、線形オラクルが使用する方向に対して制御されたランダムな摂動を付加する。
我々の主な貢献は、過剰リスクを摂動バイアス、統計的推定誤差、最適化誤差に分解する一般化境界である。
車両のスケジューリングやスムーズ化がトラクタブルトレーニングと制御された一般化の両方を可能にしていることを示す。
論文 参考訳(メタデータ) (2024-07-24T12:00:30Z) - Distributionally Robust Model-based Reinforcement Learning with Large
State Spaces [55.14361269378122]
強化学習における3つの大きな課題は、大きな状態空間を持つ複雑な力学系、コストのかかるデータ取得プロセス、トレーニング環境の展開から現実の力学を逸脱させることである。
広範に用いられているKullback-Leibler, chi-square, および全変分不確実性集合の下で, 連続状態空間を持つ分布ロバストなマルコフ決定過程について検討した。
本稿では,ガウス過程と最大分散削減アルゴリズムを用いて,多出力名目遷移力学を効率的に学習するモデルベースアプローチを提案する。
論文 参考訳(メタデータ) (2023-09-05T13:42:11Z) - Online Optimization and Ambiguity-based Learning of Distributionally Uncertain Dynamic Systems [1.6709415233613623]
本稿では,分散的に不確実な力学系のクラスを対象とする最適化問題 (P) に対して,データ駆動型オンラインソリューションを構築するための新しい手法を提案する。
導入されたフレームワークは、パラメータ化された制御依存のあいまいさセットを通じて、分散システムの不確実性の同時学習を可能にする。
また、Nesterovの高速化段階アルゴリズムのオンライン版を導入し、その性能を分析して、分散性理論を用いてこの問題のクラスを解く。
論文 参考訳(メタデータ) (2021-02-18T01:49:06Z) - Implicit Distributional Reinforcement Learning [61.166030238490634]
2つのディープジェネレータネットワーク(DGN)上に構築された暗黙の分布型アクター批判(IDAC)
半単純アクター (SIA) は、フレキシブルなポリシー分布を利用する。
我々は,代表的OpenAI Gym環境において,IDACが最先端のアルゴリズムより優れていることを観察する。
論文 参考訳(メタデータ) (2020-07-13T02:52:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。