論文の概要: Auction-Based RIS Allocation With DRL: Controlling the Cost-Performance Trade-Off
- arxiv url: http://arxiv.org/abs/2603.04433v1
- Date: Wed, 18 Feb 2026 06:22:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-09 01:20:08.21199
- Title: Auction-Based RIS Allocation With DRL: Controlling the Cost-Performance Trade-Off
- Title(参考訳): Auction-based RIS Allocation with DRL: Controling the Cost-Performance Trade-Off
- Authors: Martin Mark Zan, Stefan Schwarz,
- Abstract要約: 基地局がセルエッジに配置した共有RISユニットの制御を競うマルチセル無線ネットワークにおいて,再構成可能なRIS(Reconfigurable intelligent surface)の割り当てについて検討した。
予算制約に固執しながら性能を最大化することを学ぶ深層強化学習(DRL)エージェントを統合する。
本研究は,次世代無線ネットワークにおけるRISの効率的かつ公平な利用のために,オークションベースのアロケーションと適応RL機構を組み合わせる可能性を強調した。
- 参考スコア(独自算出の注目度): 2.217288163160845
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We study the allocation of reconfigurable intelligent surfaces (RISs) in a multi-cell wireless network, where base stations compete for control of shared RIS units deployed at the cell edges. These RISs, provided by an independent operator, are dynamically leased to the highest bidder using a simultaneously ascending auction format. Each base station estimates the utility of acquiring additional RISs based on macroscopic channel parameters, enabling a scalable and low-overhead allocation mechanism. To optimize the bidding behavior, we integrate deep reinforcement learning (DRL) agents that learn to maximize performance while adhering to budget constraints. Through simulations in clustered cell-edge environments, we demonstrate that reinforcement learning (RL)-based bidding significantly outperforms heuristic strategies, achieving optimal trade-offs between cost and spectral efficiency. Furthermore, we introduce a tunable parameter that governs the bidding aggressiveness of RL agents, enabling a flexible control of the trade-off between network performance and expenditure. Our results highlight the potential of combining auction-based allocation with adaptive RL mechanisms for efficient and fair utilization of RISs in next-generation wireless networks.
- Abstract(参考訳): 基地局がセルエッジに配置した共有RISユニットの制御を競うマルチセル無線ネットワークにおいて,再構成可能なRIS(Reconfigurable intelligent surface)の割り当てについて検討した。
独立オペレータによって提供されるこれらのRISは、同時に上昇するオークションフォーマットを使用して、最も高い入札者に動的にリースされる。
各基地局は、マクロなチャネルパラメータに基づいて追加のRISを取得する利点を推定し、スケーラブルで低オーバヘッドの割り当て機構を実現する。
入札行動の最適化を目的として,予算制約に固執しながら,性能を最大化する深層強化学習(DRL)エージェントを統合する。
クラスタ化されたセルエッジ環境におけるシミュレーションにより、強化学習に基づく入札がヒューリスティック戦略を著しく上回り、コストとスペクトル効率の最適なトレードオフを実現することを示した。
さらに、RLエージェントの入札攻撃性を管理する可変パラメータを導入し、ネットワーク性能と支出との間のトレードオフを柔軟に制御できるようにする。
本研究は,次世代無線ネットワークにおけるRISの効率的かつ公平な利用のために,オークションベースのアロケーションと適応RL機構を組み合わせる可能性を強調した。
関連論文リスト
- Large Language Models as Bidding Agents in Repeated HetNet Auction [4.305340565419997]
本稿では,ヘテロジニアスネットワーク(HetNets)内での繰り返しスペクトルオークションにおける推論エージェントとしての大規模言語モデル(LLMs)の統合について検討する。
本稿では,各基地局(BS)が独立して独自のマルチチャネルオークションを行う分散オークションベースのフレームワークを提案し,ユーザ機器(UE)がそれらの関連と入札値の両方を戦略的に決定する。
シミュレーションの結果,LCMを内蔵したUEは,ベンチマークよりもチャネルアクセス周波数が一貫して向上し,予算効率が向上することがわかった。
論文 参考訳(メタデータ) (2026-03-02T07:30:01Z) - RISER: Orchestrating Latent Reasoning Skills for Adaptive Activation Steering [62.63376387138257]
本稿では,アクティベーション空間における大規模言語モデル(LLM)推論を適応的に制御するプラグイン・アンド・プレイ介入フレームワークを提案する。
RISERは再利用可能な推論ベクトルのライブラリを構築し、軽量ルータを使用して各入力に対して動的に構成する。
ルーターは、タスクレベルの報酬の下で強化学習を通じて最適化され、緊急かつ構成的な方法で潜在する認知的プリミティブを活性化する。
論文 参考訳(メタデータ) (2026-01-14T08:04:33Z) - RIS-Assisted Downlink Pinching-Antenna Systems: GNN-Enabled Optimization Approaches [51.56300276709421]
本稿では,マルチユーザダウンリンク情報伝送のための再構成可能なマルチ導波路ピンチアンテナ (PASS) システムについて検討する。
RIS支援PASSのグラフ構造トポロジを活用することで,ユーザ位置に基づいてPA位置を学習する新しい3段階グラフニューラルネットワーク(GNN)を提案する。
論文 参考訳(メタデータ) (2025-11-25T13:43:44Z) - Task Specific Sharpness Aware O-RAN Resource Management using Multi Agent Reinforcement Learning [8.26664397566735]
次世代ネットワークは、動的リソース管理を可能にするためにOpen Radio Access Network (O-RAN)アーキテクチャを利用する。
深層強化学習モデルは、動的環境における堅牢性と一般化性に苦しむことが多い。
本稿では,分散マルチエージェントRL(MARL)フレームワークにおいて,シャープネス・アウェア最小化(SAM)を用いたソフトアクタ批判(SAC)アルゴリズムの新たな資源管理手法を提案する。
論文 参考訳(メタデータ) (2025-11-19T00:55:24Z) - SEQR: Secure and Efficient QR-based LoRA Routing [53.52716967527183]
Low-Rank Adaptation (LoRA) は,大規模言語モデルのパラメータ効率向上のための標準手法となっている。
与えられた入力に対して適切なLoRAアダプタを効果的に選択することは依然として困難である。
厳密なルーティング保証を提供しながら効率を最大化するために設計された、教師なしのLoRAルーティングアルゴリズムであるSEQRを導入する。
論文 参考訳(メタデータ) (2025-09-22T17:59:38Z) - Multi-Functional RIS-Enabled in SAGIN for IoT: A Hybrid Deep Reinforcement Learning Approach with Compressed Twin-Models [4.02185297590683]
宇宙空間におけるモノのインターネットのための統合ネットワーク(SAGIN)について検討した。
MF-RISは同時に無線エネルギーを増幅し、回収することができる。
論文 参考訳(メタデータ) (2025-07-22T03:40:56Z) - Efficient Beam Selection for ISAC in Cell-Free Massive MIMO via Digital Twin-Assisted Deep Reinforcement Learning [37.540612510652174]
我々は、誤報率制約の下で複数の受信APに対して共同目標検出確率の分布を導出する。
次に、マルコフ決定過程(MDP)としてビーム選択手順を定式化する。
リアルタイムエージェント環境相互作用の高コスト化とそれに伴うリスクを解消するために,新しいディジタルツイン(DT)支援オフラインDRL手法を提案する。
論文 参考訳(メタデータ) (2025-06-23T12:17:57Z) - Hybrid Reinforcement Learning for Optimizing Pump Sustainability in
Real-World Water Distribution Networks [55.591662978280894]
本稿では,実世界の配水ネットワーク(WDN)のリアルタイム制御を強化するために,ポンプスケジューリング最適化問題に対処する。
我々の主な目的は、エネルギー消費と運用コストを削減しつつ、物理的な運用上の制約を遵守することである。
進化に基づくアルゴリズムや遺伝的アルゴリズムのような伝統的な最適化手法は、収束保証の欠如によってしばしば不足する。
論文 参考訳(メタデータ) (2023-10-13T21:26:16Z) - Why So Pessimistic? Estimating Uncertainties for Offline RL through
Ensembles, and Why Their Independence Matters [35.17151863463472]
オフライン強化学習(RL)における悲観主義の根源として、Q$関数のアンサンブルをどのように活用できるかを、再検討する。
我々は、完全に独立したネットワークに基づいて、独立に計算されたターゲットと$Q$関数のアンサンブルを訓練する実用的なオフラインRLアルゴリズムMSGを提案する。
D4RL と RL Unplugged のオフライン RL ベンチマーク実験により,深いアンサンブルを持つMSG が高度に調整された最先端の手法を広いマージンで超えることを示した。
論文 参考訳(メタデータ) (2022-05-27T01:30:12Z) - Semantic-Aware Collaborative Deep Reinforcement Learning Over Wireless
Cellular Networks [82.02891936174221]
複数のエージェントが無線ネットワーク上で協調できるコラボレーティブディープ強化学習(CDRL)アルゴリズムは有望なアプローチである。
本稿では,リソース制約のある無線セルネットワーク上で,意味的にリンクされたDRLタスクを持つ未学習エージェントのグループを効率的に協調させる,新しい意味認識型CDRL手法を提案する。
論文 参考訳(メタデータ) (2021-11-23T18:24:47Z) - Adaptive Stochastic ADMM for Decentralized Reinforcement Learning in
Edge Industrial IoT [106.83952081124195]
強化学習 (Reinforcement Learning, RL) は, 意思決定および最適制御プロセスのための有望な解法として広く研究されている。
本稿では,Adaptive ADMM (asI-ADMM)アルゴリズムを提案する。
実験の結果,提案アルゴリズムは通信コストやスケーラビリティの観点から技術状況よりも優れており,複雑なIoT環境に適応できることがわかった。
論文 参考訳(メタデータ) (2021-06-30T16:49:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。