論文の概要: Adaptive Requesting in Decentralized Edge Networks via Non-Stationary Bandits
- arxiv url: http://arxiv.org/abs/2601.08760v1
- Date: Tue, 13 Jan 2026 17:43:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-14 18:27:19.312528
- Title: Adaptive Requesting in Decentralized Edge Networks via Non-Stationary Bandits
- Title(参考訳): 非定常帯域による分散エッジネットワークの適応要求
- Authors: Yi Zhuang, Kun Yang, Xingran Chen,
- Abstract要約: 複数のクライアント、アクセスノード(AN)、サーバからなるエッジネットワークにおいて、時間に敏感なクライアントの情報鮮度を最適化することを目的とした分散協調要求問題について検討する。
我々は、報酬を顧客によるANの選択による情報削減の年齢と定義し、この問題を静止しないマルチアームバンディットとして定式化する。
この分散された部分的に観測可能な環境では、結果として得られる報酬プロセスは履歴に依存し、クライアント間で結合され、期待される報酬の急激な変化と漸進的な変化を示す。
- 参考スコア(独自算出の注目度): 15.98737820520885
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We study a decentralized collaborative requesting problem that aims to optimize the information freshness of time-sensitive clients in edge networks consisting of multiple clients, access nodes (ANs), and servers. Clients request content through ANs acting as gateways, without observing AN states or the actions of other clients. We define the reward as the age of information reduction resulting from a client's selection of an AN, and formulate the problem as a non-stationary multi-armed bandit. In this decentralized and partially observable setting, the resulting reward process is history-dependent and coupled across clients, and exhibits both abrupt and gradual changes in expected rewards, rendering classical bandit-based approaches ineffective. To address these challenges, we propose the AGING BANDIT WITH ADAPTIVE RESET algorithm, which combines adaptive windowing with periodic monitoring to track evolving reward distributions. We establish theoretical performance guarantees showing that the proposed algorithm achieves near-optimal performance, and we validate the theoretical results through simulations.
- Abstract(参考訳): 複数のクライアント、アクセスノード(AN)、サーバからなるエッジネットワークにおいて、時間に敏感なクライアントの情報鮮度を最適化することを目的とした分散協調要求問題について検討する。
クライアントは、AN状態や他のクライアントのアクションを監視せずに、ゲートウェイとして振る舞うANを通じてコンテンツを要求する。
我々は、報酬を顧客によるANの選択による情報削減の年齢と定義し、この問題を静止しないマルチアームバンディットとして定式化する。
この分散的で部分的に観察可能な環境では、結果として得られる報酬プロセスは履歴に依存し、クライアント間で結合され、期待される報酬の急激な変化と漸進的な変化の両方を示し、古典的なバンディットベースのアプローチは効果がない。
これらの課題に対処するため,適応ウィンドウと周期的モニタリングを組み合わせたAGING BANDIT WITH ADAPTIVE RESETアルゴリズムを提案する。
我々は,提案アルゴリズムが最適に近い性能を達成することを示す理論的性能保証を確立し,シミュレーションによる理論的結果の検証を行う。
関連論文リスト
- STT-GS: Sample-Then-Transmit Edge Gaussian Splatting with Joint Client Selection and Power Control [77.56170394100022]
Edge Gaussian splatting (EGS)は、分散クライアントからデータを集約し、エッジサーバでグローバルGSモデルをトレーニングする。
本稿では、異なるクライアントのビューコントリビューションを識別する新しいGS指向の目的関数を定式化する。
その結果,低サンプリング比でGS指向の目的を正確に予測できることが判明した。
論文 参考訳(メタデータ) (2025-10-15T06:20:47Z) - Socially inspired Adaptive Coalition and Client Selection in Federated Learning [36.94429692322632]
フェデレートラーニング(FL)は、プライバシ保護のための協調モデルトレーニングを可能にするが、その効果はクライアントデータの不均一性によって制限されることが多い。
i)合意に基づいてクライアントの非重複連立を動的に形成し、(ii)モデル更新のばらつきを最小限に抑えるために、各連立から1人の代表を選定するクライアント選択アルゴリズムを導入する。
提案手法は, 近距離行列をスペクトルクラスタリングに利用し, 集団の集合的意見を推定する最も情報性の高い個人を特定する手法として, ソーシャルネットワークモデリングに着想を得たものである。
論文 参考訳(メタデータ) (2025-06-03T14:04:31Z) - On the Role of Feedback in Test-Time Scaling of Agentic AI Workflows [71.92083784393418]
エージェントAI(自律的な計画と行動を行うシステム)は広く普及しているが、複雑なタスクにおけるタスクの成功率は低いままである。
推論時のアライメントは、サンプリング、評価、フィードバックの3つのコンポーネントに依存します。
本稿では,様々な形態の批判から抽出されたフィードバックを繰り返し挿入するIterative Agent Decoding(IAD)を紹介する。
論文 参考訳(メタデータ) (2025-04-02T17:40:47Z) - MAB-Based Channel Scheduling for Asynchronous Federated Learning in Non-Stationary Environments [12.404264058659429]
フェデレートラーニングは、生のデータ交換なしでクライアント間での分散モデルトレーニングを可能にする。
無線実装では、頻繁なパラメータ更新は高い通信オーバーヘッドを引き起こす。
通信効率と公平性を向上しつつ,クライアントの安定性を低下させるための非同期フェデレーション学習スケジューリングフレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-03T09:05:04Z) - Hybrid-Regularized Magnitude Pruning for Robust Federated Learning under Covariate Shift [2.298932494750101]
クライアント側トレーニング分布の不整合がフェデレート学習モデルの性能を著しく低下させることを示す。
本稿では,ニューラルネットワークの疎結合性,冗長性,堅牢性を改善するために,フラニングとクライアントトレーニングの正規化を組み合わせた新しいFLフレームワークを提案する。
論文 参考訳(メタデータ) (2024-12-19T16:22:37Z) - Improving Portfolio Optimization Results with Bandit Networks [0.0]
非定常環境向けに設計された新しいBanditアルゴリズムを導入・評価する。
まず,Adaptive Discounted Thompson Smpling (ADTS)アルゴリズムを提案する。
そこで我々は,この手法を,CADTSアルゴリズムを導入してポートフォリオ最適化問題に拡張する。
論文 参考訳(メタデータ) (2024-10-05T16:17:31Z) - MARLIN: Soft Actor-Critic based Reinforcement Learning for Congestion
Control in Real Networks [63.24965775030673]
そこで本研究では,汎用的な渋滞制御(CC)アルゴリズムを設計するための新しい強化学習(RL)手法を提案する。
我々の解であるMARLINは、Soft Actor-Criticアルゴリズムを用いてエントロピーとリターンの両方を最大化する。
我々は,MARLINを実ネットワーク上で訓練し,実ミスマッチを克服した。
論文 参考訳(メタデータ) (2023-02-02T18:27:20Z) - Provably Efficient Reinforcement Learning for Online Adaptive Influence
Maximization [53.11458949694947]
本稿では,リアルタイムフィードバックに基づいてシードノードを逐次活性化する,コンテンツ依存型オンライン影響問題の適応バージョンについて検討する。
提案アルゴリズムは,最適政策を楽観的に改善しつつ,ネットワークモデルの推定を保守し,適応的にシードを選択する。
論文 参考訳(メタデータ) (2022-06-29T18:17:28Z) - Approaching sales forecasting using recurrent neural networks and
transformers [57.43518732385863]
深層学習技術を用いて,日・店・店レベルでの顧客販売予測問題に対処する3つの方法を開発した。
実験結果から,データ前処理を最小限に抑えた単純なシーケンスアーキテクチャを用いて,優れた性能を実現することができることを示す。
提案した解は約0.54の RMSLE を達成し、Kaggle コンペティションで提案された問題に対する他のより具体的な解と競合する。
論文 参考訳(メタデータ) (2022-04-16T12:03:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。