論文の概要: Delay-Tolerant Constrained OCO with Application to Network Resource
Allocation
- arxiv url: http://arxiv.org/abs/2105.04005v1
- Date: Sun, 9 May 2021 19:32:33 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-11 14:25:09.165679
- Title: Delay-Tolerant Constrained OCO with Application to Network Resource
Allocation
- Title(参考訳): 遅延耐性OCOとネットワークリソース割り当てへの応用
- Authors: Juncheng Wang, Ben Liang, Min Dong, Gary Boudreau, and Hatem Abou-zeid
- Abstract要約: マルチスロットフィードバック遅延によるオンライン凸最適化(OCO)を検討します。
エージェントは、時間変動凸損失関数の蓄積を最小限に抑えるために、一連のオンライン決定を行う。
情報フィードバックと意思決定の更新の非同期性に取り組むために,二重正規化による新たな制約ペナルティを用いた遅延耐性制約OCOを提案する。
- 参考スコア(独自算出の注目度): 44.67787270821051
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider online convex optimization (OCO) with multi-slot feedback delay,
where an agent makes a sequence of online decisions to minimize the
accumulation of time-varying convex loss functions, subject to short-term and
long-term constraints that are possibly time-varying. The current convex loss
function and the long-term constraint function are revealed to the agent only
after the decision is made, and they may be delayed for multiple time slots.
Existing work on OCO under this general setting has focused on the static
regret, which measures the gap of losses between the online decision sequence
and an offline benchmark that is fixed over time. In this work, we consider
both the static regret and the more practically meaningful dynamic regret,
where the benchmark is a time-varying sequence of per-slot optimizers. We
propose an efficient algorithm, termed Delay-Tolerant Constrained-OCO
(DTC-OCO), which uses a novel constraint penalty with double regularization to
tackle the asynchrony between information feedback and decision updates. We
derive upper bounds on its dynamic regret, static regret, and constraint
violation, proving them to be sublinear under mild conditions. We further apply
DTC-OCO to a general network resource allocation problem, which arises in many
systems such as data networks and cloud computing. Simulation results
demonstrate substantial performance gain of DTC-OCO over the known best
alternative.
- Abstract(参考訳): 我々は,複数スロットのフィードバック遅延を伴うオンライン凸最適化(OCO)を考察し,エージェントが時間変化のある凸損失関数の蓄積を最小限に抑えるために一連のオンライン決定を行う。
現在の凸損失関数と長期制約関数は、決定が下された後のみエージェントに明らかにされ、複数のタイムスロットで遅延する可能性がある。
OCOに関するこれまでの作業は、オンライン決定シーケンスとオフラインベンチマークの間の損失のギャップを計測する静的な後悔に焦点を当てており、時間とともに修正されている。
本研究では、静的な後悔とより実践的に意味のあるダイナミックな後悔の両方を考慮し、ベンチマークはスロットごとの最適化の時間変化シーケンスである。
我々は,情報フィードバックと意思決定更新の同期に対処するために,新たな制約ペナルティと二重正規化を用いた効率的なアルゴリズムDTC-OCO(Delay-Tolerant Constrained-OCO)を提案する。
我々は、その動的後悔、静的後悔、および制約違反の上限を導出し、穏やかな条件下では劣線型であることを証明する。
さらにDTC-OCOを,データネットワークやクラウドコンピューティングなど多くのシステムで発生する一般的なネットワークリソース割り当て問題に適用する。
シミュレーションの結果, DTC-OCOは, 既知の最良の代替品よりもかなり高い性能を示した。
関連論文リスト
- Client Orchestration and Cost-Efficient Joint Optimization for
NOMA-Enabled Hierarchical Federated Learning [55.49099125128281]
半同期クラウドモデルアグリゲーションの下で非直交多重アクセス(NOMA)を実現するHFLシステムを提案する。
提案手法は,HFLの性能改善と総コスト削減に関するベンチマークよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-11-03T13:34:44Z) - Learning Spatio-Temporal Aggregations for Large-Scale Capacity Expansion
Problems [0.0]
キャパシティ拡張問題(CEP)は、ネットワークサイズが大きく、不均一なノード特性があり、多くの運用期間があるため、解決する費用がかかる。
本稿では、異種ノードを持つ汎用CEPの時間的アグリゲーションを識別するための新しいグラフ畳み込みオートエンコーダ手法を提案する。
提案手法は, ベンチマーク空間(時空間)集約手法よりも33%(resp. 10%)低い上限を与える。
論文 参考訳(メタデータ) (2023-03-16T00:00:52Z) - Online Convex Optimization with Long Term Constraints for Predictable
Sequences [5.964436882344728]
我々は,長期的制約を伴うOCOと呼ばれるOCOの特定の枠組みについて検討する。
長期的制約は、オンライン最適化における更新ステップ毎に、プロジェクションの複雑さを減らす代替手段として導入される。
我々は,次の関数の情報をシーケンスで供給できる予測器を用いて,予測なしで達成できる率よりも厳密に少ない,全体的な後悔と制約違反率を達成することができることを示した。
論文 参考訳(メタデータ) (2022-10-30T03:50:53Z) - Effective Multi-User Delay-Constrained Scheduling with Deep Recurrent
Reinforcement Learning [28.35473469490186]
マルチユーザ遅延制約スケジューリングは、無線通信、ライブストリーミング、クラウドコンピューティングを含む多くの現実世界アプリケーションにおいて重要である。
Recurrent Softmax Delayed Deep Double Deterministic Policy Gradient (mathttRSD4$) という深部強化学習アルゴリズムを提案する。
$mathttRSD4$は、それぞれLagrangianのデュアルと遅延に敏感なキューによるリソースと遅延の制約を保証する。
また、リカレントニューラルネットワーク(RNN)によって実現されたメモリ機構により、部分的可観測性にも効率よく取り組み、ユーザレベルの分解とノードレベルを導入している。
論文 参考訳(メタデータ) (2022-08-30T08:44:15Z) - Augmented Lagrangian Methods for Time-varying Constrained Online Convex
Optimization [1.662966122370634]
オンライン凸最適化(OCO)と時間的損失と制約関数について検討する。
まず,時間変動関数制約OCOのためのモデルベース拡張ラグランジアン法(MALM)のクラスを開発する。
提案アルゴリズムの効率性を示すために, 制約OCOのいくつかの例について数値計算を行った。
論文 参考訳(メタデータ) (2022-05-19T14:03:25Z) - Adaptivity and Non-stationarity: Problem-dependent Dynamic Regret for Online Convex Optimization [70.4342220499858]
本稿では,スムーズさを生かし,問題依存量による動的後悔のT$への依存を補う新しいオンラインアルゴリズムを提案する。
この結果が本質的な難易度に適応しているのは, 既往の結果よりも厳密であり, 最悪の場合, 同一レートの保護が可能であるからである。
論文 参考訳(メタデータ) (2021-12-29T02:42:59Z) - Non-stationary Online Learning with Memory and Non-stochastic Control [71.14503310914799]
我々は,過去の決定に依拠する損失関数を許容するメモリを用いたオンライン凸最適化(OCO)の問題について検討する。
本稿では,非定常環境に対してロバストなアルゴリズムを設計するための性能指標として,動的ポリシーの後悔を紹介する。
我々は,時間的地平線,非定常度,メモリ長といった面で,最適な動的ポリシーの後悔を確実に享受するメモリ付きOCOの新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-02-07T09:45:15Z) - Combining Deep Learning and Optimization for Security-Constrained
Optimal Power Flow [94.24763814458686]
セキュリティに制約のある最適電力フロー(SCOPF)は、電力システムの基本である。
SCOPF問題におけるAPRのモデル化は、複雑な大規模混合整数プログラムをもたらす。
本稿では,ディープラーニングとロバスト最適化を組み合わせた新しい手法を提案する。
論文 参考訳(メタデータ) (2020-07-14T12:38:21Z) - Dynamic Regret of Convex and Smooth Functions [93.71361250701075]
非定常環境におけるオンライン凸最適化について検討する。
パフォーマンス指標として動的後悔を選択します。
本研究では, 滑らかさを活かして, 動的後悔をさらに高めることが可能であることを示す。
論文 参考訳(メタデータ) (2020-07-07T14:10:57Z) - Online Convex Optimization with Binary Constraints [0.04170934882758551]
2値決定変数と凸損失関数を用いたオンライン最適化について検討する。
我々は、新しいアルゴリズム、バイナリオンライン勾配降下(bOGD)を設計し、その期待された動的後悔を束縛する。
需要応答に基づく複数のシミュレーションでbOGDの性能を検証した。
論文 参考訳(メタデータ) (2020-05-05T15:09:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。