論文の概要: Smoothed Online Optimization for Target Tracking: Robust and Learning-Augmented Algorithms
- arxiv url: http://arxiv.org/abs/2509.05930v1
- Date: Sun, 07 Sep 2025 05:22:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-09 14:07:03.785343
- Title: Smoothed Online Optimization for Target Tracking: Robust and Learning-Augmented Algorithms
- Title(参考訳): Smoothed Online Optimization for Target Tracking: Robust and Learning-Augmented Algorithms
- Authors: Ali Zeynali, Mahsa Sahebdel, Qingsong Liu, Mohammad Hajiesmaili, Ramesh K. Sitaraman,
- Abstract要約: 我々は,不確実性の下でのオンライン意思決定において,3つの重要な目標を統合する新しい枠組みを導入する。
まず、SOOTTの競合保証を証明可能な頑健なアルゴリズムであるBESTを紹介する。
実用性能を向上させるために,信頼できないブラックボックス予測を組み込んだ学習拡張型であるCoRTを導入する。
- 参考スコア(独自算出の注目度): 14.970453355735225
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce the Smoothed Online Optimization for Target Tracking (SOOTT) problem, a new framework that integrates three key objectives in online decision-making under uncertainty: (1) tracking cost for following a dynamically moving target, (2) adversarial perturbation cost for withstanding unpredictable disturbances, and (3) switching cost for penalizing abrupt changes in decisions. This formulation captures real-world scenarios such as elastic and inelastic workload scheduling in AI clusters, where operators must balance long-term service-level agreements (e.g., LLM training) against sudden demand spikes (e.g., real-time inference). We first present BEST, a robust algorithm with provable competitive guarantees for SOOTT. To enhance practical performance, we introduce CoRT, a learning-augmented variant that incorporates untrusted black-box predictions (e.g., from ML models) into its decision process. Our theoretical analysis shows that CoRT strictly improves over BEST when predictions are accurate, while maintaining robustness under arbitrary prediction errors. We validate our approach through a case study on workload scheduling, demonstrating that both algorithms effectively balance trajectory tracking, decision smoothness, and resilience to external disturbances.
- Abstract(参考訳): Smoothed Online Optimization for Target Tracking (SOOTT) 問題,(1) 動的に動くターゲットを追従するためのトラッキングコスト,(2) 予測不能な障害に対処するための逆摂動コスト,(3) 急激な決定変更を罰する切り替えコストという,オンライン意思決定における3つの重要な目標を統合する新たなフレームワークを導入する。
この定式化は、AIクラスタにおける弾力性と非弾性なワークロードスケジューリングのような現実世界のシナリオをキャプチャします。
まず、SOOTTの競合保証を証明可能な頑健なアルゴリズムであるBESTを紹介する。
実用性能を向上させるために,信頼できないブラックボックス予測(例えばMLモデルからのブラックボックス予測)をその決定プロセスに組み込んだ学習拡張型であるCoRTを導入する。
理論的解析により,任意の予測誤差下では頑健性を維持しつつ,予測精度がBESTよりも厳格に向上することが示された。
作業負荷スケジューリングのケーススタディを通じて、両方のアルゴリズムが軌道追跡、決定の滑らかさ、外乱に対するレジリエンスを効果的にバランスしていることを検証する。
関連論文リスト
- Dynamic Epsilon Scheduling: A Multi-Factor Adaptive Perturbation Budget for Adversarial Training [1.5558386948322986]
敵のトレーニングは、敵の例からニューラルネットワークを守るための最も効果的な戦略の1つである。
既存の敵の訓練アプローチは固定的な摂動予算に依存しており、堅牢性に特有な特性を考慮できない。
本研究では,動的Epsilon Scheduling(DES)を提案する。このフレームワークは,インスタンスごとの対向摂動予算を適応的に調整し,トレーニングインスタンス毎に調整する。
論文 参考訳(メタデータ) (2025-06-03T04:18:53Z) - Global-Decision-Focused Neural ODEs for Proactive Grid Resilience Management [50.34345101758248]
本稿では,機能停止予測とグローバルに最適化された介入を統合するフレームワークPATOGを提案する。
提案手法は,空間的かつ時間的に整合性のある意思決定を保証し,予測精度と操作効率を両立させる。
合成および実世界のデータセットの実験では、停止予測一貫性とグリッドレジリエンスが大幅に改善された。
論文 参考訳(メタデータ) (2025-02-25T16:15:35Z) - Optimistic Online Non-stochastic Control via FTRL [10.25772015681554]
本稿では、オンライン非確率制御の新しいフレームワークに「楽観主義」の概念をもたらす。
信頼できない予測をオンラインコントロールに組み込むことの課題に対処することにより、NSCフレームワークの進歩に寄与する。
論文 参考訳(メタデータ) (2024-04-04T09:08:04Z) - Actively Learning Reinforcement Learning: A Stochastic Optimal Control Approach [3.453622106101339]
本研究では,2つの相互に結びついた目的を達成するための枠組みを提案する。 (i) 積極的な探索と意図的な情報収集を伴う強化学習と, (ii) 最適制御法の計算的難易度を克服する枠組みである。
我々は、強化学習を用いて最適制御則を計算することにより、両方の目的にアプローチする。
一定の探索と搾取バランスとは異なり、学習プロセスが終了しても、警告と探索はリアルタイムでコントローラによって自動的に行われる。
論文 参考訳(メタデータ) (2023-09-18T18:05:35Z) - FIRE: A Failure-Adaptive Reinforcement Learning Framework for Edge Computing Migrations [52.85536740465277]
FIREは、エッジコンピューティングのディジタルツイン環境でRLポリシーをトレーニングすることで、まれなイベントに適応するフレームワークである。
ImREは重要なサンプリングに基づくQ-ラーニングアルゴリズムであり、希少事象をその値関数への影響に比例してサンプリングする。
FIREは故障時にバニラRLやグリーディベースラインと比較してコストを削減できることを示す。
論文 参考訳(メタデータ) (2022-09-28T19:49:39Z) - Non-stationary Online Learning with Memory and Non-stochastic Control [71.14503310914799]
我々は,過去の決定に依拠する損失関数を許容するメモリを用いたオンライン凸最適化(OCO)の問題について検討する。
本稿では,非定常環境に対してロバストなアルゴリズムを設計するための性能指標として,動的ポリシーの後悔を紹介する。
我々は,時間的地平線,非定常度,メモリ長といった面で,最適な動的ポリシーの後悔を確実に享受するメモリ付きOCOの新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-02-07T09:45:15Z) - Optimal Robustness-Consistency Trade-offs for Learning-Augmented Online
Algorithms [85.97516436641533]
機械学習予測を取り入れたオンラインアルゴリズムの性能向上の課題について検討する。
目標は、一貫性と堅牢性の両方を備えたアルゴリズムを設計することだ。
機械学習予測を用いた競合解析のための非自明な下界の最初のセットを提供する。
論文 参考訳(メタデータ) (2020-10-22T04:51:01Z) - Combining Deep Learning and Optimization for Security-Constrained
Optimal Power Flow [94.24763814458686]
セキュリティに制約のある最適電力フロー(SCOPF)は、電力システムの基本である。
SCOPF問題におけるAPRのモデル化は、複雑な大規模混合整数プログラムをもたらす。
本稿では,ディープラーニングとロバスト最適化を組み合わせた新しい手法を提案する。
論文 参考訳(メタデータ) (2020-07-14T12:38:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。