論文の概要: HRS: Hybrid Representation Framework with Scheduling Awareness for Time Series Forecasting in Crowdsourced Cloud-Edge Platforms
- arxiv url: http://arxiv.org/abs/2508.12839v2
- Date: Tue, 19 Aug 2025 11:02:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-20 13:30:22.898915
- Title: HRS: Hybrid Representation Framework with Scheduling Awareness for Time Series Forecasting in Crowdsourced Cloud-Edge Platforms
- Title(参考訳): HRS:クラウドソーシングクラウドエッジプラットフォームにおける時系列予測のためのスケジューリングアウェアネスを備えたハイブリッド表現フレームワーク
- Authors: Tiancheng Zhang, Cheng Zhang, Shuren Liu, Xiaofei Wang, Shaoyuan Huang, Wenyu Wang,
- Abstract要約: 我々は,過度の負荷動態をよりよく捉えるために,スケジューリングを意識したハイブリッド表現フレームワークであるHRSを提案する。
HRSは10基準を一貫して上回り、最先端のパフォーマンスを実現し、SLA違反率を63.1%削減し、総利益損失を32.3%削減した。
- 参考スコア(独自算出の注目度): 12.5891558742514
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the rapid proliferation of streaming services, network load exhibits highly time-varying and bursty behavior, posing serious challenges for maintaining Quality of Service (QoS) in Crowdsourced Cloud-Edge Platforms (CCPs). While CCPs leverage Predict-then-Schedule architecture to improve QoS and profitability, accurate load forecasting remains challenging under traffic surges. Existing methods either minimize mean absolute error, resulting in underprovisioning and potential Service Level Agreement (SLA) violations during peak periods, or adopt conservative overprovisioning strategies, which mitigate SLA risks at the expense of increased resource expenditure. To address this dilemma, we propose HRS, a hybrid representation framework with scheduling awareness that integrates numerical and image-based representations to better capture extreme load dynamics. We further introduce a Scheduling-Aware Loss (SAL) that captures the asymmetric impact of prediction errors, guiding predictions that better support scheduling decisions. Extensive experiments on four real-world datasets demonstrate that HRS consistently outperforms ten baselines and achieves state-of-the-art performance, reducing SLA violation rates by 63.1% and total profit loss by 32.3%.
- Abstract(参考訳): ストリーミングサービスの急激な普及に伴い、ネットワーク負荷は、非常に時間的に変化し、バースト的な振る舞いを示し、クラウドソースのCloud-Edge Platform(CCPs)におけるQuality of Service(QoS)を維持する上で深刻な課題となっている。
CCPは予測型スケジュールアーキテクチャを活用してQoSと収益性を向上させるが、トラフィックの急増下では正確な負荷予測は難しいままである。
既存の方法は、平均的な絶対誤差を最小化し、過度な計画と潜在的なサービスレベル合意(SLA)違反をもたらすか、あるいはリソース支出の増大を犠牲にしてSLAリスクを軽減する保守的なオーバープロビジョン戦略を採用するかのどちらかです。
このジレンマに対処するために,数値および画像に基づく表現を統合して,過度な負荷のダイナミクスを捉えるハイブリッド表現フレームワークであるHRSを提案する。
さらに、予測エラーの非対称な影響を捉え、スケジューリング決定をより良くサポートする予測を導くスケジュール対応損失(SAL)を導入する。
4つの実世界のデータセットに対する大規模な実験により、HRSは10のベースラインを一貫して上回り、最先端のパフォーマンスを実現し、SLA違反率を63.1%削減し、総利益損失を32.3%削減した。
関連論文リスト
- A Replicate-and-Quantize Strategy for Plug-and-Play Load Balancing of Sparse Mixture-of-Experts LLMs [64.8510381475827]
SMOE(Sparse Mixture-of-Experts)アーキテクチャは、大規模言語モデルを効率的にスケールするためにますます使われている。
SMoEモデルは専門家間で厳しい負荷不均衡に悩まされることが多く、専門家のごく一部がほとんどのトークンを受け取り、他のモデルは未利用である。
推定中のエキスパートルーティングの体系的解析を行い, (i) 負荷不均衡が持続し, バッチサイズが大きくなる, (ii) 選択頻度が, 専門家の重要度を確実に反映しない, (iii) 専門家の全体負荷と重要性を, キャリブレーションセットを用いて推定できる,という3つの知見を同定する。
論文 参考訳(メタデータ) (2026-02-23T15:11:16Z) - Proactive SFC Provisioning with Forecast-Driven DRL in Data Centers [5.886782001771578]
Service Function Chaining(SFC)は、さまざまなサービス要件を満たすために、Virtual Network Functions(VNF)の効率的な配置を必要とする。
本稿では,予測知能とSFCプロビジョニングを組み合わせたハイブリッドな予測駆動型深層強化学習フレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-28T04:00:13Z) - OpComm: A Reinforcement Learning Framework for Adaptive Buffer Control in Warehouse Volume Forecasting [28.715625330574966]
OpCommは、教師あり学習と強化学習ベースのバッファ制御を組み合わせた予測および意思決定支援フレームワークである。
400以上のステーションで、OpCommは手動の予測よりも21.65%の重み付き絶対パーセンテージエラー(WAPE)を減らした。
論文 参考訳(メタデータ) (2025-12-17T17:21:19Z) - GRPO-Guard: Mitigating Implicit Over-Optimization in Flow Matching via Regulated Clipping [63.33669214116784]
GRPO-Guardは、既存のGRPOフレームワークのシンプルで効果的な拡張である。
PPOクリッピングが有害な更新を適切に制限することを保証するため、バランスとステップ一貫性の重要度を回復する。
重いKL正則化に頼ることなく、暗黙の過最適化を実質的に緩和する。
論文 参考訳(メタデータ) (2025-10-25T14:51:17Z) - FairBatching: Fairness-Aware Batch Formation for LLM Inference [2.0917668141703207]
この研究は、この不公平の根本原因を特定する:時-時-時-(TBT)の非単調性
本稿では,タスクの充足と復号のリソース割り当てを公平に行う新しいシステムであるFair the Prioritizingを提案する。
論文 参考訳(メタデータ) (2025-10-16T07:43:56Z) - Continual Action Quality Assessment via Adaptive Manifold-Aligned Graph Regularization [53.82400605816587]
アクション品質アセスメント(AQA)は、ビデオにおける人間の行動を定量化し、スポーツスコアリング、リハビリテーション、スキル評価の応用を支援する。
大きな課題は、現実世界のシナリオにおける品質分布の非定常的な性質にある。
本稿では,進化する分布を扱うための連続学習機能を備えた連続AQA(Continuous AQA)を紹介する。
論文 参考訳(メタデータ) (2025-10-08T10:09:47Z) - Dynamic Speculative Agent Planning [57.630218933994534]
大規模な言語モデルベースのエージェントは、遅延の禁止と推論コストのために、重要なデプロイメント課題に直面している。
本稿では,オンライン強化学習フレームワークである動的投機計画(Dynamic Speculative Planning, DSP)を紹介する。
2つの標準エージェントベンチマークの実験では、DSPは高速加速法に匹敵する効率を達成し、総コストを30%削減し、不要コストを60%まで削減している。
論文 参考訳(メタデータ) (2025-09-02T03:34:36Z) - Adaptive Request Scheduling for CodeLLM Serving with SLA Guarantees [6.110847503516972]
既存の大規模言語モデル(CodeMs)は、現代のソフトウェア開発にますます統合されています。
しかし、セルフホスト環境は、リソース制約のあるサービス環境において重要な課題である。
要求毎のSLAの実現可能性と意思決定をリアルタイムで予測する動的戦略であるSABERを提案する。
以上の結果から,SLAを意識した適応スケジューリングが,堅牢で高性能なCodeLL提供の鍵となることを示す。
論文 参考訳(メタデータ) (2025-06-24T14:44:33Z) - Scalability Optimization in Cloud-Based AI Inference Services: Strategies for Real-Time Load Balancing and Automated Scaling [1.3689475854650441]
本研究では,クラウドAI推論サービスのための拡張性最適化フレームワークを提案する。
提案モデルは,適応負荷分布に対する強化学習と,正確な需要予測のためのディープニューラルネットワークを組み合わせたハイブリッドアプローチである。
実験の結果,提案モデルでは負荷分散効率を35倍に向上し,応答遅延を28。
論文 参考訳(メタデータ) (2025-04-16T04:00:04Z) - Privacy-Preserving Distributed Learning for Residential Short-Term Load
Forecasting [11.185176107646956]
電力システムの負荷データは、住宅ユーザの日常のルーチンを不注意に明らかにし、彼らの財産のセキュリティにリスクを及ぼす可能性がある。
我々はマルコフスイッチ方式の分散学習フレームワークを導入し、その収束は厳密な理論的解析によって実証される。
実世界の電力系統負荷データを用いたケーススタディにより,提案アルゴリズムの有効性を検証した。
論文 参考訳(メタデータ) (2024-02-02T16:39:08Z) - Client Orchestration and Cost-Efficient Joint Optimization for
NOMA-Enabled Hierarchical Federated Learning [55.49099125128281]
半同期クラウドモデルアグリゲーションの下で非直交多重アクセス(NOMA)を実現するHFLシステムを提案する。
提案手法は,HFLの性能改善と総コスト削減に関するベンチマークよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-11-03T13:34:44Z) - Efficient Parallel Split Learning over Resource-constrained Wireless
Edge Networks [44.37047471448793]
本稿では,エッジコンピューティングパラダイムと並列分割学習(PSL)の統合を提唱する。
そこで本研究では,モデル学習を高速化するために,効率的な並列分割学習(EPSL)という革新的なPSLフレームワークを提案する。
提案するEPSLフレームワークは,目標精度を達成するために必要なトレーニング遅延を著しく低減することを示す。
論文 参考訳(メタデータ) (2023-03-26T16:09:48Z) - Guaranteed Dynamic Scheduling of Ultra-Reliable Low-Latency Traffic via
Conformal Prediction [72.59079526765487]
アップリンクにおける超信頼性・低遅延トラフィック(URLLC)の動的スケジューリングは、既存のサービスの効率を大幅に向上させることができる。
主な課題は、URLLCパケット生成のプロセスにおける不確実性である。
本稿では,URLLC トラフィック予測器の品質に関わらず,信頼性と遅延を保証した新しい URLLC パケットスケジューラを提案する。
論文 参考訳(メタデータ) (2023-02-15T14:09:55Z) - CAROL: Confidence-Aware Resilience Model for Edge Federations [13.864161788250856]
本稿では、メモリ効率の良い生成ニューラルネットワークを用いて、将来状態のQuality of Service(QoS)を予測し、各予測に対する信頼度スコアを推定する信頼性認識型レジリエンスモデルCAROLを提案する。
CAROLは、エネルギー消費、期限違反率、レジリエンスオーバーヘッドを最大16、17、36パーセント削減することで、最先端のレジリエンススキームより優れています。
論文 参考訳(メタデータ) (2022-03-14T14:37:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。