論文の概要: Real-world Video Adaptation with Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2008.12858v1
- Date: Fri, 28 Aug 2020 21:44:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-24 02:22:55.315808
- Title: Real-world Video Adaptation with Reinforcement Learning
- Title(参考訳): 強化学習による実世界の映像適応
- Authors: Hongzi Mao, Shannon Chen, Drew Dimmery, Shaun Singh, Drew Blaisdell,
Yuandong Tian, Mohammad Alizadeh, Eytan Bakshy
- Abstract要約: クライアント側ビデオプレーヤーは、ユーザ品質のエクスペリエンス(QoE)を最適化するためにアダプティブ(ABR)アルゴリズムを使用する
我々は、Facebookのウェブベースの動画ストリーミングプラットフォームにおいて、最近提案されたRLベースのABR手法を評価した。
3000万以上のビデオストリーミングセッションを持つ1週間の全世界展開において、我々のRLアプローチは、既存の人間工学的ABRアルゴリズムよりも優れています。
- 参考スコア(独自算出の注目度): 38.26695924173461
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Client-side video players employ adaptive bitrate (ABR) algorithms to
optimize user quality of experience (QoE). We evaluate recently proposed
RL-based ABR methods in Facebook's web-based video streaming platform.
Real-world ABR contains several challenges that requires customized designs
beyond off-the-shelf RL algorithms -- we implement a scalable neural network
architecture that supports videos with arbitrary bitrate encodings; we design a
training method to cope with the variance resulting from the stochasticity in
network conditions; and we leverage constrained Bayesian optimization for
reward shaping in order to optimize the conflicting QoE objectives. In a
week-long worldwide deployment with more than 30 million video streaming
sessions, our RL approach outperforms the existing human-engineered ABR
algorithms.
- Abstract(参考訳): クライアント側ビデオプレーヤーは、ユーザ品質のエクスペリエンス(QoE)を最適化するためにアダプティブビットレート(ABR)アルゴリズムを使用する。
facebook の web ベースのビデオストリーミングプラットフォームで最近提案された rl ベースの abr メソッドを評価した。
実世界のabrには、市販のrlアルゴリズム以上のカスタマイズ設計を必要とするいくつかの課題が含まれている -- 任意のビットレートエンコーディングを持つビデオをサポートするスケーラブルなニューラルネットワークアーキテクチャを実装し、ネットワーク条件の確率性に起因する分散に対処するためのトレーニング方法を設計し、競合するqoe目標を最適化するために制限付きベイズ最適化を利用する。
3000万以上のビデオストリーミングセッションを持つ1週間の全世界展開において、我々のRLアプローチは、既存の人間工学的ABRアルゴリズムよりも優れています。
関連論文リスト
- EPS: Efficient Patch Sampling for Video Overfitting in Deep Super-Resolution Model Training [15.684865589513597]
ビデオSRネットワークオーバーフィッティングのための効率的なパッチサンプリング手法であるEPSを提案する。
本手法は,クラスタの解像度や数に応じて,トレーニング用パッチの数を4%から25%に削減する。
最新のパッチサンプリング手法であるEMTと比較して,本手法は全体の実行時間を83%削減する。
論文 参考訳(メタデータ) (2024-11-25T12:01:57Z) - Reinforcement Learning -based Adaptation and Scheduling Methods for
Multi-source DASH [1.1971219484941955]
HTTP(DASH)上の動的適応ストリーミングは、最近ビデオストリーミングで広く使われている。
マルチソースストリーミングでは、ネットワークパスの異なる条件のために、ビデオチャンクが順番に到着する可能性がある。
本稿では,複数のソースからストリーミングする2つのアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-07-25T06:47:12Z) - Predictive GAN-powered Multi-Objective Optimization for Hybrid Federated
Split Learning [56.125720497163684]
無線ネットワークにおけるハイブリッド・フェデレーション・スプリット・ラーニング・フレームワークを提案する。
ラベル共有のないモデル分割のための並列計算方式を設計し,提案方式が収束速度に与える影響を理論的に解析する。
論文 参考訳(メタデータ) (2022-09-02T10:29:56Z) - An Adaptive Device-Edge Co-Inference Framework Based on Soft
Actor-Critic [72.35307086274912]
高次元パラメータモデルと大規模数学的計算は、特にIoT(Internet of Things)デバイスにおける実行効率を制限する。
本稿では,ソフトポリシーの繰り返しによるエフェキシット点,エフェキシット点,エンフェキシット点を生成する離散的(SAC-d)のための新しい深層強化学習(DRL)-ソフトアクタ批判法を提案する。
レイテンシと精度を意識した報酬設計に基づいて、そのような計算は動的無線チャンネルや任意の処理のような複雑な環境によく適応でき、5G URLをサポートすることができる。
論文 参考訳(メタデータ) (2022-01-09T09:31:50Z) - Cross Layer Optimization and Distributed Reinforcement Learning for Wireless 360° Video Streaming [54.60967639512643]
本稿では,各ユーザに対して利用可能なレートを最大化し,ユーザのQoEを最大化するために効率的に利用するクロスレイヤ最適化手法を提案する。
この問題を2つの相互関連サブプロブレムに分解できることを示す。
複数の独立エージェントの並列学習を活用し,アプリケーション層サブプロブレムを解くために,アクタ・クリティカル・ディープ・強化学習(DRL)を提案する。
論文 参考訳(メタデータ) (2020-11-12T12:59:10Z) - NANCY: Neural Adaptive Network Coding methodologY for video distribution
over wireless networks [1.636104578028594]
NANCYは、ビデオおよび適応ネットワーク符号化レート(ANCR)のための適応ビットレート(ABR)を生成するシステムである。
NANCYは、QoE(Quality of Experience)メトリクスとして定式化された報酬でニューラルネットワークモデルをトレーニングする。
その結果,NANCYはペンシーブやロバストMPCよりも平均QoEが29.91%,60.34%高い値を示した。
論文 参考訳(メタデータ) (2020-08-21T15:55:32Z) - Meta-Reinforcement Learning for Trajectory Design in Wireless UAV
Networks [151.65541208130995]
ドローン基地局(DBS)は、要求が動的で予測不可能な地上ユーザーへのアップリンク接続を提供するために派遣される。
この場合、DBSの軌道は動的ユーザアクセス要求を満たすように適応的に調整されなければならない。
新たな環境に遭遇したDBSの軌道に適応するために,メタラーニングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-05-25T20:43:59Z) - AOWS: Adaptive and optimal network width search with latency constraints [30.39613826468697]
チャネル番号を最適に探索する新しい一発一発NAS手法を提案する。
ImageNet分類実験により,異なるターゲットプラットフォーム上でのリソース制約に適合するネットワークを見つけることができた。
論文 参考訳(メタデータ) (2020-05-21T06:46:16Z) - Non-Cooperative Game Theory Based Rate Adaptation for Dynamic Video
Streaming over HTTP [89.30855958779425]
Dynamic Adaptive Streaming over HTTP (DASH)は、新興かつ有望なマルチメディアストリーミング技術であることを示した。
本稿では,サーバの限られた輸出帯域幅をマルチユーザに対して最適に割り当てるアルゴリズムを提案し,その品質・オブ・エクスペリエンス(QoE)を公平性で最大化する。
論文 参考訳(メタデータ) (2019-12-27T01:19:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。