論文の概要: Karma: Adaptive Video Streaming via Causal Sequence Modeling
- arxiv url: http://arxiv.org/abs/2308.10230v1
- Date: Sun, 20 Aug 2023 11:25:57 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-22 16:48:52.281541
- Title: Karma: Adaptive Video Streaming via Causal Sequence Modeling
- Title(参考訳): karma:causal sequence modelingによる適応型ビデオストリーミング
- Authors: Bowei Xu, Hao Chen and Zhan Ma
- Abstract要約: 最先端の学習ベースのABRアルゴリズムは、次のアクションを決定するために過去の観測にのみ依存している。
本稿では、因果シーケンスモデリングを用いて一般化を改善するABRアルゴリズムであるKarmaを提案する。
我々は、トレース駆動シミュレーションと実世界のフィールドテストを通してKarmaを評価し、既存の最先端ABRアルゴリズムと比較して優れた性能を示す。
- 参考スコア(独自算出の注目度): 24.299294432199186
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Optimal adaptive bitrate (ABR) decision depends on a comprehensive
characterization of state transitions that involve interrelated modalities over
time including environmental observations, returns, and actions. However,
state-of-the-art learning-based ABR algorithms solely rely on past observations
to decide the next action. This paradigm tends to cause a chain of deviations
from optimal action when encountering unfamiliar observations, which
consequently undermines the model generalization. This paper presents Karma, an
ABR algorithm that utilizes causal sequence modeling to improve generalization
by comprehending the interrelated causality among past observations, returns,
and actions and timely refining action when deviation occurs. Unlike direct
observation-to-action mapping, Karma recurrently maintains a multi-dimensional
time series of observations, returns, and actions as input and employs causal
sequence modeling via a decision transformer to determine the next action. In
the input sequence, Karma uses the maximum cumulative future quality of
experience (QoE) (a.k.a, QoE-to-go) as an extended return signal, which is
periodically estimated based on current network conditions and playback status.
We evaluate Karma through trace-driven simulations and real-world field tests,
demonstrating superior performance compared to existing state-of-the-art ABR
algorithms, with an average QoE improvement ranging from 10.8% to 18.7% across
diverse network conditions. Furthermore, Karma exhibits strong generalization
capabilities, showing leading performance under unseen networks in both
simulations and real-world tests.
- Abstract(参考訳): 最適適応ビットレート (ABR) の決定は、環境観測、リターン、行動を含む時間的相互関係のモダリティを含む状態遷移の包括的特徴づけに依存する。
しかし、最先端の学習ベースのABRアルゴリズムは、次のアクションを決定するために過去の観測にのみ依存している。
このパラダイムは、不慣れな観察に遭遇したときの最適動作からの逸脱の連鎖を引き起こす傾向があり、結果としてモデルの一般化を損なう。
本稿では,過去観測,帰納,行動間の相互因果関係を把握し,偏差発生時の時間的精錬動作を一般化するために,因果系列モデルを用いたabrアルゴリズムであるkarmaを提案する。
直接観測から行動へのマッピングとは異なり、カルマは入力として多次元の観測、返却、行動を繰り返し維持し、決定トランスフォーマを介して因果系列モデリングを用いて次の動作を決定する。
入力シーケンスでは、現在のネットワーク条件と再生状態に基づいて定期的に推定される拡張戻り信号として、最大累積将来の品質(QoE、QoE-to-go)を使用する。
トレース駆動シミュレーションと実世界のフィールドテストによりカルマを評価し、既存の最先端のabrアルゴリズムよりも優れた性能を示し、ネットワーク条件における平均qoe改善率は10.8%から18.7%であった。
さらに、カルマは強力な一般化能力を示し、シミュレーションと実世界のテストの両方において、未知のネットワーク下で主要な性能を示す。
関連論文リスト
- Amortized Control of Continuous State Space Feynman-Kac Model for Irregular Time Series [14.400596021890863]
医療、気候、経済などの現実世界のデータセットは、しばしば不規則な時系列として収集される。
本稿では,連続状態空間モデル (ACSSM) を時系列の連続的動的モデリングに用いるためのアモータイズ制御を提案する。
論文 参考訳(メタデータ) (2024-10-08T01:27:46Z) - Bidirectional Decoding: Improving Action Chunking via Closed-Loop Resampling [51.38330727868982]
双方向デコーディング(BID)は、クローズドループ操作で動作チャンキングをブリッジするテスト時間推論アルゴリズムである。
BIDは、7つのシミュレーションベンチマークと2つの実世界のタスクにまたがって、最先端の2つの生成ポリシーの性能を向上させることを示す。
論文 参考訳(メタデータ) (2024-08-30T15:39:34Z) - Exploring the Performance of Continuous-Time Dynamic Link Prediction Algorithms [14.82820088479196]
ダイナミックリンク予測(DLP)は、進化するネットワークにおける将来のリンクの予測に対処する。
本研究では,このような総合的な評価を行うためのツールをコントリビュートする。
評価時に使用可能な陰性サンプリング手法の網羅的な分類法について述べる。
論文 参考訳(メタデータ) (2024-05-27T14:03:28Z) - Online Variational Sequential Monte Carlo [49.97673761305336]
我々は,計算効率が高く正確なモデルパラメータ推定とベイジアン潜在状態推定を提供する変分連続モンテカルロ法(VSMC)を構築した。
オンラインVSMCは、パラメータ推定と粒子提案適応の両方を効率よく、完全にオンザフライで実行することができる。
論文 参考訳(メタデータ) (2023-12-19T21:45:38Z) - Time-series Generation by Contrastive Imitation [87.51882102248395]
モーメントマッチングの目的によってモチベーションされ、複合的エラーを軽減し、局所的(しかし前方的な)遷移ポリシーを最適化する。
推論において、学習されたポリシーは反復的なサンプリングのジェネレータとして機能し、学習されたエネルギーはサンプルの品質を評価するための軌道レベル尺度として機能する。
論文 参考訳(メタデータ) (2023-11-02T16:45:25Z) - Consensus-Adaptive RANSAC [104.87576373187426]
本稿では,パラメータ空間の探索を学習する新しいRANSACフレームワークを提案する。
注意機構は、ポイント・ツー・モデル残差のバッチで動作し、軽量のワンステップ・トランスフォーマーで見いだされたコンセンサスを考慮するために、ポイント・ツー・モデル推定状態を更新する。
論文 参考訳(メタデータ) (2023-07-26T08:25:46Z) - Provably Efficient UCB-type Algorithms For Learning Predictive State
Representations [55.00359893021461]
逐次決定問題は、予測状態表現(PSR)によってモデル化された低ランク構造が認められる場合、統計的に学習可能である
本稿では,推定モデルと実モデル間の全変動距離を上限とする新しいボーナス項を特徴とする,PSRに対する最初のUCB型アプローチを提案する。
PSRに対する既存のアプローチとは対照的に、UCB型アルゴリズムは計算的トラクタビリティ、最優先の準最適ポリシー、モデルの精度が保証される。
論文 参考訳(メタデータ) (2023-07-01T18:35:21Z) - Robust Value Iteration for Continuous Control Tasks [99.00362538261972]
シミュレーションから物理システムへ制御ポリシを転送する場合、そのポリシは、動作の変動に対して堅牢でなければならない。
本稿では、動的プログラミングを用いて、コンパクトな状態領域上での最適値関数を計算するRobust Fitted Value Iterationを提案する。
より深い強化学習アルゴリズムや非ロバストなアルゴリズムと比較して、ロバストな値の方が頑健であることを示す。
論文 参考訳(メタデータ) (2021-05-25T19:48:35Z) - Adversarial and Contrastive Variational Autoencoder for Sequential
Recommendation [25.37244686572865]
本稿では、逐次レコメンデーションのためのAdversarial and Contrastive Variational Autoencoder (ACVAE) と呼ばれる新しい手法を提案する。
まず,本モデルが高品質な潜在変数を生成することを可能にするadversarial variational bayesフレームワークの下で,シーケンス生成のためのadversarial trainingを導入する。
さらに、シーケンスをエンコードする場合、シーケンス内のグローバルおよびローカルの関係をキャプチャするために、繰り返しおよび畳み込み構造を適用します。
論文 参考訳(メタデータ) (2021-03-19T09:01:14Z) - Temporal-Structure-Assisted Gradient Aggregation for Over-the-Air
Federated Edge Learning [24.248673415586413]
本稿では,モデル集約系列の固有時間構造を特徴付けるマルコフ確率モデルを提案する。
本研究では,時間構造支援勾配集約(TSA-GA)と呼ばれるメッセージパッシングアルゴリズムを開発し,この推定課題を満たす。
提案するtsagaアルゴリズムは最先端技術を大幅に上回り,同等の学習性能を達成可能であることを示す。
論文 参考訳(メタデータ) (2021-03-03T09:13:27Z) - Active Tuning [0.5801044612920815]
ニューラルネットワーク(RNN)の内部ダイナミクスを高速に最適化するための新しいパラダイムであるActive Tuningを紹介する。
従来のシーケンス間マッピング方式とは対照的に、Active Tuningは入力ストリームからRNNのリカレントニューラルアクティビティを分離する。
いくつかの時系列予測ベンチマークにおいてアクティブチューニングの有効性を示す。
論文 参考訳(メタデータ) (2020-10-02T20:21:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。