論文の概要: Human-in-the-Loop Bandwidth Estimation for Quality of Experience Optimization in Real-Time Video Communication
- arxiv url: http://arxiv.org/abs/2510.12265v1
- Date: Tue, 14 Oct 2025 08:18:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-15 19:02:32.244098
- Title: Human-in-the-Loop Bandwidth Estimation for Quality of Experience Optimization in Real-Time Video Communication
- Title(参考訳): 実時間ビデオ通信におけるユーザ体験の最適化のための帯域幅推定
- Authors: Sami Khairy, Gabriel Mittag, Vishak Gopal, Ross Cutler,
- Abstract要約: リアルタイム通信の帯域幅推定は依然としてオープンな課題である。
そこで本稿では,これらの課題に対処するための帯域幅推定のための,ヒューマン・イン・ザ・ループ(Human-in-the-loop)なデータ駆動フレームワークを提案する。
- 参考スコア(独自算出の注目度): 16.82306116067726
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The quality of experience (QoE) delivered by video conferencing systems is significantly influenced by accurately estimating the time-varying available bandwidth between the sender and receiver. Bandwidth estimation for real-time communications remains an open challenge due to rapidly evolving network architectures, increasingly complex protocol stacks, and the difficulty of defining QoE metrics that reliably improve user experience. In this work, we propose a deployed, human-in-the-loop, data-driven framework for bandwidth estimation to address these challenges. Our approach begins with training objective QoE reward models derived from subjective user evaluations to measure audio and video quality in real-time video conferencing systems. Subsequently, we collect roughly $1$M network traces with objective QoE rewards from real-world Microsoft Teams calls to curate a bandwidth estimation training dataset. We then introduce a novel distributional offline reinforcement learning (RL) algorithm to train a neural-network-based bandwidth estimator aimed at improving QoE for users. Our real-world A/B test demonstrates that the proposed approach reduces the subjective poor call ratio by $11.41\%$ compared to the baseline bandwidth estimator. Furthermore, the proposed offline RL algorithm is benchmarked on D4RL tasks to demonstrate its generalization beyond bandwidth estimation.
- Abstract(参考訳): ビデオ会議システムによって提供される品質・オブ・エクスペリエンス(QoE)は、送信側と受信側の間の時間変化可能な帯域幅を正確に推定することによって大きく影響を受ける。
リアルタイム通信のための帯域推定は、急速に進化するネットワークアーキテクチャ、ますます複雑なプロトコルスタック、そしてユーザエクスペリエンスを確実に改善するQoEメトリクスを定義することの難しさによって、依然としてオープンな課題である。
そこで本研究では,これらの課題に対処するための帯域幅推定のための,Human-in-the-loop, data-driven frameworkを提案する。
提案手法は,リアルタイムビデオ会議システムにおいて,主観的ユーザ評価から得られたQoE報酬モデルの学習から始まる。
その後、現実世界のMicrosoft TeamsコールからQoE報酬を目標とする約1億ドルのネットワークトレースを収集し、帯域幅推定トレーニングデータセットをキュレートします。
そこで我々は,QoE改善を目的としたニューラルネットワークに基づく帯域幅推定器を学習するための,分散オフライン強化学習(RL)アルゴリズムを提案する。
実世界のA/Bテストでは,提案手法はベースライン帯域幅推定器と比較して主観的不適切な呼び出し率を11.41\%削減することを示した。
さらに,提案したオフラインRLアルゴリズムをD4RLタスク上でベンチマークし,帯域幅推定以上の一般化を実証する。
関連論文リスト
- Satellite Streaming Video QoE Prediction: A Real-World Subjective Database and Network-Level Prediction Models [59.061552498630874]
LIVE-Viasat Real-World Satellite QoE Databaseを紹介する。
このデータベースは、現実世界のストリーミングサービスから記録された179のビデオで構成されている。
本稿では,QoE予測モデルの有効性を評価することで,この新たな資源の有用性を実証する。
また、ネットワークパラメータを予測された人間の知覚スコアにマッピングする新しいモデルを作成しました。
論文 参考訳(メタデータ) (2024-10-17T18:22:50Z) - Multi-Task Decision-Making for Multi-User 360 Video Processing over Wireless Networks [9.642593500545997]
無線マルチユーザーバーチャルリアリティ(VR)システムにおいて,360度ビデオ処理におけるマルチタスク決定問題について検討する。
これはデータボリュームと帯域幅の増大を犠牲にしている。
本稿では,ビデオフレーム間の再バッファリング時間と品質変化がユーザおよびビデオ要求に依存する,制約付きクオリティ・オブ・エクスペリエンス(QoE)問題を提案する。
論文 参考訳(メタデータ) (2024-07-03T18:09:25Z) - Offline to Online Learning for Real-Time Bandwidth Estimation [18.33604214120801]
リアルタイムビデオアプリケーションは、様々なネットワーク条件でユーザエクスペリエンスを維持するために正確な推定を必要とする。
本稿では,データ駆動更新による帯域幅ベースのメソッドのパラメータチューニングを手動で置き換える,模倣学習ベースのソリューションであるMerlinを提案する。
論文 参考訳(メタデータ) (2023-09-23T21:39:51Z) - Low Complexity Adaptive Machine Learning Approaches for End-to-End
Latency Prediction [0.0]
この研究は、予測、監視、予測のための効率的で低コストな適応アルゴリズムの設計である。
我々は,GNNにおける近年の国際的課題の後に提供されたパブリックジェネレータから得られるデータに対して,我々のアプローチと結果を説明するために,エンドツーエンドの遅延予測に焦点を当てた。
論文 参考訳(メタデータ) (2023-01-31T10:29:11Z) - Neighbourhood Representative Sampling for Efficient End-to-end Video
Quality Assessment [60.57703721744873]
リアルタイムビデオの高解像度化は、VQA(Deep Video Quality Assessment)の効率性と精度のジレンマを示す
そこで本研究では,空間時空間格子型ミニキューブサンプリング(St-GMS)を統一的に提案し,新しいタイプのフラグメントを抽出する。
フラグメントとFANetにより、提案された効率的なエンドツーエンドのFAST-VQAとFasterVQAは、既存のVQAベンチマークよりも大幅にパフォーマンスが向上した。
論文 参考訳(メタデータ) (2022-10-11T11:38:07Z) - Low-Latency Federated Learning over Wireless Channels with Differential
Privacy [142.5983499872664]
フェデレートラーニング(FL)では、モデルトレーニングはクライアントに分散し、ローカルモデルは中央サーバによって集約される。
本稿では,各クライアントの差分プライバシ(DP)要件だけでなく,全体としてのトレーニング性能に制約された無線チャネル上でのFLトレーニング遅延を最小限に抑えることを目的とする。
論文 参考訳(メタデータ) (2021-06-20T13:51:18Z) - A Deep Value-network Based Approach for Multi-Driver Order Dispatching [55.36656442934531]
そこで本研究では,注文発送のための深層強化学習に基づくソリューションを提案する。
DiDiの配車プラットフォーム上で大規模なオンラインA/Bテストを実施している。
その結果,CVNetは近年提案されているディスパッチ手法よりも一貫して優れていた。
論文 参考訳(メタデータ) (2021-06-08T16:27:04Z) - Feeling of Presence Maximization: mmWave-Enabled Virtual Reality Meets
Deep Reinforcement Learning [76.46530937296066]
本稿では,無線モバイルユーザに対して,超信頼性でエネルギー効率のよいバーチャルリアリティ(VR)体験を提供するという課題について検討する。
モバイルユーザへの信頼性の高い超高精細ビデオフレーム配信を実現するために,コーディネートマルチポイント(CoMP)伝送技術とミリ波(mmWave)通信を利用する。
論文 参考訳(メタデータ) (2021-06-03T08:35:10Z) - Real-world Video Adaptation with Reinforcement Learning [38.26695924173461]
クライアント側ビデオプレーヤーは、ユーザ品質のエクスペリエンス(QoE)を最適化するためにアダプティブ(ABR)アルゴリズムを使用する
我々は、Facebookのウェブベースの動画ストリーミングプラットフォームにおいて、最近提案されたRLベースのABR手法を評価した。
3000万以上のビデオストリーミングセッションを持つ1週間の全世界展開において、我々のRLアプローチは、既存の人間工学的ABRアルゴリズムよりも優れています。
論文 参考訳(メタデータ) (2020-08-28T21:44:24Z) - Non-Cooperative Game Theory Based Rate Adaptation for Dynamic Video
Streaming over HTTP [89.30855958779425]
Dynamic Adaptive Streaming over HTTP (DASH)は、新興かつ有望なマルチメディアストリーミング技術であることを示した。
本稿では,サーバの限られた輸出帯域幅をマルチユーザに対して最適に割り当てるアルゴリズムを提案し,その品質・オブ・エクスペリエンス(QoE)を公平性で最大化する。
論文 参考訳(メタデータ) (2019-12-27T01:19:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。