論文の概要: qAttCNN - Self Attention Mechanism for Video QoE Prediction in Encrypted Traffic
- arxiv url: http://arxiv.org/abs/2601.06862v1
- Date: Sun, 11 Jan 2026 11:08:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-13 19:08:01.036875
- Title: qAttCNN - Self Attention Mechanism for Video QoE Prediction in Encrypted Traffic
- Title(参考訳): qAttCNN - 暗号化トラフィックにおけるビデオQoE予測のための自己注意機構
- Authors: Michael Sidorov, Ofer Hadar,
- Abstract要約: ビデオ会議アプリケーション(VCA)やWhatsAppやTelegramのようなインスタントメッセージングアプリケーション(IMA)は、ビデオ会議をコア機能としてサポートしている。
最新のVCAやIMAで一般的に使用されるエンドツーエンド暗号化は、ISPが元のメディアストリームにアクセスするのを防ぐ。
我々はQoE Attention Convolutional Neural Network (qAttCNN)を提案し、2つの非参照QoEメトリクスviz. BRISQUEとフレーム/秒(FPS)を推定する。
WhatsAppのビデオ通話から収集したカスタムデータセットを用いてqAttCNNを評価し,既存のQoEモデルと比較した。
- 参考スコア(独自算出の注目度): 2.4851388650413866
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The rapid growth of multimedia consumption, driven by major advances in mobile devices since the mid-2000s, has led to widespread use of video conferencing applications (VCAs) such as Zoom and Google Meet, as well as instant messaging applications (IMAs) like WhatsApp and Telegram, which increasingly support video conferencing as a core feature. Many of these systems rely on the Web Real-Time Communication (WebRTC) protocol, enabling direct peer-to-peer media streaming without requiring a third-party server to relay data, reducing the latency and facilitating a real-time communication. Despite WebRTC's potential, adverse network conditions can degrade streaming quality and consequently reduce users' Quality of Experience (QoE). Maintaining high QoE therefore requires continuous monitoring and timely intervention when QoE begins to deteriorate. While content providers can often estimate QoE by directly comparing transmitted and received media, this task is significantly more challenging for internet service providers (ISPs). End-to-end encryption, commonly used by modern VCAs and IMAs, prevent ISPs from accessing the original media stream, leaving only Quality of Service (QoS) and routing information available. To address this limitation, we propose the QoE Attention Convolutional Neural Network (qAttCNN), a model that leverages packet size parameter of the traffic to infer two no-reference QoE metrics viz. BRISQUE and frames per second (FPS). We evaluate qAttCNN on a custom dataset collected from WhatsApp video calls and compare it against existing QoE models. Using mean absolute error percentage (MAEP), our approach achieves 2.14% error for BRISQUE and 7.39% for FPS prediction.
- Abstract(参考訳): 2000年代半ば以降、モバイルデバイスの大きな進歩によって、マルチメディア消費が急速に増加し、ZoomやGoogle Meetといったビデオ会議アプリケーション(VCA)やWhatsAppやTelegramといったインスタントメッセージングアプリケーション(IMA)が普及し、ビデオ会議をコア機能としてサポートしている。
これらのシステムの多くは、Web Real-Time Communication (WebRTC)プロトコルに依存しており、サードパーティサーバーがデータを中継することなく、直接ピアツーピアのメディアストリーミングを可能にし、レイテンシを低減し、リアルタイム通信を容易にする。
WebRTCの可能性にもかかわらず、悪いネットワーク条件はストリーミングの品質を低下させ、結果としてユーザのQuality of Experience(QoE)を低下させる。
したがって、高いQoEを維持するには、QoEが劣化し始めると、継続的な監視とタイムリーな介入が必要である。
コンテンツプロバイダは、送信されたメディアと受信したメディアを直接比較することで、QoEを推定できることが多いが、インターネットサービスプロバイダ(ISP)にとって、このタスクははるかに困難である。
最新のVCAやIMAで一般的に使用されるエンドツーエンド暗号化は、ISPが元のメディアストリームにアクセスするのを防ぎ、Quality of Service(QoS)とルーティング情報のみが利用可能である。
この制限に対処するために、トラフィックのパケットサイズパラメータを利用して、2つの非参照QoEメトリクスvizを推論するQoE Attention Convolutional Neural Network (qAttCNN)を提案する。
BRISQUEとFPS(FPS)。
WhatsAppのビデオ通話から収集したカスタムデータセットを用いてqAttCNNを評価し,既存のQoEモデルと比較した。
平均絶対誤差率(MAEP)を用いて,BRISQUEでは2.14%,FPS予測では7.39%の誤差を達成した。
関連論文リスト
- Large Speech Model Enabled Semantic Communication [58.027223937172955]
大規模音声モデルにより意味コミュニケーション(LargeSC)が可能となった。
我々は、大きなモデルに埋め込まれた豊富な意味的知識を活用し、損失のあるチャネル上で適応的な伝達を可能にする。
システムは、550bpsから2.06kbpsまでの帯域幅をサポートし、パケット損失率の高い音声品質において、従来のベースラインを上回っている。
論文 参考訳(メタデータ) (2025-12-04T11:58:08Z) - Video QoE Metrics from Encrypted Traffic: Application-agnostic Methodology [2.7123995549185325]
本稿では,暗号化トラフィックからの客観的QoE推定のためのアプリケーション依存アプローチを提案する。
主要なビデオQoE測定値を取得し、様々なプロプライエタリなIMVCAやVCAに適用できるようにした。
評価の結果,FPS予測の精度が85.2%,PIQEに基づく品質評価分類の精度が90.2%であった。
論文 参考訳(メタデータ) (2025-04-20T19:18:13Z) - AI Flow at the Network Edge [58.31090055138711]
AI Flowは、デバイス、エッジノード、クラウドサーバ間で利用可能な異種リソースを共同で活用することで、推論プロセスを合理化するフレームワークである。
この記事では、AI Flowのモチベーション、課題、原則を特定するためのポジションペーパーとして機能する。
論文 参考訳(メタデータ) (2024-11-19T12:51:17Z) - Satellite Streaming Video QoE Prediction: A Real-World Subjective Database and Network-Level Prediction Models [59.061552498630874]
LIVE-Viasat Real-World Satellite QoE Databaseを紹介する。
このデータベースは、現実世界のストリーミングサービスから記録された179のビデオで構成されている。
本稿では,QoE予測モデルの有効性を評価することで,この新たな資源の有用性を実証する。
また、ネットワークパラメータを予測された人間の知覚スコアにマッピングする新しいモデルを作成しました。
論文 参考訳(メタデータ) (2024-10-17T18:22:50Z) - Subjective and Objective Quality-of-Experience Evaluation Study for Live Video Streaming [51.712182539961375]
ライブビデオストリーミングにおける主観的および客観的QoE評価の総合的研究を行う。
主観的なQoE研究のために、最初のライブビデオストリーミングQoEデータセットであるTaoLive QoEを紹介する。
TaoLive QoEデータセットの主観的QoEスコアを導出するために人間による研究を行った。
マルチスケールな意味的特徴と光フローに基づく動作特徴を統合したエンドツーエンドQoE評価モデルTao-QoEを提案する。
論文 参考訳(メタデータ) (2024-09-26T07:22:38Z) - QoS prediction in radio vehicular environments via prior user
information [54.853542701389074]
セルラーテストネットワークから収集したデータを用いて,時間帯を予測するためのMLツリーアンサンブル手法の評価を行った。
具体的には、先行車両の情報を含め、無線環境から得られる測定値の相関を利用して、目標車両の予測を強化する。
論文 参考訳(メタデータ) (2024-02-27T17:05:41Z) - Enhanced adaptive cross-layer scheme for low latency HEVC streaming over
Vehicular Ad-hoc Networks (VANETs) [2.2124180701409233]
HEVCはVehicular Ad-hoc Networks (VANET)を通じてリアルタイムビデオストリーミングを約束している
低遅延制約下でのVANETにおけるHEVCビデオストリーミングのエンドツーエンド性能を改善するために,低複雑性のクロス層機構を提案する。
提案機構は802.11pで採用されているEDCAと比較して、受信時の映像品質とエンドツーエンド遅延に関する大幅な改善を提供する。
論文 参考訳(メタデータ) (2023-11-05T14:19:38Z) - Adaptive QoS of WebRTC for Vehicular Media Communications [0.0]
Web Real-Time Communication (WebRTC)は、車間でのメディアストリーミングに好適な候補である。
本稿では,映像ストリームをネットワーク容量に効率よく適応させる機構について検討する。
適応に異なるアプローチを適用する場合のエンドツーエンドのスループットと反応時間への影響を、実際の5Gテストベッドで分析する。
論文 参考訳(メタデータ) (2022-08-24T09:51:59Z) - Modeling Live Video Streaming: Real-Time Classification, QoE Inference,
and Field Evaluation [1.4353812560047186]
ReCLiveは、ネットワークレベルの挙動特性に基づいたライブビデオ検出およびQoE計測のための機械学習手法である。
TwitchとYouTubeの約23,000のビデオストリームを分析し、ライブとオンデマンドのストリーミングを区別するトラフィックプロファイルの重要な特徴を特定します。
私たちのソリューションは、ISPにライブビデオストリームの細かい可視性を提供し、ユーザエクスペリエンスの測定と改善を可能にします。
論文 参考訳(メタデータ) (2021-12-05T17:53:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。