論文の概要: A review on Machine Learning based User-Centric Multimedia Streaming Techniques
- arxiv url: http://arxiv.org/abs/2411.15801v1
- Date: Sun, 24 Nov 2024 12:07:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-26 14:22:28.633305
- Title: A review on Machine Learning based User-Centric Multimedia Streaming Techniques
- Title(参考訳): 機械学習に基づくユーザ中心マルチメディアストリーミング技術に関するレビュー
- Authors: Monalisa Ghosh, Chetna Singhal,
- Abstract要約: ビデオのすべてのフォーマット(従来型と360$o$)は、動的無線チャネルをまたいで処理、圧縮、送信を行う。
これによりビデオの障害が発生し、品質が低下する。
効率的なマルチメディアストリーミング技術は、動的ネットワークとエンドユーザの課題に対処しながら、サービス品質を改善することができる。
- 参考スコア(独自算出の注目度): 5.34064424681599
- License:
- Abstract: The multimedia content and streaming are a major means of information exchange in the modern era and there is an increasing demand for such services. This coupled with the advancement of future wireless networks B5G/6G and the proliferation of intelligent handheld mobile devices, has facilitated the availability of multimedia content to heterogeneous mobile users. Apart from the conventional video, the 360$^o$ videos have gained popularity with the emerging virtual reality applications. All formats of videos (conventional and 360$^o$) undergo processing, compression, and transmission across dynamic wireless channels with restricted bandwidth to facilitate the streaming services. This causes video impairments, leading to quality degradation and poses challenges in delivering good Quality-of-Experience (QoE) to the viewers. The QoE is a prominent subjective quality measure to assess multimedia services. This requires end-to-end QoE evaluation. Efficient multimedia streaming techniques can improve the service quality while dealing with dynamic network and end-user challenges. A paradigm shift in user-centric multimedia services is envisioned with a focus on Machine Learning (ML) based QoE modeling and streaming strategies. This survey paper presents a comprehensive overview of the overall and continuous, time varying QoE modeling for the purpose of QoE management in multimedia services. It also examines the recent research on intelligent and adaptive multimedia streaming strategies, with a special emphasis on ML based techniques for video (conventional and 360$^o$) streaming. This paper discusses the overall and continuous QoE modeling to optimize the end-user viewing experience, efficient video streaming with a focus on user-centric strategies, associated datasets for modeling and streaming, along with existing shortcoming and open challenges.
- Abstract(参考訳): マルチメディアコンテンツとストリーミングは、現代における情報交換の主要な手段であり、そうしたサービスに対する需要が高まっている。
これにより、将来の無線ネットワークであるB5G/6Gの進歩と、インテリジェントハンドヘルドモバイルデバイスの普及が相まって、異種モバイルユーザへのマルチメディアコンテンツ提供が促進された。
従来のビデオとは別に、360$^o$のビデオは、新興のバーチャルリアリティーアプリケーションで人気を集めている。
ビデオのすべてのフォーマット(従来型と360$^o$)は、処理、圧縮、およびストリーミングサービスを容易にするために帯域制限のある動的な無線チャネルをまたいで伝送する。
これにより、ビデオの障害が発生し、品質が劣化し、視聴者に優れたQuality-of-Experience(QoE)を提供する上での課題が生じる。
QoEは、マルチメディアサービスを評価するための顕著な主観的品質指標である。
これはエンドツーエンドのQoE評価を必要とする。
効率的なマルチメディアストリーミング技術は、動的ネットワークとエンドユーザの課題に対処しながら、サービス品質を改善することができる。
ユーザ中心のマルチメディアサービスのパラダイムシフトは、機械学習(ML)ベースのQoEモデリングとストリーミング戦略に重点を置いている。
本稿では,マルチメディアサービスにおけるQoE管理を目的としたQoEモデリングの概要について概説する。
また、インテリジェントで適応的なマルチメディアストリーミング戦略に関する最近の研究についても検討し、特にビデオ(従来型および360$^o$)ストリーミングのMLベースの技術に重点を置いている。
本稿では,エンドユーザの視聴体験を最適化するためのQoEモデリング,ユーザ中心の戦略に着目した効率的なビデオストリーミング,モデリングとストリーミングのための関連するデータセット,既存の欠点とオープンな課題について論じる。
関連論文リスト
- Satellite Streaming Video QoE Prediction: A Real-World Subjective Database and Network-Level Prediction Models [59.061552498630874]
LIVE-Viasat Real-World Satellite QoE Databaseを紹介する。
このデータベースは、現実世界のストリーミングサービスから記録された179のビデオで構成されている。
本稿では,QoE予測モデルの有効性を評価することで,この新たな資源の有用性を実証する。
また、ネットワークパラメータを予測された人間の知覚スコアにマッピングする新しいモデルを作成しました。
論文 参考訳(メタデータ) (2024-10-17T18:22:50Z) - Subjective and Objective Quality-of-Experience Evaluation Study for Live Video Streaming [51.712182539961375]
ライブビデオストリーミングにおける主観的および客観的QoE評価の総合的研究を行う。
主観的なQoE研究のために、最初のライブビデオストリーミングQoEデータセットであるTaoLive QoEを紹介する。
TaoLive QoEデータセットの主観的QoEスコアを導出するために人間による研究を行った。
マルチスケールな意味的特徴と光フローに基づく動作特徴を統合したエンドツーエンドQoE評価モデルTao-QoEを提案する。
論文 参考訳(メタデータ) (2024-09-26T07:22:38Z) - LMM-VQA: Advancing Video Quality Assessment with Large Multimodal Models [53.64461404882853]
ビデオ品質評価(VQA)アルゴリズムは、ストリーミングビデオの品質を監視し最適化するために必要である。
本稿では,LMM-VQA(Large Multi-Modal Video Quality Assessment)モデルを提案する。
論文 参考訳(メタデータ) (2024-08-26T04:29:52Z) - Machine Learning-Driven Open-Source Framework for Assessing QoE in Multimedia Networks [0.18749305679160366]
サービスプロバイダは、ユーザの満足度を確保するために、サービスの品質とエクスペリエンスの質(QoE)の高水準を維持しなければなりません。
サービス品質に対するユーザの満足度を反映したQoEは、マルチメディアサービスにとって重要な指標です。
本稿では,マルチメディアネットワークにおけるQoEを客観的に評価するための機械学習ベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2024-06-12T18:07:06Z) - A Survey on Generative AI and LLM for Video Generation, Understanding, and Streaming [26.082980156232086]
生成人工知能(Generative AI)と大規模言語モデル(LLM)は、ビデオ技術の分野を変えつつある。
この論文は、高度にリアルなビデオ制作におけるこれらの技術の革新的利用を強調している。
ビデオストリーミングの分野では、LLMがより効率的でユーザ中心のストリーミング体験にどのように貢献するかを論じる。
論文 参考訳(メタデータ) (2024-01-30T14:37:10Z) - MVBench: A Comprehensive Multi-modal Video Understanding Benchmark [63.14000659130736]
本稿では、MVBenchという総合的なマルチモーダルビデオ理解ベンチマークを紹介する。
まず、これらの時間的タスクを定義するための新しい静的-動的手法を提案する。
そして,タスク定義に従って,公開ビデオアノテーションを複数選択QAに自動的に変換し,各タスクを評価する。
論文 参考訳(メタデータ) (2023-11-28T17:59:04Z) - Telepresence Video Quality Assessment [13.417089780219326]
ライブストリーミングのためのオンラインビデオ品質予測フレームワークを、視覚的およびオーディオ的品質予測を計算するための別々の経路を持つマルチモーダル学習フレームワークを用いて作成する。
私たちのオールインワンモデルは、パッチ、フレーム、クリップ、オーディオヴィジュアルレベルで正確な品質予測を提供することができます。
論文 参考訳(メタデータ) (2022-07-20T15:02:55Z) - A Brief Survey on Adaptive Video Streaming Quality Assessment [30.253712568568876]
適応型ビデオストリーミングにおける品質・オブ・エクスペリエンス(QoE)の評価は,高度ネットワーク管理システムにおいて重要な役割を担っている。
我々は、適応的なビデオストリーミングのための機械学習技術を用いて、客観的QoEアセスメントモデルの様々なバリエーションを分析し、比較する。
既存のビデオストリーミングQoEアセスメントモデルにはまだ性能が限られており,実用的な通信システムに適用することは困難である。
論文 参考訳(メタデータ) (2022-02-25T21:38:14Z) - Cross Layer Optimization and Distributed Reinforcement Learning for Wireless 360° Video Streaming [54.60967639512643]
本稿では,各ユーザに対して利用可能なレートを最大化し,ユーザのQoEを最大化するために効率的に利用するクロスレイヤ最適化手法を提案する。
この問題を2つの相互関連サブプロブレムに分解できることを示す。
複数の独立エージェントの並列学習を活用し,アプリケーション層サブプロブレムを解くために,アクタ・クリティカル・ディープ・強化学習(DRL)を提案する。
論文 参考訳(メタデータ) (2020-11-12T12:59:10Z) - VMSMO: Learning to Generate Multimodal Summary for Video-based News
Articles [63.32111010686954]
マルチモーダル出力(VMSMO)を用いたビデオベースマルチモーダル要約の課題を提案する。
このタスクの主な課題は、ビデオの時間的依存性と記事の意味を共同でモデル化することである。
本稿では,デュアルインタラクションモジュールとマルチモーダルジェネレータからなるDual-Interaction-based Multimodal Summarizer (DIMS)を提案する。
論文 参考訳(メタデータ) (2020-10-12T02:19:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。