論文の概要: Perceptual Visual Quality Assessment: Principles, Methods, and Future Directions
- arxiv url: http://arxiv.org/abs/2503.00625v1
- Date: Sat, 01 Mar 2025 21:28:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-05 19:13:54.897472
- Title: Perceptual Visual Quality Assessment: Principles, Methods, and Future Directions
- Title(参考訳): 視覚的品質評価 : 原則,方法,今後の方向性
- Authors: Wei Zhou, Hadi Amirpour, Christian Timmerer, Guangtao Zhai, Patrick Le Callet, Alan C. Bovik,
- Abstract要約: 知覚的視覚品質評価(PVQA)は、人間の知覚に基づいてマルチメディアコンテンツの品質を評価することに焦点を当てる。
PVQAプロセスには、画像、ビデオ、VR、ポイントクラウド、メッシュ、マルチモダリティなど、さまざまなマルチメディアコンテンツの特徴が含まれている。
従来の画像やビデオに加えて、没入型マルチメディアと生成型人工知能(GenAI)のコンテンツについても論じている。
- 参考スコア(独自算出の注目度): 82.01265561756105
- License:
- Abstract: As multimedia services such as video streaming, video conferencing, virtual reality (VR), and online gaming continue to expand, ensuring high perceptual visual quality becomes a priority to maintain user satisfaction and competitiveness. However, multimedia content undergoes various distortions during acquisition, compression, transmission, and storage, resulting in the degradation of experienced quality. Thus, perceptual visual quality assessment (PVQA), which focuses on evaluating the quality of multimedia content based on human perception, is essential for optimizing user experiences in advanced communication systems. Several challenges are involved in the PVQA process, including diverse characteristics of multimedia content such as image, video, VR, point cloud, mesh, multimodality, etc., and complex distortion scenarios as well as viewing conditions. In this paper, we first present an overview of PVQA principles and methods. This includes both subjective methods, where users directly rate their experiences, and objective methods, where algorithms predict human perception based on measurable factors such as bitrate, frame rate, and compression levels. Based on the basics of PVQA, quality predictors for different multimedia data are then introduced. In addition to traditional images and videos, immersive multimedia and generative artificial intelligence (GenAI) content are also discussed. Finally, the paper concludes with a discussion on the future directions of PVQA research.
- Abstract(参考訳): ビデオストリーミング、ビデオ会議、バーチャルリアリティー(VR)、オンラインゲームなどのマルチメディアサービスが拡大し続けており、ユーザーの満足度と競争性を維持する上で、高い知覚的品質を保証することが最優先事項となっている。
しかし、マルチメディアコンテンツは、取得、圧縮、送信、記憶中に様々な歪みを起こし、経験豊富な品質が劣化する。
このように、人間の知覚に基づくマルチメディアコンテンツの品質評価に焦点を当てた知覚的視覚品質評価(PVQA)は、高度な通信システムにおけるユーザエクスペリエンスの最適化に不可欠である。
PVQAプロセスには、画像、ビデオ、VR、ポイントクラウド、メッシュ、マルチモダリティなどのマルチメディアコンテンツの多様な特性、複雑な歪みシナリオ、視聴条件など、いくつかの課題がある。
本稿ではまず,PVQAの原則と方法の概要を紹介する。
これには、ユーザが自身の体験を直接評価する主観的手法と、ビットレート、フレームレート、圧縮レベルといった測定可能な要因に基づいて、アルゴリズムが人間の知覚を予測する客観的手法の両方が含まれる。
PVQAの基本に基づいて、異なるマルチメディアデータに対する品質予測器を導入する。
従来の画像やビデオに加えて、没入型マルチメディアと生成型人工知能(GenAI)のコンテンツについても論じている。
最後に,PVQA研究の今後の方向性について論じる。
関連論文リスト
- A review on Machine Learning based User-Centric Multimedia Streaming Techniques [5.34064424681599]
ビデオのすべてのフォーマット(従来型と360$o$)は、動的無線チャネルをまたいで処理、圧縮、送信を行う。
これによりビデオの障害が発生し、品質が低下する。
効率的なマルチメディアストリーミング技術は、動的ネットワークとエンドユーザの課題に対処しながら、サービス品質を改善することができる。
論文 参考訳(メタデータ) (2024-11-24T12:07:47Z) - VQA$^2$: Visual Question Answering for Video Quality Assessment [76.81110038738699]
ビデオ品質アセスメント(VQA)は、低レベルの視覚知覚において古典的な分野である。
画像領域における最近の研究は、視覚質問応答(VQA)が視覚的品質を著しく低レベルに評価できることを示した。
VQA2インストラクションデータセットは,ビデオ品質評価に焦点をあてた最初の視覚的質問応答インストラクションデータセットである。
VQA2シリーズは、ビデオにおける空間的時間的品質の詳細の知覚を高めるために、視覚的および運動的トークンをインターリーブする。
論文 参考訳(メタデータ) (2024-11-06T09:39:52Z) - Quality Prediction of AI Generated Images and Videos: Emerging Trends and Opportunities [32.03360188710995]
AIが生成し、拡張されたコンテンツは、視覚的に正確で、意図された使用に固執し、高い視覚的品質を維持する必要がある。
AI生成および強化されたコンテンツの視覚的“品質”を監視し制御するひとつの方法は、画像品質アセスメント(IQA)とビデオ品質アセスメント(VQA)モデルをデプロイすることである。
本稿では,AIが生成・拡張した画像・映像コンテンツによる現状の問題点と可能性について検討する。
論文 参考訳(メタデータ) (2024-10-11T05:08:44Z) - CLIPVQA:Video Quality Assessment via CLIP [56.94085651315878]
VQA問題(CLIPVQA)に対する効率的なCLIPベースのトランスフォーマー手法を提案する。
提案したCLIPVQAは、新しい最先端のVQAパフォーマンスを実現し、既存のベンチマークVQAメソッドよりも最大で37%の汎用性を実現している。
論文 参考訳(メタデータ) (2024-07-06T02:32:28Z) - Perceptual Video Quality Assessment: A Survey [63.61214597655413]
映像品質評価は,映像処理分野において重要な役割を担っている。
過去20年間に様々な主観的・客観的な映像品質評価研究が実施されてきた。
この調査は、これらのビデオ品質アセスメント研究の最新かつ包括的なレビューを提供する。
論文 参考訳(メタデータ) (2024-02-05T16:13:52Z) - Towards Explainable In-the-Wild Video Quality Assessment: A Database and
a Language-Prompted Approach [52.07084862209754]
われわれは、13次元の質関連因子に関する4,543本のビデオについて200万以上の意見を集めている。
具体的には、各次元に対して正、負、中立の選択をラベル付けするよう被験者に求める。
これらの説明レベルの意見は、特定の品質要因と抽象的な主観的品質評価の関係を測ることができる。
論文 参考訳(メタデータ) (2023-05-22T05:20:23Z) - Perceptual Quality Assessment of Face Video Compression: A Benchmark and
An Effective Method [69.868145936998]
生成的符号化アプローチは、合理的な速度歪曲トレードオフを持つ有望な代替手段として認識されている。
従来のハイブリッドコーディングフレームワークから生成モデルまで、空間的・時間的領域における歪みの多様さは、圧縮顔画像品質評価(VQA)における大きな課題を提示する。
大規模圧縮顔画像品質評価(CFVQA)データベースを導入し,顔ビデオの知覚的品質と多角化圧縮歪みを体系的に理解するための最初の試みである。
論文 参考訳(メタデータ) (2023-04-14T11:26:09Z) - Deep Neural Network-based Enhancement for Image and Video Streaming
Systems: A Survey and Future Directions [20.835654670825782]
ディープラーニングは、品質の低い画像から高品質な画像を生成する上で、前例のないパフォーマンスをもたらした。
本稿では,高速応答時間と高画質を実現する上で重要な要素として,ニューラルエンハンスメントを用いた最新のコンテンツ配信システムを提案する。
論文 参考訳(メタデータ) (2021-06-07T15:42:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。