Fugu-MT 論文翻訳(概要): Deep Priors for Video Quality Prediction

論文の概要: Deep Priors for Video Quality Prediction

arxiv url: http://arxiv.org/abs/2410.22566v2
Date: Tue, 05 Nov 2024 13:21:26 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:42.118307
Title: Deep Priors for Video Quality Prediction
Title（参考訳）: 映像品質予測の深層化
Authors: Siddharath Narayan Shakya, Parimala Kancharla,
Abstract要約: 本研究では,1枚の歪みビデオと1枚の参照ビデオを用いて,先行した深度ビデオの学習を行った。歪んだビデオから元の映像を復元する前、深層ビデオの学習能力を測定し、ビデオの歪みを定量化する。我々のアルゴリズムは単一のビデオペアを使って訓練されており、ラベル付きデータを必要としない。
参考スコア（独自算出の注目度）: 4.327763441385371
License: http://creativecommons.org/licenses/by/4.0/
Abstract: In this work, we designed a completely blind video quality assessment algorithm using the deep video prior. This work mainly explores the utility of deep video prior in estimating the visual quality of the video. In our work, we have used a single distorted video and a reference video pair to learn the deep video prior. At inference time, the learned deep prior is used to restore the original videos from the distorted videos. The ability of learned deep video prior to restore the original video from the distorted video is measured to quantify distortion in the video. Our hypothesis is that the learned deep video prior fails in restoring the highly distorted videos. The restoring ability of deep video prior is proportional to the distortion present in the video. Therefore, we propose to use the distance between the distorted video and the restored video as the perceptual quality of the video. Our algorithm is trained using a single video pair and it does not need any labelled data. We show that our proposed algorithm outperforms the existing unsupervised video quality assessment algorithms in terms of LCC and SROCC on a synthetically distorted video quality assessment dataset.
Abstract（参考訳）: 本研究では,従来のディープビデオを用いた完全盲視映像品質評価アルゴリズムを設計した。この研究は主に、映像の視覚的品質を推定する前のディープビデオの有用性を探求する。本研究では,1枚の歪みビデオと1枚の参照ビデオを用いて,先行した深度ビデオの学習を行った。推論時に、学習した深層ビデオは、歪んだビデオから元のビデオを復元するために使用される。歪んだビデオから元の映像を復元する前、深層ビデオの学習能力を測定し、ビデオの歪みを定量化する。我々の仮説では、学習されたディープビデオは、高度に歪んだビデオの復元に失敗する。ディープビデオの復元能力は、ビデオ内の歪みに比例する。そこで本研究では,変形した映像と復元された映像との距離を,映像の知覚的品質として利用することを提案する。我々のアルゴリズムは単一のビデオペアを使って訓練されており、ラベル付きデータを必要としない。提案アルゴリズムは、合成歪み映像品質評価データセット上で、LCCおよびSROCCの観点から、既存の教師なし映像品質評価アルゴリズムよりも優れていることを示す。

関連論文リスト

Subjective and Objective Quality Assessment of Banding Artifacts on Compressed Videos [55.09949353783613]
注目に値するバンドングアーティファクトは、ハイエンドのHDTVや高解像度のスクリーンで見るビデオの知覚的品質に深刻な影響を与える可能性がある。我々は、LIVE-YT-Bandingと呼ばれる、4つの異なる圧縮パラメータで生成された160のビデオからなる、第一種オープンビデオデータセットを作成しました。計7,200人の主観的意見が45人の被験者のコホートから集められている。
論文参考訳（メタデータ） (2025-08-12T07:42:56Z)
Direct Motion Models for Assessing Generated Videos [38.04485796547767]
ビデオ生成ビデオモデルの現在の制限は、可視的に見えるフレームを生成するが、動きが貧弱であることである。ここでは、妥当な物体の相互作用と動きをよりよく測定する指標を開発することで、FVDを超えていく。画素再構成や動作認識の代わりに点線を用いると、合成データの時間歪みに顕著に敏感な測定結果が得られることを示す。
論文参考訳（メタデータ） (2025-04-30T22:34:52Z)
Video Depth Anything: Consistent Depth Estimation for Super-Long Videos [60.857723250653976]
超長ビデオにおける高品質で一貫した深度推定のためのビデオ深度推定法を提案する。我々のモデルは、Depth Anything V2と同様、ビデオ深度とラベルなし画像の合同データセットに基づいて訓練されている。提案手法は,ゼロショット映像深度推定における新しい最先端技術である。
論文参考訳（メタデータ） (2025-01-21T18:53:30Z)
Buffer Anytime: Zero-Shot Video Depth and Normal from Image Priors [54.8852848659663]
Buffer Anytimeは、ビデオから深さと正規マップ(幾何バッファと呼ばれる)を推定するためのフレームワークです。時間的整合性制約を持つ単一画像の先行値を活用することによって,高品質なビデオバッファ推定を実証する。
論文参考訳（メタデータ） (2024-11-26T09:28:32Z)
VideoPrism: A Foundational Visual Encoder for Video Understanding [90.01845485201746]
VideoPrismは、単一の凍結モデルで多様なビデオ理解タスクに取り組む汎用ビデオエンコーダである。我々は,36Mの高品質ビデオキャプチャ対と582Mの動画クリップを含む異種コーパス上で,VoicePrismを事前訓練した。我々は、Webビデオ質問応答から科学用CVまで、ビデオ理解タスクの4つのグループでビデオPrismを広範囲にテストし、33の動画理解ベンチマークのうち31で最先端のパフォーマンスを達成した。
論文参考訳（メタデータ） (2024-02-20T18:29:49Z)
Deep Video Prior for Video Consistency and Propagation [58.250209011891904]
視覚的ビデオの時間的整合性に対する新規で一般的なアプローチを提案する。提案手法は,大規模なデータセットではなく,オリジナルビデオとプロセッシングビデオのペアでのみ訓練される。我々は、Deep Video Priorでビデオ上で畳み込みニューラルネットワークをトレーニングすることで、時間的一貫性を実現することができることを示す。
論文参考訳（メタデータ） (2022-01-27T16:38:52Z)
VPN: Video Provenance Network for Robust Content Attribution [72.12494245048504]
VPN - オンラインで共有されているビデオから出典情報を復元するコンテンツ属性手法を提案する。完全長あるいは切り離されたビデオクエリを用いて,このようなビデオのマッチングに頑健な検索埋め込みを学習する。一度ビデオクリップの信頼できるデータベースにマッチすると、そのクリップの出所に関する関連情報がユーザに提示される。
論文参考訳（メタデータ） (2021-09-21T09:07:05Z)
Blind Video Temporal Consistency via Deep Video Prior [61.062900556483164]
視覚的ビデオの時間的整合性に対する新規で一般的なアプローチを提案する。本手法は,一対のオリジナルビデオとプロセッシングビデオを直接トレーニングするのみである。本稿では,Deep Video Priorを用いてビデオ上の畳み込みネットワークをトレーニングすることにより,時間的一貫性を実現することができることを示す。
論文参考訳（メタデータ） (2020-10-22T16:19:20Z)
Consistent Video Depth Estimation [57.712779457632024]
モノクロ映像中の全画素に対して, 密度, 幾何的に整合した深度を再構成するアルゴリズムを提案する。動画中の画素の幾何的制約を確立するために、従来の動きから再構成した構造を利用する。我々のアルゴリズムは、手持ちの映像をある程度のダイナミックな動きで処理することができる。
論文参考訳（メタデータ） (2020-04-30T17:59:26Z)
Feature Re-Learning with Data Augmentation for Video Relevance Prediction [35.87597969685573]
再学習は、アフィン変換によって与えられた深い機能を新しい空間に投影することで実現される。本稿では,フレームレベルとビデオレベルの機能に直接依存する新たなデータ拡張戦略を提案する。
論文参考訳（メタデータ） (2020-04-08T05:22:41Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。