論文の概要: Perceptual Quality Improvement in Videoconferencing using
Keyframes-based GAN
- arxiv url: http://arxiv.org/abs/2311.04263v1
- Date: Tue, 7 Nov 2023 16:38:23 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-09 18:09:40.488897
- Title: Perceptual Quality Improvement in Videoconferencing using
Keyframes-based GAN
- Title(参考訳): キーフレームに基づくGANを用いたビデオ会議の知覚的品質改善
- Authors: Lorenzo Agnolucci, Leonardo Galteri, Marco Bertini, Alberto Del Bimbo
- Abstract要約: 本稿では,ビデオ会議における圧縮アーティファクト削減のための新しいGAN手法を提案する。
まず,圧縮および参照フレームからマルチスケールの特徴を抽出する。
そして、私たちのアーキテクチャは、顔のランドマークに従って、これらの特徴を段階的に組み合わせます。
- 参考スコア(独自算出の注目度): 28.773037051085318
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In the latest years, videoconferencing has taken a fundamental role in
interpersonal relations, both for personal and business purposes. Lossy video
compression algorithms are the enabling technology for videoconferencing, as
they reduce the bandwidth required for real-time video streaming. However,
lossy video compression decreases the perceived visual quality. Thus, many
techniques for reducing compression artifacts and improving video visual
quality have been proposed in recent years. In this work, we propose a novel
GAN-based method for compression artifacts reduction in videoconferencing.
Given that, in this context, the speaker is typically in front of the camera
and remains the same for the entire duration of the transmission, we can
maintain a set of reference keyframes of the person from the higher-quality
I-frames that are transmitted within the video stream and exploit them to guide
the visual quality improvement; a novel aspect of this approach is the update
policy that maintains and updates a compact and effective set of reference
keyframes. First, we extract multi-scale features from the compressed and
reference frames. Then, our architecture combines these features in a
progressive manner according to facial landmarks. This allows the restoration
of the high-frequency details lost after the video compression. Experiments
show that the proposed approach improves visual quality and generates
photo-realistic results even with high compression rates. Code and pre-trained
networks are publicly available at
https://github.com/LorenzoAgnolucci/Keyframes-GAN.
- Abstract(参考訳): 近年,ビデオ会議は対人関係において,個人的・ビジネス的にも基本的な役割を担っている。
リアルタイムビデオストリーミングに必要な帯域幅を削減できるため、ビデオ圧縮アルゴリズムはビデオ会議を可能にする技術である。
しかし、映像圧縮の損失は視覚品質を低下させる。
近年,圧縮アーチファクトの低減と映像品質向上のための多くの技術が提案されている。
本稿では,ビデオ会議における圧縮アーティファクト削減のための新しいGAN手法を提案する。
この文脈では、話者は一般的にカメラの前にいて、送信の全期間同じであり、ビデオストリーム内で送信される高品質なIフレームから人の参照キーフレームのセットを維持し、それらを活用して視覚的品質の改善を導くことができ、このアプローチの新たな側面は、コンパクトで効果的な参照キーフレームのセットをメンテナンスし更新する更新ポリシーである。
まず,圧縮および参照フレームからマルチスケールの特徴を抽出する。
そして、当社のアーキテクチャは、顔のランドマークに従って、これらの機能を漸進的に組み合わせます。
これにより、ビデオ圧縮後に失われた高周波の詳細を復元することができる。
実験により,提案手法は高圧縮率でも視覚的品質を改善し,フォトリアリスティックな結果が得られることが示された。
コードとトレーニング済みのネットワークはhttps://github.com/LorenzoAgnolucci/Keyframes-GANで公開されている。
関連論文リスト
- Implicit Neural Representation for Videos Based on Residual Connection [0.0]
画像再構成に有効な残差接続として低解像度フレームを用いる手法を提案する。
実験の結果,本手法はPSNRの既存手法であるHNeRVを49本中46本で上回っていることがわかった。
論文 参考訳(メタデータ) (2024-06-15T10:10:48Z) - Blurry Video Compression: A Trade-off between Visual Enhancement and
Data Compression [65.8148169700705]
既存のビデオ圧縮(VC)手法は主に、ビデオ内の連続フレーム間の空間的および時間的冗長性を減らすことを目的としている。
これまでの研究は、インスタント(既知の)露光時間やシャッタースピードなどの特定の設定で取得されたビデオに対して、顕著な成果を上げてきた。
本研究では,シーン内のカメラ設定やダイナミックスによって,所定の映像がぼやけてしまうという一般的なシナリオにおいて,VCの問題に取り組む。
論文 参考訳(メタデータ) (2023-11-08T02:17:54Z) - High Visual-Fidelity Learned Video Compression [6.609832462227998]
我々は,HVFVC(High Visual-Fidelity Learned Video Compression framework)を提案する。
具体的には,新たに出現した地域での貧弱な復興問題に対処するために,信頼度に基づく新しい特徴再構成手法を設計する。
広汎な実験により提案したHVFVCは、50%しか必要とせず、最新のVVC標準よりも優れた知覚品質が得られることが示された。
論文 参考訳(メタデータ) (2023-10-07T03:27:45Z) - Predictive Coding For Animation-Based Video Compression [13.161311799049978]
本稿では,画像アニメーションを予測器として用いる予測符号化手法を提案し,実際の対象フレームに対する残差を符号化する。
実験の結果,HEVCビデオ標準に比べて70%以上,VVCに比べて30%以上,有意な上昇を示した。
論文 参考訳(メタデータ) (2023-07-09T14:40:54Z) - Perceptual Quality Assessment of Face Video Compression: A Benchmark and
An Effective Method [69.868145936998]
生成的符号化アプローチは、合理的な速度歪曲トレードオフを持つ有望な代替手段として認識されている。
従来のハイブリッドコーディングフレームワークから生成モデルまで、空間的・時間的領域における歪みの多様さは、圧縮顔画像品質評価(VQA)における大きな課題を提示する。
大規模圧縮顔画像品質評価(CFVQA)データベースを導入し,顔ビデオの知覚的品質と多角化圧縮歪みを体系的に理解するための最初の試みである。
論文 参考訳(メタデータ) (2023-04-14T11:26:09Z) - Compressing Video Calls using Synthetic Talking Heads [43.71577046989023]
本稿では,ヘッドビデオ圧縮のためのエンドツーエンドシステムを提案する。
提案アルゴリズムは,他の音声ヘッドビデオがアニメーションによって生成される間,ピボットフレームを断続的に送信する。
我々は、最先端の顔再現ネットワークを用いて、非ピボットフレームのキーポイントを検出し、それを受信機に送信する。
論文 参考訳(メタデータ) (2022-10-07T16:52:40Z) - Leveraging Bitstream Metadata for Fast, Accurate, Generalized Compressed
Video Quality Enhancement [74.1052624663082]
圧縮ビデオの細部を復元する深層学習アーキテクチャを開発した。
これにより,従来の圧縮補正法と比較して復元精度が向上することを示す。
我々は、ビットストリームで容易に利用できる量子化データに対して、我々のモデルを条件付けする。
論文 参考訳(メタデータ) (2022-01-31T18:56:04Z) - Conditional Entropy Coding for Efficient Video Compression [82.35389813794372]
本稿では,フレーム間の条件エントロピーをモデル化することのみに焦点を当てた,非常にシンプルで効率的なビデオ圧縮フレームワークを提案する。
まず、画像遅延符号間のエントロピーをモデル化する単純なアーキテクチャが、他のニューラルビデオ圧縮やビデオコーデックと同等の競争力を持つことを示す。
次に、このアーキテクチャの上に新しい内部学習拡張を提案し、復号速度を抑えることなく10%の節約を実現した。
論文 参考訳(メタデータ) (2020-08-20T20:01:59Z) - Content Adaptive and Error Propagation Aware Deep Video Compression [110.31693187153084]
本稿では,コンテンツ適応型・誤り伝搬対応型ビデオ圧縮システムを提案する。
本手法では, 複数フレームの圧縮性能を1フレームではなく複数フレームで考慮し, 共同学習手法を用いる。
従来の圧縮システムでは手作りのコーディングモードを使用する代わりに,オンラインエンコーダ更新方式をシステム内に設計する。
論文 参考訳(メタデータ) (2020-03-25T09:04:24Z) - Learning for Video Compression with Hierarchical Quality and Recurrent
Enhancement [164.7489982837475]
本稿では,階層型ビデオ圧縮(HLVC)手法を提案する。
我々のHLVCアプローチでは、エンコーダ側とデコーダ側の低品質フレームの圧縮と強化を容易にするため、階層的品質は符号化効率の恩恵を受ける。
論文 参考訳(メタデータ) (2020-03-04T09:31:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。