論文の概要: Adversarial Distortion for Learned Video Compression
- arxiv url: http://arxiv.org/abs/2004.09508v3
- Date: Fri, 18 Jun 2021 18:42:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-11 17:35:37.908125
- Title: Adversarial Distortion for Learned Video Compression
- Title(参考訳): 学習ビデオ圧縮における逆歪み
- Authors: Vijay Veerabadran, Reza Pourreza, Amirhossein Habibian, Taco Cohen
- Abstract要約: 副次的対向歪みを最小化する深層対向学習ビデオ圧縮モデルを提案する。
最先端の学習ビデオ圧縮システムを用いた実験では,特に高圧縮下での知覚的アーティファクトの低減と詳細の再構築が実証された。
- 参考スコア(独自算出の注目度): 17.721259583120396
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we present a novel adversarial lossy video compression model.
At extremely low bit-rates, standard video coding schemes suffer from
unpleasant reconstruction artifacts such as blocking, ringing etc. Existing
learned neural approaches to video compression have achieved reasonable success
on reducing the bit-rate for efficient transmission and reduce the impact of
artifacts to an extent. However, they still tend to produce blurred results
under extreme compression. In this paper, we present a deep adversarial learned
video compression model that minimizes an auxiliary adversarial distortion
objective. We find this adversarial objective to correlate better with human
perceptual quality judgement relative to traditional quality metrics such as
MS-SSIM and PSNR. Our experiments using a state-of-the-art learned video
compression system demonstrate a reduction of perceptual artifacts and
reconstruction of detail lost especially under extremely high compression.
- Abstract(参考訳): 本稿では,新しい対向損失ビデオ圧縮モデルを提案する。
極端に低いビットレートでは、標準的なビデオ符号化方式は、ブロッキング、リンギングなどの不快な再構築アーティファクトに苦しむ。
ビデオ圧縮に対する既存の学習したニューラルアプローチは、効率的な伝送のためのビットレートを削減し、アーティファクトの影響をある程度低減することに合理的に成功している。
しかし、極端な圧縮下ではぼやけた結果になる傾向がある。
本稿では,補助的な逆歪目標を最小化する深層学習ビデオ圧縮モデルを提案する。
この敵意は,MS-SSIMやPSNRといった従来の品質指標と比較して,人間の知覚的品質判断と相関する。
最先端の学習ビデオ圧縮システムを用いた実験では,特に高圧縮下での知覚的アーティファクトの低減と詳細の再構築が示されている。
関連論文リスト
- Enhancing the Rate-Distortion-Perception Flexibility of Learned Image
Codecs with Conditional Diffusion Decoders [7.485128109817576]
本研究では,デコーダとして使用する場合,条件拡散モデルが生成圧縮タスクにおいて有望な結果をもたらすことを示す。
本稿では,デコーダとして使用する場合,条件拡散モデルが生成圧縮タスクにおいて有望な結果をもたらすことを示す。
論文 参考訳(メタデータ) (2024-03-05T11:48:35Z) - Semantic Ensemble Loss and Latent Refinement for High-Fidelity Neural Image Compression [58.618625678054826]
本研究は、最適な視覚的忠実度のために設計された強化されたニューラル圧縮手法を提案する。
我々は,洗練されたセマンティック・アンサンブル・ロス,シャルボニエ・ロス,知覚的損失,スタイル・ロス,非バイナリ・ディバイザ・ロスを組み込んだモデルを構築した。
実験により,本手法は神経画像圧縮の統計的忠実度を著しく向上させることが示された。
論文 参考訳(メタデータ) (2024-01-25T08:11:27Z) - VCISR: Blind Single Image Super-Resolution with Video Compression
Synthetic Data [18.877077302923713]
本稿では,映像圧縮に基づく劣化モデルを用いて,ブラインドSISRタスクにおける低解像度画像データを合成する。
提案手法は既存の画像データセットに適用可能である。
SISR分解モデルにビデオ符号化アーティファクトを導入することで、ニューラルネットワークは、ビデオ圧縮劣化を復元する機能を備えた、画像の超解凍を可能にする。
論文 参考訳(メタデータ) (2023-11-02T05:24:19Z) - HFLIC: Human Friendly Perceptual Learned Image Compression with
Reinforced Transform [16.173583505483272]
現在の学習ベースの画像圧縮法は、人間に優しい圧縮を犠牲にし、長い復号時間を必要とすることが多い。
本稿では、既存の画像圧縮モデルのバックボーンネットワークとロス関数の強化を提案し、人間の知覚と効率の改善に焦点をあてる。
論文 参考訳(メタデータ) (2023-05-12T14:35:27Z) - Analysis of the Effect of Low-Overhead Lossy Image Compression on the
Performance of Visual Crowd Counting for Smart City Applications [78.55896581882595]
画像圧縮技術は画像の品質を低下させ、精度を低下させる。
本稿では,低オーバヘッド損失画像圧縮法の適用が視覚的群集カウントの精度に与える影響を解析する。
論文 参考訳(メタデータ) (2022-07-20T19:20:03Z) - Estimating the Resize Parameter in End-to-end Learned Image Compression [50.20567320015102]
本稿では,最近の画像圧縮モデルの速度歪みトレードオフをさらに改善する検索自由化フレームワークについて述べる。
提案手法により,Bjontegaard-Deltaレート(BD-rate)を最大10%向上させることができる。
論文 参考訳(メタデータ) (2022-04-26T01:35:02Z) - Leveraging Bitstream Metadata for Fast, Accurate, Generalized Compressed
Video Quality Enhancement [74.1052624663082]
圧縮ビデオの細部を復元する深層学習アーキテクチャを開発した。
これにより,従来の圧縮補正法と比較して復元精度が向上することを示す。
我々は、ビットストリームで容易に利用できる量子化データに対して、我々のモデルを条件付けする。
論文 参考訳(メタデータ) (2022-01-31T18:56:04Z) - Perceptual Learned Video Compression with Recurrent Conditional GAN [158.0726042755]
本稿では, PVC (Perceptual Learned Video Compression) アプローチを提案する。
PLVCは低ビットレートで映像を知覚品質に圧縮することを学ぶ。
ユーザスタディでは、最新の学習ビデオ圧縮手法と比較して、PLVCの優れた知覚性能をさらに検証している。
論文 参考訳(メタデータ) (2021-09-07T13:36:57Z) - Analyzing and Mitigating JPEG Compression Defects in Deep Learning [69.04777875711646]
本稿では,JPEG圧縮が共通タスクやデータセットに与える影響を統一的に検討する。
高圧縮の一般的なパフォーマンス指標には大きなペナルティがあることが示される。
論文 参考訳(メタデータ) (2020-11-17T20:32:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。