論文の概要: Super Efficient Neural Network for Compression Artifacts Reduction and
Super Resolution
- arxiv url: http://arxiv.org/abs/2401.14641v1
- Date: Fri, 26 Jan 2024 04:11:14 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-29 15:48:47.933425
- Title: Super Efficient Neural Network for Compression Artifacts Reduction and
Super Resolution
- Title(参考訳): 圧縮アーチファクト削減と超解像のための超高効率ニューラルネットワーク
- Authors: Wen Ma, Qiuwen Lou, Arman Kazemi, Julian Faraone, Tariq Afzal
- Abstract要約: 本稿では,人工物削減と超解像を同時に行う軽量畳み込みニューラルネットワーク(CNN)に基づくアルゴリズムを提案する。
その結果,従来のアップスケーリング手法と比較して,ビデオマルチメソッド評価融合(VMAF)スコアが4~6増加していた。
- 参考スコア(独自算出の注目度): 2.0762623979470205
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Video quality can suffer from limited internet speed while being streamed by
users. Compression artifacts start to appear when the bitrate decreases to
match the available bandwidth. Existing algorithms either focus on removing the
compression artifacts at the same video resolution, or on upscaling the video
resolution but not removing the artifacts. Super resolution-only approaches
will amplify the artifacts along with the details by default. We propose a
lightweight convolutional neural network (CNN)-based algorithm which
simultaneously performs artifacts reduction and super resolution (ARSR) by
enhancing the feature extraction layers and designing a custom training
dataset. The output of this neural network is evaluated for test streams
compressed at low bitrates using variable bitrate (VBR) encoding. The output
video quality shows a 4-6 increase in video multi-method assessment fusion
(VMAF) score compared to traditional interpolation upscaling approaches such as
Lanczos or Bicubic.
- Abstract(参考訳): ビデオのクオリティは、ユーザによってストリーミングされる間、インターネットのスピードが制限される。
圧縮アーティファクトはビットレートが減少し、利用可能な帯域幅に合わせると現れる。
既存のアルゴリズムでは、圧縮アーティファクトを同じビデオ解像度で削除すること、あるいはビデオ解像度をアップスケールすることに集中しているが、アーティファクトを削除しない。
超解像度のみのアプローチは、デフォルトで詳細とともにアーティファクトを増幅する。
特徴抽出層を拡張し,カスタムトレーニングデータセットを設計することにより,アーティファクトの削減と超解像(ARSR)を同時に行う,軽量畳み込みニューラルネットワーク(CNN)に基づくアルゴリズムを提案する。
このニューラルネットワークの出力は、可変ビットレート(VBR)符号化を用いて低ビットレートで圧縮されたテストストリームに対して評価される。
出力ビデオ品質は,LanczosやBicubicのような従来の補間アップスケーリング手法と比較して,ビデオマルチメソッド評価融合(VMAF)スコアが4~6増加している。
関連論文リスト
- NU-Class Net: A Novel Approach for Video Quality Enhancement [1.7763979745248648]
本稿では,圧縮コーデックによる圧縮アーチファクトの軽減を目的とした,革新的な深層学習モデルであるNU-Class Netを紹介する。
NU-Class Netを利用することで、ビデオキャプチャノード内のビデオエンコーダは出力品質を低下させ、低ビットレートのビデオを生成することができる。
実験により,低ビットレートでストリーミングされたビデオの知覚品質を高めるためのモデルの有効性が確認された。
論文 参考訳(メタデータ) (2024-01-02T11:46:42Z) - You Can Mask More For Extremely Low-Bitrate Image Compression [80.7692466922499]
近年,学習画像圧縮(lic)法は大きな進歩を遂げている。
licメソッドは、画像圧縮に不可欠な画像構造とテクスチャコンポーネントを明示的に探索することができない。
原画像の構造とテクスチャに基づいて可視パッチをサンプリングするDA-Maskを提案する。
極めて低ビットレート圧縮のために, lic と lic のエンドツーエンドを統一する最初のフレームワークである, 単純で効果的なマスク付き圧縮モデル (MCM) を提案する。
論文 参考訳(メタデータ) (2023-06-27T15:36:22Z) - Video Compression with Arbitrary Rescaling Network [8.489428003916622]
符号化前のビデオリサイズのためのレート誘導任意再スケーリングネットワーク(RARN)を提案する。
軽量RARN構造は、FHD(1080p)コンテンツをリアルタイム(91 FPS)で処理し、かなりのレート低下を得ることができる。
論文 参考訳(メタデータ) (2023-06-07T07:15:18Z) - Learned Video Compression via Heterogeneous Deformable Compensation
Network [78.72508633457392]
不安定な圧縮性能の問題に対処するために,不均一変形補償戦略(HDCVC)を用いた学習ビデオ圧縮フレームワークを提案する。
より具体的には、提案アルゴリズムは隣接する2つのフレームから特徴を抽出し、コンテンツ近傍の不均一な変形(HetDeform)カーネルオフセットを推定する。
実験結果から,HDCVCは最近の最先端の学習ビデオ圧縮手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2022-07-11T02:31:31Z) - The Devil Is in the Details: Window-based Attention for Image
Compression [58.1577742463617]
既存の学習画像圧縮モデルは畳み込みニューラルネットワーク(CNN)に基づいている。
本稿では,複数種類の注意機構が局所特徴学習に与える影響について検討し,より単純で効果的なウィンドウベースの局所的注意ブロックを提案する。
提案されたウィンドウベースのアテンションは非常に柔軟で、CNNとTransformerモデルを強化するためのプラグイン・アンド・プレイコンポーネントとして機能する可能性がある。
論文 参考訳(メタデータ) (2022-03-16T07:55:49Z) - Reducing Redundancy in the Bottleneck Representation of the Autoencoders [98.78384185493624]
オートエンコーダは教師なしニューラルネットワークの一種であり、様々なタスクを解くのに使用できる。
本稿では,ボトルネック表現における特徴冗長性を明示的に罰する手法を提案する。
我々は,3つの異なるデータセットを用いた次元削減,MNISTデータセットを用いた画像圧縮,ファッションMNISTを用いた画像デノナイズという,さまざまなタスクにまたがってアプローチを検証した。
論文 参考訳(メタデータ) (2022-02-09T18:48:02Z) - Small Lesion Segmentation in Brain MRIs with Subpixel Embedding [105.1223735549524]
ヒト脳のMRIスキャンを虚血性脳梗塞と正常組織に分割する方法を提案する。
本稿では,空間展開埋め込みネットワークによって予測を導出する標準エンコーダデコーダの形式でニューラルネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-09-18T00:21:17Z) - Perceptually-inspired super-resolution of compressed videos [18.72040343193715]
空間分解能適応は、符号化効率を高めるためにしばしばビデオ圧縮に使用される技法である。
近年の研究では、畳み込みニューラルネットワーク(CNN)に基づく高度な超解像法を用いて、再構築品質をさらに向上させている。
本稿では,CNNモデルを用いた圧縮映像の空間的アップサンプリングのために,知覚にインスパイアされた超解像法(M-SRGAN)を提案する。
論文 参考訳(メタデータ) (2021-06-15T13:50:24Z) - Multi-Density Attention Network for Loop Filtering in Video Compression [9.322800480045336]
ビデオ圧縮におけるループフィルタリングのためのオンラインスケーリングに基づく多密度注意ネットワークを提案する。
実験の結果、同じビデオ品質で10.18%のビットレート削減が最新のVVC(Versatile Video Coding)規格で達成できることが示された。
論文 参考訳(メタデータ) (2021-04-08T05:46:38Z) - Ultra-low bitrate video conferencing using deep image animation [7.263312285502382]
ビデオ会議のための超低速ビデオ圧縮のための新しい深層学習手法を提案する。
我々はディープニューラルネットワークを用いて、動き情報をキーポイント変位として符号化し、デコーダ側で映像信号を再構成する。
論文 参考訳(メタデータ) (2020-12-01T09:06:34Z) - Content Adaptive and Error Propagation Aware Deep Video Compression [110.31693187153084]
本稿では,コンテンツ適応型・誤り伝搬対応型ビデオ圧縮システムを提案する。
本手法では, 複数フレームの圧縮性能を1フレームではなく複数フレームで考慮し, 共同学習手法を用いる。
従来の圧縮システムでは手作りのコーディングモードを使用する代わりに,オンラインエンコーダ更新方式をシステム内に設計する。
論文 参考訳(メタデータ) (2020-03-25T09:04:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。