論文の概要: Wavelet-Like Transform-Based Technology in Response to the Call for
Proposals on Neural Network-Based Image Coding
- arxiv url: http://arxiv.org/abs/2403.05937v1
- Date: Sat, 9 Mar 2024 15:13:49 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-13 11:44:15.405706
- Title: Wavelet-Like Transform-Based Technology in Response to the Call for
Proposals on Neural Network-Based Image Coding
- Title(参考訳): ニューラルネットワークに基づく画像符号化の提案に応えるウェーブレット様変換ベース技術
- Authors: Cunhui Dong, Haichuan Ma, Haotian Zhang, Changsheng Gao, Li Li, Dong
Liu
- Abstract要約: 本稿では,新しいウェーブレット型変換に基づくエンドツーエンド画像符号化フレームワーク,iWaveV3を紹介する。
iWaveV3には、アフィンウェーブレットのような変換、知覚に優しい品質基準、より高度なトレーニングとオンライン最適化戦略など、多くの新機能が組み込まれている。
iWaveV3は、ニューラルネットワークベースの画像符号化のためのIEEE標準を開発するための候補スキームとして採用されている。
- 参考スコア(独自算出の注目度): 18.1150260268062
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Neural network-based image coding has been developing rapidly since its
birth. Until 2022, its performance has surpassed that of the best-performing
traditional image coding framework -- H.266/VVC. Witnessing such success, the
IEEE 1857.11 working subgroup initializes a neural network-based image coding
standard project and issues a corresponding call for proposals (CfP). In
response to the CfP, this paper introduces a novel wavelet-like transform-based
end-to-end image coding framework -- iWaveV3. iWaveV3 incorporates many new
features such as affine wavelet-like transform, perceptual-friendly quality
metric, and more advanced training and online optimization strategies into our
previous wavelet-like transform-based framework iWave++. While preserving the
features of supporting lossy and lossless compression simultaneously, iWaveV3
also achieves state-of-the-art compression efficiency for objective quality and
is very competitive for perceptual quality. As a result, iWaveV3 is adopted as
a candidate scheme for developing the IEEE Standard for neural-network-based
image coding.
- Abstract(参考訳): ニューラルネットワークに基づく画像符号化は誕生以来急速に発展してきた。
2022年まで、その性能は従来の画像符号化フレームワーク、h.266/vvcを上回っていた。
このような成功を目撃したIEEE 1857.11のワーキングサブグループは、ニューラルネットワークベースの画像コーディング標準プロジェクトの初期化と、それに対応する提案(CfP)を発行している。
CfPに応答して、新しいウェーブレットのような変換ベースのエンドツーエンド画像符号化フレームワーク、iWaveV3を紹介する。
iWaveV3には、アフィンウェーブレットのような変換、知覚に優しい品質基準、より高度なトレーニングとオンライン最適化戦略など、多くの新機能が組み込まれています。
ロスレス圧縮とロスレス圧縮を同時にサポートする特徴を保ちながら、iWaveV3は客観的品質の最先端圧縮効率も達成し、知覚品質に非常に競争力がある。
その結果、iWaveV3は、ニューラルネットワークベースの画像符号化のためのIEEE標準を開発するための候補スキームとして採用されている。
関連論文リスト
- CWT-Net: Super-resolution of Histopathology Images Using a Cross-scale Wavelet-based Transformer [15.930878163092983]
超解像(SR)は低解像度画像の品質を高めることを目的としており、医用画像に広く応用されている。
我々は,画像ウェーブレット変換とトランスフォーマーアーキテクチャを利用した,CWT-Netと呼ばれる新しいネットワークを提案する。
本モデルは, 性能評価と可視化評価において, 最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2024-09-11T08:26:28Z) - Compression-Realized Deep Structural Network for Video Quality Enhancement [78.13020206633524]
本稿では,圧縮ビデオの品質向上の課題に焦点をあてる。
既存の手法のほとんどは、圧縮コーデック内での事前処理を最適に活用するための構造設計を欠いている。
新しいパラダイムは、より意識的な品質向上プロセスのために緊急に必要である。
論文 参考訳(メタデータ) (2024-05-10T09:18:17Z) - Hyper-VolTran: Fast and Generalizable One-Shot Image to 3D Object
Structure via HyperNetworks [53.67497327319569]
画像から3Dまでを1つの視点から解く新しいニューラルレンダリング手法を提案する。
提案手法では, 符号付き距離関数を表面表現として使用し, 幾何エンコードボリュームとハイパーネットワークスによる一般化可能な事前処理を取り入れた。
本実験は,一貫した結果と高速な生成による提案手法の利点を示す。
論文 参考訳(メタデータ) (2023-12-24T08:42:37Z) - DGNet: Dynamic Gradient-Guided Network for Water-Related Optics Image
Enhancement [77.0360085530701]
水中画像強調(UIE)は、水中環境によって引き起こされる複雑な劣化のために難しい課題である。
従来の手法では、劣化過程を理想化し、中音や物体の動きが画像の特徴の分布に与える影響を無視することが多い。
提案手法では,予測画像を用いて疑似ラベルを動的に更新し,動的勾配を加えてネットワークの勾配空間を最適化する。
論文 参考訳(メタデータ) (2023-12-12T06:07:21Z) - Frequency Disentangled Features in Neural Image Compression [13.016298207860974]
ニューラル画像圧縮ネットワークは、エントロピーモデルが潜在コードの真の分布とどの程度うまく一致しているかによって制御される。
本稿では,緩和されたスカラー量子化が低ビットレートを実現するのに役立つ特徴レベルの周波数歪みを提案する。
提案するネットワークは,手作業によるコーデックだけでなく,空間的自己回帰エントロピーモデル上に構築されたニューラルネットワークベースのコーデックよりも優れている。
論文 参考訳(メタデータ) (2023-08-04T14:55:44Z) - D3C2-Net: Dual-Domain Deep Convolutional Coding Network for Compressive
Sensing [9.014593915305069]
深部展開ネットワーク(DUN)は圧縮センシング(CS)において顕著な成功を収めた
提案したフレームワークをディープニューラルネットワークに展開することにより、新たなデュアルドメインディープ畳み込み符号化ネットワーク(D3C2-Net)をさらに設計する。
自然画像とMR画像の実験により、我々のD3C2-Netは、他の最先端技術よりも高い性能と精度・複雑さのトレードオフを達成することが示された。
論文 参考訳(メタデータ) (2022-07-27T14:52:32Z) - aiWave: Volumetric Image Compression with 3-D Trained Affine
Wavelet-like Transform [43.984890290691695]
最も一般的なボリューム画像圧縮法はJP3Dのようなウェーブレット変換に基づいている。
本稿では,信号依存型および非分離型変換を実現するために,まず3次元トレーニングウェーブレット様変換を設計する。
次に、アフィンウェーブレットベースを導入し、ボリューム画像の異なる領域における様々な局所的相関をキャプチャする。
論文 参考訳(メタデータ) (2022-03-11T10:02:01Z) - Neural Data-Dependent Transform for Learned Image Compression [72.86505042102155]
ニューラルデータに依存した変換を構築し,各画像の符号化効率を最適化する連続オンラインモード決定機構を導入する。
実験の結果,提案したニューラルシンタクス設計と連続オンラインモード決定機構の有効性が示された。
論文 参考訳(メタデータ) (2022-03-09T14:56:48Z) - Spatially-Adaptive Pixelwise Networks for Fast Image Translation [57.359250882770525]
高速かつ効率的な画像-画像変換を目的とした新しいジェネレータアーキテクチャを提案する。
私たちはピクセルワイズネットワークを使用します。つまり、各ピクセルは他のピクセルとは独立して処理されます。
私たちのモデルは最先端のベースラインよりも最大18倍高速です。
論文 参考訳(メタデータ) (2020-12-05T10:02:03Z) - Online Exemplar Fine-Tuning for Image-to-Image Translation [32.556050882376965]
ディープ畳み込みニューラルネットワーク(CNN)において、既存の画像から画像への変換を解決するには、ネットワークパラメータを最適化するためのトレーニングフェーズが必要である。
入力画像ペアが与えられたオンライン最適化により,先進的な翻訳を初めて解決する新しいフレームワークを提案する。
我々のフレームワークは、既存の手法の主な課題であるオフライントレーニングフェーズを必要とせず、オンラインの最適化を可能にするためにトレーニング済みのネットワークを必要としています。
論文 参考訳(メタデータ) (2020-11-18T15:13:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。