論文の概要: Rate Distortion Characteristic Modeling for Neural Image Compression
- arxiv url: http://arxiv.org/abs/2106.12954v1
- Date: Thu, 24 Jun 2021 12:23:05 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-25 15:11:48.066333
- Title: Rate Distortion Characteristic Modeling for Neural Image Compression
- Title(参考訳): ニューラルイメージ圧縮のためのレート歪み特性モデリング
- Authors: Chuanmin Jia, Ziqing Ge, Shanshe Wang, Siwei Ma, Wen Gao
- Abstract要約: エンドツーエンドの最適化機能は、ニューラルイメージ圧縮(NIC)の優れた損失圧縮性能を提供する。
異なるモデルは、R-D空間の異なる点に到達するために訓練される必要がある。
深層ネットワークと統計モデルを用いてNICのR-D挙動を記述するために,本質的な数学的関数の定式化に努めている。
- 参考スコア(独自算出の注目度): 59.25700168404325
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: End-to-end optimization capability offers neural image compression (NIC)
superior lossy compression performance. However, distinct models are required
to be trained to reach different points in the rate-distortion (R-D) space. In
this paper, we consider the problem of R-D characteristic analysis and modeling
for NIC. We make efforts to formulate the essential mathematical functions to
describe the R-D behavior of NIC using deep network and statistical modeling.
Thus continuous bit-rate points could be elegantly realized by leveraging such
model via a single trained network. In this regard, we propose a plugin-in
module to learn the relationship between the target bit-rate and the binary
representation for the latent variable of auto-encoder. Furthermore, we model
the rate and distortion characteristic of NIC as a function of the coding
parameter $\lambda$ respectively. Our experiments show our proposed method is
easy to adopt and obtains competitive coding performance with fixed-rate coding
approaches, which would benefit the practical deployment of NIC. In addition,
the proposed model could be applied to NIC rate control with limited bit-rate
error using a single network.
- Abstract(参考訳): エンドツーエンドの最適化機能は、ニューラルイメージ圧縮(NIC)の優れた損失圧縮性能を提供する。
しかし、r-d空間において異なる点に到達するために異なるモデルが訓練される必要がある。
本稿では,NICにおけるR-D特性解析とモデリングの問題点について考察する。
深層ネットワークと統計モデルを用いてNICのR-D挙動を記述するために,本質的な数学的関数を定式化する。
このように、連続ビットレートポイントは、単一のトレーニングネットワークを介してそのようなモデルを活用することでエレガントに実現できる。
本稿では,対象のビットレートと自動エンコーダの潜在変数のバイナリ表現との関係を学習するためのプラグインモジュールを提案する。
さらに、符号化パラメータ$\lambda$の関数としてNICの速度特性と歪み特性をモデル化する。
提案手法は適用が容易であり, nicの実用化に資する固定レート符号化手法と競合する符号化性能が得られることを示す。
さらに,単一ネットワークを用いたビットレート誤差の少ないnicレート制御に提案モデルを適用することができた。
関連論文リスト
- GFN: A graph feedforward network for resolution-invariant reduced operator learning in multifidelity applications [0.0]
本研究は,多忠実度アプリケーションのための新しい分解能不変モデルオーダー削減戦略を提案する。
我々はこの研究で開発された新しいニューラルネットワーク層、グラフフィードフォワードネットワークに基づいてアーキテクチャを構築した。
パラメトリックな偏微分方程式に対する自己エンコーダに基づく還元戦略において,異なるメッシュサイズでのトレーニングとテストの能力を利用する。
論文 参考訳(メタデータ) (2024-06-05T18:31:37Z) - Controlling Rate, Distortion, and Realism: Towards a Single Comprehensive Neural Image Compression Model [4.096453902709292]
異なるビットレートで画像を圧縮する可変レート生成NICモデルを提案する。
提案手法を取り入れることで,ビットレート,歪み,リアリズムを1つのモデルで調整することができる。
我々の手法は、最先端の単一レート NIC モデルの性能と一致するか、上回っている。
論文 参考訳(メタデータ) (2024-05-27T04:22:25Z) - TCCT-Net: Two-Stream Network Architecture for Fast and Efficient Engagement Estimation via Behavioral Feature Signals [58.865901821451295]
本稿では,新しい2ストリーム機能融合 "Tensor-Convolution and Convolution-Transformer Network" (TCCT-Net) アーキテクチャを提案する。
時間空間領域における意味のあるパターンをよりよく学習するために、ハイブリッド畳み込み変換器を統合する「CT」ストリームを設計する。
並行して、時間周波数領域からリッチなパターンを効率的に抽出するために、連続ウェーブレット変換(CWT)を用いて情報を2次元テンソル形式で表現する「TC」ストリームを導入する。
論文 参考訳(メタデータ) (2024-04-15T06:01:48Z) - Auto-Train-Once: Controller Network Guided Automatic Network Pruning from Scratch [72.26822499434446]
オートトレインオース (Auto-Train-Once, ATO) は、DNNの計算コストと記憶コストを自動的に削減するために設計された、革新的なネットワークプルーニングアルゴリズムである。
総合的な収束解析と広範な実験を行い,本手法が様々なモデルアーキテクチャにおける最先端性能を実現することを示す。
論文 参考訳(メタデータ) (2024-03-21T02:33:37Z) - On Tuning Neural ODE for Stability, Consistency and Faster Convergence [0.0]
本研究では,Nesterov'sAccelerated gradient (NAG) を用いたODE-solverを提案する。
我々は、より速くトレーニングし、より優れた、または同等のパフォーマンスをニューラルダイオードに対して達成し、アプローチの有効性を実証的に実証した。
論文 参考訳(メタデータ) (2023-12-04T06:18:10Z) - Multi-Sample Training for Neural Image Compression [11.167668701825134]
現在の最先端(ソータ)法では、一様後部を近似量子化雑音とし、単サンプルパスワイズ推定器を用いて証拠下界(ELBO)の勾配を近似する。
ELBOよりも厳密で,サンプルサイズの増加とともにログ可能性に収束するマルチサンプル重み付きオートエンコーダ(IWAE)ターゲットを用いたNIC訓練を提案する。
我々のMS-NICはプラグアンドプレイであり、他のニューラル圧縮タスクに容易に拡張できる。
論文 参考訳(メタデータ) (2022-09-28T04:42:02Z) - Flexible Neural Image Compression via Code Editing [8.499248314440557]
ニューラル画像圧縮(NIC)は、レート歪み(R-D)性能において従来の画像コーデックよりも優れていた。
通常、R-D曲線の各点に専用エンコーダとデコーダのペアが必要であるため、実際の展開を妨げている。
本稿では,セミアモタイズされた推論と適応量子化に基づくNICの高フレキシブルな符号化手法であるCode Editingを提案する。
論文 参考訳(メタデータ) (2022-09-19T09:41:43Z) - Reducing Redundancy in the Bottleneck Representation of the Autoencoders [98.78384185493624]
オートエンコーダは教師なしニューラルネットワークの一種であり、様々なタスクを解くのに使用できる。
本稿では,ボトルネック表現における特徴冗長性を明示的に罰する手法を提案する。
我々は,3つの異なるデータセットを用いた次元削減,MNISTデータセットを用いた画像圧縮,ファッションMNISTを用いた画像デノナイズという,さまざまなタスクにまたがってアプローチを検証した。
論文 参考訳(メタデータ) (2022-02-09T18:48:02Z) - Substitutional Neural Image Compression [48.20906717052056]
置換型ニューラルイメージ圧縮(snic)は、あらゆるニューラルイメージ圧縮モデルを強化する一般的なアプローチである。
フレキシブルな歪みメトリックに向けて圧縮性能を高め、単一のモデルインスタンスを使用したビットレート制御を可能にする。
論文 参考訳(メタデータ) (2021-05-16T20:53:31Z) - Belief Propagation Reloaded: Learning BP-Layers for Labeling Problems [83.98774574197613]
最も単純な推論手法の1つとして、切り詰められた最大積のBelief伝播を取り上げ、それをディープラーニングモデルの適切なコンポーネントにするために必要となるものを加えます。
このBP-Layerは畳み込みニューラルネットワーク(CNN)の最終ブロックまたは中間ブロックとして使用できる
このモデルは様々な密集予測問題に適用可能であり、パラメータ効率が高く、ステレオ、光フロー、セマンティックセグメンテーションにおける堅牢な解を提供する。
論文 参考訳(メタデータ) (2020-03-13T13:11:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。