論文の概要: Bit Allocation using Optimization
- arxiv url: http://arxiv.org/abs/2209.09422v4
- Date: Tue, 25 Apr 2023 05:41:10 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-27 03:55:52.806088
- Title: Bit Allocation using Optimization
- Title(参考訳): 最適化によるビット割り当て
- Authors: Tongda Xu, Han Gao, Chenjian Gao, Yuanyuan Wang, Dailan He, Jinyong
Pi, Jixiang Luo, Ziyu Zhu, Mao Ye, Hongwei Qin, Yan Wang, Jingjing Liu,
Ya-Qin Zhang
- Abstract要約: ニューラルビデオ圧縮(NVC)におけるビット割り当てと半補正変分推論(SAVI)の関係を示す。
従来のビット割り当て手法と異なり、本手法では経験的モデルを必要としないため、最適である。
提案手法は,ビット割り当てのR-D性能の実証的バウンダリとして機能し,性能超過が速度を符号化するシナリオに適用できる。
- 参考スコア(独自算出の注目度): 18.847197238348784
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we consider the problem of bit allocation in Neural Video
Compression (NVC). First, we reveal a fundamental relationship between bit
allocation in NVC and Semi-Amortized Variational Inference (SAVI).
Specifically, we show that SAVI with GoP (Group-of-Picture)-level likelihood is
equivalent to pixel-level bit allocation with precise rate \& quality
dependency model. Based on this equivalence, we establish a new paradigm of bit
allocation using SAVI. Different from previous bit allocation methods, our
approach requires no empirical model and is thus optimal. Moreover, as the
original SAVI using gradient ascent only applies to single-level latent, we
extend the SAVI to multi-level such as NVC by recursively applying
back-propagating through gradient ascent. Finally, we propose a tractable
approximation for practical implementation. Our method can be applied to
scenarios where performance outweights encoding speed, and serves as an
empirical bound on the R-D performance of bit allocation. Experimental results
show that current state-of-the-art bit allocation algorithms still have a room
of $\approx 0.5$ dB PSNR to improve compared with ours. Code is available at
\url{https://github.com/tongdaxu/Bit-Allocation-Using-Optimization}.
- Abstract(参考訳): 本稿では,ニューラルビデオ圧縮(NVC)におけるビット割り当ての問題について考察する。
まず,NVCにおけるビット割り当てと半補正変分推論(SAVI)の基本的な関係を明らかにする。
具体的には、GoP(Group-of-Picture)レベルの確率を持つSAVIは、正確なレート \および品質依存モデルを持つピクセルレベルのビット割り当てと等価であることを示す。
この等価性に基づいて、SAVIを用いたビット割り当ての新しいパラダイムを確立する。
従来のビット割当法とは異なり、この手法は経験モデルを必要としないため最適である。
さらに, 勾配上昇を用いたオリジナルのSAVIは, 単一レベル潜水剤にのみ適用するため, 勾配上昇による逆伝播を再帰的に適用することにより, SAVIをNVCなどのマルチレベルに拡張する。
最後に,実用的な実装のためのトラクタブル近似を提案する。
提案手法は,ビット割り当てのR-D性能の実証的バウンダリとして機能し,性能超過が速度を符号化するシナリオに適用できる。
実験結果から、現在の最先端ビット割り当てアルゴリズムは、我々のものと比較して改善するために、$\approx 0.5$ dB PSNRの空間を持つことがわかった。
コードは \url{https://github.com/tongdaxu/bit-allocation-using-optimization} で利用可能である。
関連論文リスト
- Sparse-Tuning: Adapting Vision Transformers with Efficient Fine-tuning and Inference [14.030836300221756]
textbfSparse-Tuningは、画像やビデオの情報冗長性を考慮に入れた新しいPEFTメソッドである。
Sparse-Tuningは各層で処理されるトークンの量を最小限に抑え、計算とメモリのオーバーヘッドを2次的に削減する。
我々のSparse-TuningはGFLOPsを62%-70%に削減し,最先端性能を実現した。
論文 参考訳(メタデータ) (2024-05-23T15:34:53Z) - AdaBM: On-the-Fly Adaptive Bit Mapping for Image Super-Resolution [53.23803932357899]
我々は、処理時間を数時間から秒に短縮する最初のオンザフライ適応量子化フレームワークを導入する。
我々は,従来の適応量子化法と競合する性能を実現し,処理時間をx2000で高速化する。
論文 参考訳(メタデータ) (2024-04-04T08:37:27Z) - Rethinking Few-shot 3D Point Cloud Semantic Segmentation [62.80639841429669]
本稿では,FS-PCSによる3Dポイント・クラウドセマンティックセマンティックセグメンテーションについて再検討する。
我々は、最先端の2つの重要な問題、前景の漏洩とスパースポイントの分布に焦点をあてる。
これらの問題に対処するために、新しいベンチマークを構築するための標準化されたFS-PCS設定を導入する。
論文 参考訳(メタデータ) (2024-03-01T15:14:47Z) - Neural Fields with Thermal Activations for Arbitrary-Scale Super-Resolution [56.089473862929886]
本稿では,適応型ガウスPSFを用いて点を問合せできる新しい設計手法を提案する。
理論的に保証されたアンチエイリアスにより、任意のスケールの単一画像の超解像のための新しい手法が確立される。
論文 参考訳(メタデータ) (2023-11-29T14:01:28Z) - Binarized Spectral Compressive Imaging [59.18636040850608]
ハイパースペクトル画像(HSI)再構成のための既存のディープラーニングモデルは、優れた性能を実現するが、膨大なメモリと計算資源を持つ強力なハードウェアを必要とする。
本稿では,BiSRNet(Biarized Spectral-Redistribution Network)を提案する。
BiSRNetは,提案手法を用いてベースモデルのバイナライズを行う。
論文 参考訳(メタデータ) (2023-05-17T15:36:08Z) - Modality-Agnostic Variational Compression of Implicit Neural
Representations [96.35492043867104]
Inlicit Neural Representation (INR) としてパラメータ化されたデータの関数的ビューに基づくモーダリティ非依存型ニューラル圧縮アルゴリズムを提案する。
潜時符号化と疎性の間のギャップを埋めて、ソフトゲーティング機構に非直線的にマッピングされたコンパクト潜時表現を得る。
このような潜在表現のデータセットを得た後、ニューラル圧縮を用いてモーダリティ非依存空間におけるレート/歪みトレードオフを直接最適化する。
論文 参考訳(メタデータ) (2023-01-23T15:22:42Z) - Correcting the Sub-optimal Bit Allocation [16.36843313050813]
近年,ビット割り当てが最適であると主張する手法が,実装上,準最適であることが示されている。
補正されたビット割り当ての計算的実現可能性に基づいて、修正された最適ビット割り当てアルゴリズムを導出する。
提案した補正は,R-D性能とソース誤差の点で誤りビット割り当てを著しく改善し,他のビット割り当て手法よりも大きなマージンで性能を向上する。
論文 参考訳(メタデータ) (2022-09-29T06:24:14Z) - Sparse Tensor-based Multiscale Representation for Point Cloud Geometry
Compression [18.24902526033056]
Sparse Processing (STP) を用いたVoxelized PCGのマルチスケール表現による統合ポイントクラウド幾何 (PCG) 圧縮手法を開発した。
複雑性を適用することで複雑性を著しく減少させるのは、最も確率の高いVoxels(MP-POV)を中心とした畳み込みのみを実行するためである。
提案手法は,すべてのスケールでモデル共有を行うため,ポイントワイズによる軽量な複雑性と,小さなストレージ欲求を示す。
論文 参考訳(メタデータ) (2021-11-20T17:02:45Z) - RNN Training along Locally Optimal Trajectories via Frank-Wolfe
Algorithm [50.76576946099215]
小領域の損失面に局所的なミニマを反復的に求めることにより,RNNの新規かつ効率的なトレーニング手法を提案する。
新たなRNNトレーニング手法を開発し,追加コストを伴っても,全体のトレーニングコストがバックプロパゲーションよりも低いことを実証的に観察した。
論文 参考訳(メタデータ) (2020-10-12T01:59:18Z) - FarSee-Net: Real-Time Semantic Segmentation by Efficient Multi-scale
Context Aggregation and Feature Space Super-resolution [14.226301825772174]
Cascaded Factorized Atrous Space Pyramid Pooling (CF-ASPP) と呼ばれる新しい効率的なモジュールについて紹介する。
これは畳み込みニューラルネットワーク(CNN)のための軽量なカスケード構造であり、コンテキスト情報を効率的に活用する。
我々は1枚のNivida Titan X (Maxwell) GPUカードでCityscapesテストセットの84fpsで68.4% mIoUを達成した。
論文 参考訳(メタデータ) (2020-03-09T03:53:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。