論文の概要: Bit Allocation using Optimization
- arxiv url: http://arxiv.org/abs/2209.09422v1
- Date: Tue, 20 Sep 2022 02:40:52 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-21 18:37:50.150404
- Title: Bit Allocation using Optimization
- Title(参考訳): 最適化によるビット割り当て
- Authors: Tongda Xu, Han Gao, Chenjian Gao, Jinyong Pi, Yanghao Li, Yuanyuan
Wang, Ziyu Zhu, Dailan He, Mao Ye, Hongwei Qin, Yan Wang
- Abstract要約: ニューラルビデオ圧縮(NVC)におけるビット割り当ての問題について考察する。
フレーム参照構造のため、すべてのフレームに対して同じR-D(Rate-Distortion)トレードオフパラメータを使用する現在のNVCメソッドは、サブ最適である。
半補正変分推論(SAVI)に基づく連続ビット実装法を提案する。
正確なR-Dモデルを用いてビット割り当てと等価性を証明し,提案手法の最適性を示す。
- 参考スコア(独自算出の注目度): 23.441258607504956
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we consider the problem of bit allocation in neural video
compression (NVC). Due to the frame reference structure, current NVC methods
using the same R-D (Rate-Distortion) trade-off parameter $\lambda$ for all
frames are suboptimal, which brings the need for bit allocation. Unlike
previous methods based on heuristic and empirical R-D models, we propose to
solve this problem by gradient-based optimization. Specifically, we first
propose a continuous bit implementation method based on Semi-Amortized
Variational Inference (SAVI). Then, we propose a pixel-level implicit bit
allocation method using iterative optimization by changing the SAVI target.
Moreover, we derive the precise R-D model based on the differentiable trait of
NVC. And we show the optimality of our method by proofing its equivalence to
the bit allocation with precise R-D model. Experimental results show that our
approach significantly improves NVC methods and outperforms existing bit
allocation methods. Our approach is plug-and-play for all differentiable NVC
methods, and it can be directly adopted on existing pre-trained models.
- Abstract(参考訳): 本稿では,ニューラルビデオ圧縮(NVC)におけるビット割り当ての問題について考察する。
フレーム参照構造のため、全てのフレームに対して同じr-d (rate-distortion) トレードオフパラメータである$\lambda$を使用する現在のnvcメソッドは最適ではないため、ビット割り当てが必要となる。
経験的R-Dモデルに基づく従来の手法とは異なり、勾配に基づく最適化によりこの問題を解決することを提案する。
具体的には,Semi-Amortized Variational Inference (SAVI)に基づく連続ビット実装手法を提案する。
次に,saviターゲットの変更による反復最適化を用いた画素レベルの暗黙的ビット割当法を提案する。
さらに,NVCの微分可能特性に基づいて,高精度なR-Dモデルを導出する。
また, 正確なR-Dモデルを用いて, ビット割り当てと等価性を証明し, 提案手法の最適性を示す。
実験の結果,提案手法はNVC法を大幅に改善し,既存のビット割り当て法より優れていた。
我々のアプローチは、すべての異なるNVCメソッドに対してプラグイン・アンド・プレイであり、既存の事前学習モデルに直接適用することができる。
関連論文リスト
- Sparse-Tuning: Adapting Vision Transformers with Efficient Fine-tuning and Inference [14.030836300221756]
textbfSparse-Tuningは、画像やビデオの情報冗長性を考慮に入れた新しいPEFTメソッドである。
Sparse-Tuningは各層で処理されるトークンの量を最小限に抑え、計算とメモリのオーバーヘッドを2次的に削減する。
我々のSparse-TuningはGFLOPsを62%-70%に削減し,最先端性能を実現した。
論文 参考訳(メタデータ) (2024-05-23T15:34:53Z) - AdaBM: On-the-Fly Adaptive Bit Mapping for Image Super-Resolution [53.23803932357899]
我々は、処理時間を数時間から秒に短縮する最初のオンザフライ適応量子化フレームワークを導入する。
我々は,従来の適応量子化法と競合する性能を実現し,処理時間をx2000で高速化する。
論文 参考訳(メタデータ) (2024-04-04T08:37:27Z) - Rethinking Few-shot 3D Point Cloud Semantic Segmentation [62.80639841429669]
本稿では,FS-PCSによる3Dポイント・クラウドセマンティックセマンティックセグメンテーションについて再検討する。
我々は、最先端の2つの重要な問題、前景の漏洩とスパースポイントの分布に焦点をあてる。
これらの問題に対処するために、新しいベンチマークを構築するための標準化されたFS-PCS設定を導入する。
論文 参考訳(メタデータ) (2024-03-01T15:14:47Z) - Neural Fields with Thermal Activations for Arbitrary-Scale Super-Resolution [56.089473862929886]
本稿では,適応型ガウスPSFを用いて点を問合せできる新しい設計手法を提案する。
理論的に保証されたアンチエイリアスにより、任意のスケールの単一画像の超解像のための新しい手法が確立される。
論文 参考訳(メタデータ) (2023-11-29T14:01:28Z) - Binarized Spectral Compressive Imaging [59.18636040850608]
ハイパースペクトル画像(HSI)再構成のための既存のディープラーニングモデルは、優れた性能を実現するが、膨大なメモリと計算資源を持つ強力なハードウェアを必要とする。
本稿では,BiSRNet(Biarized Spectral-Redistribution Network)を提案する。
BiSRNetは,提案手法を用いてベースモデルのバイナライズを行う。
論文 参考訳(メタデータ) (2023-05-17T15:36:08Z) - Modality-Agnostic Variational Compression of Implicit Neural
Representations [96.35492043867104]
Inlicit Neural Representation (INR) としてパラメータ化されたデータの関数的ビューに基づくモーダリティ非依存型ニューラル圧縮アルゴリズムを提案する。
潜時符号化と疎性の間のギャップを埋めて、ソフトゲーティング機構に非直線的にマッピングされたコンパクト潜時表現を得る。
このような潜在表現のデータセットを得た後、ニューラル圧縮を用いてモーダリティ非依存空間におけるレート/歪みトレードオフを直接最適化する。
論文 参考訳(メタデータ) (2023-01-23T15:22:42Z) - Correcting the Sub-optimal Bit Allocation [16.36843313050813]
近年,ビット割り当てが最適であると主張する手法が,実装上,準最適であることが示されている。
補正されたビット割り当ての計算的実現可能性に基づいて、修正された最適ビット割り当てアルゴリズムを導出する。
提案した補正は,R-D性能とソース誤差の点で誤りビット割り当てを著しく改善し,他のビット割り当て手法よりも大きなマージンで性能を向上する。
論文 参考訳(メタデータ) (2022-09-29T06:24:14Z) - Sparse Tensor-based Multiscale Representation for Point Cloud Geometry
Compression [18.24902526033056]
Sparse Processing (STP) を用いたVoxelized PCGのマルチスケール表現による統合ポイントクラウド幾何 (PCG) 圧縮手法を開発した。
複雑性を適用することで複雑性を著しく減少させるのは、最も確率の高いVoxels(MP-POV)を中心とした畳み込みのみを実行するためである。
提案手法は,すべてのスケールでモデル共有を行うため,ポイントワイズによる軽量な複雑性と,小さなストレージ欲求を示す。
論文 参考訳(メタデータ) (2021-11-20T17:02:45Z) - RNN Training along Locally Optimal Trajectories via Frank-Wolfe
Algorithm [50.76576946099215]
小領域の損失面に局所的なミニマを反復的に求めることにより,RNNの新規かつ効率的なトレーニング手法を提案する。
新たなRNNトレーニング手法を開発し,追加コストを伴っても,全体のトレーニングコストがバックプロパゲーションよりも低いことを実証的に観察した。
論文 参考訳(メタデータ) (2020-10-12T01:59:18Z) - FarSee-Net: Real-Time Semantic Segmentation by Efficient Multi-scale
Context Aggregation and Feature Space Super-resolution [14.226301825772174]
Cascaded Factorized Atrous Space Pyramid Pooling (CF-ASPP) と呼ばれる新しい効率的なモジュールについて紹介する。
これは畳み込みニューラルネットワーク(CNN)のための軽量なカスケード構造であり、コンテキスト情報を効率的に活用する。
我々は1枚のNivida Titan X (Maxwell) GPUカードでCityscapesテストセットの84fpsで68.4% mIoUを達成した。
論文 参考訳(メタデータ) (2020-03-09T03:53:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。