論文の概要: B-CANF: Adaptive B-frame Coding with Conditional Augmented Normalizing
Flows
- arxiv url: http://arxiv.org/abs/2209.01769v1
- Date: Mon, 5 Sep 2022 05:28:19 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-07 15:03:22.856635
- Title: B-CANF: Adaptive B-frame Coding with Conditional Augmented Normalizing
Flows
- Title(参考訳): B-CANF:条件付き正規化流を用いた適応的Bフレーム符号化
- Authors: Mu-Jung Chen, Yi-Hsin Chen, Peng-Yu Chen, Chih Hsuan Lin, Yung-Han Ho,
Wen-Hsiao Peng
- Abstract要約: この研究は、Bフレームコーディングのための条件付き拡張正規化フローを利用するBフレームコーディングフレームワークであるB-CANFを導入する。
条件付きPフレームコーディングの最近の進歩により、B-CANFは条件付きモーションとフレーム間コーディングの両方にフローベースのモデルを適用する最初の試みである。
- 参考スコア(独自算出の注目度): 19.813387694493706
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This work introduces a B-frame coding framework, termed B-CANF, that exploits
conditional augmented normalizing flows for B-frame coding. Learned B-frame
coding is less explored and more challenging. Motivated by recent advances in
conditional P-frame coding, B-CANF is the first attempt at applying flow-based
models to both conditional motion and inter-frame coding. B-CANF features
frame-type adaptive coding that learns better bit allocation for hierarchical
B-frame coding. B-CANF also introduces a special type of B-frame, called
B*-frame, to mimic P-frame coding. On commonly used datasets, B-CANF achieves
the state-of-the-art compression performance, showing comparable BD-rate
results (in terms of PSNR-RGB) to HM-16.23 under the random access
configuration.
- Abstract(参考訳): この研究は、Bフレームコーディングのための条件付き拡張正規化フローを利用するBフレームコーディングフレームワークであるB-CANFを導入する。
学習されたbフレームコーディングは、より探索的で、より困難である。
条件付きPフレームコーディングの最近の進歩により、B-CANFは条件付きモーションとフレーム間コーディングの両方にフローベースのモデルを適用する最初の試みである。
B-CANFはフレーム型適応符号化を備え、階層的Bフレーム符号化のビット割り当てを改善する。
B-CANFはまた、B*フレームと呼ばれる特別なタイプのBフレームを導入し、Pフレームのコーディングを模倣した。
一般的に使用されるデータセットでは、B-CANFは最先端の圧縮性能を達成し、ランダムアクセス構成の下では(PSNR-RGBの観点から)HM-16.23と同等なBDレートの結果を示す。
関連論文リスト
- Improved Video VAE for Latent Video Diffusion Model [55.818110540710215]
ビデオオートエンコーダ(VAE)は、ピクセルデータを低次元の潜在空間に圧縮することを目的としており、OpenAIのSoraで重要な役割を果たしている。
既存のVAEのほとんどは、時間空間圧縮のために3次元因果構造に事前訓練された画像VAEを注入する。
ビデオVAE(IV-VAE)をさらに改善するための新しいKTCアーキテクチャとGCConvモジュールを提案する。
論文 参考訳(メタデータ) (2024-11-10T12:43:38Z) - Bi-Directional Deep Contextual Video Compression [17.195099321371526]
本稿では,Bフレームに適した双方向深層映像圧縮方式をDCVC-Bと呼ぶ。
まず、効果的な動き差分符号化のための双方向の動き差分文脈伝搬法を提案する。
次に、双方向文脈圧縮モデルと対応する双方向時間エントロピーモデルを提案する。
第3に,階層的品質構造に基づくトレーニング戦略を提案し,画像の大規模なグループ間で効果的なビット割り当てを実現する。
論文 参考訳(メタデータ) (2024-08-16T08:45:25Z) - UCVC: A Unified Contextual Video Compression Framework with Joint
P-frame and B-frame Coding [29.44234507064189]
本稿では,第6回学習画像圧縮チャレンジ(CLIC)のビデオ圧縮トラックに対する学習ビデオ圧縮手法を提案する。
共同PフレームおよびBフレーム符号化のための統合文脈ビデオ圧縮フレームワーク(UCVC)を提案する。
論文 参考訳(メタデータ) (2024-02-02T10:25:39Z) - IBVC: Interpolation-driven B-frame Video Compression [68.18440522300536]
Bフレームビデオ圧縮は、双方向動作推定と動き補償(MEMC)符号化をミドルフレーム再構成に適用することを目的としている。
従来の学習アプローチでは、しばしば双方向の光フロー推定に依存するニューラルネットワークのPフレームコーデックをBフレームに直接拡張する。
これらの問題に対処するために,IBVC (Interpolation-B-frame Video Compression) という単純な構造を提案する。
論文 参考訳(メタデータ) (2023-09-25T02:45:51Z) - Frame Flexible Network [52.623337134518835]
既存のビデオ認識アルゴリズムは、常に異なるフレーム番号の入力に対して異なるトレーニングパイプラインを実行する。
トレーニングに使われていない他のフレームを使用してモデルを評価した場合、パフォーマンスが大幅に低下するのを観察する。
本稿では,フレームフレキシブルネットワーク(FFN)と呼ばれる汎用フレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-26T20:51:35Z) - Advancing Learned Video Compression with In-loop Frame Prediction [177.67218448278143]
本稿では,ループ内フレーム予測モジュールを用いたALVC(Advanced Learned Video Compression)アプローチを提案する。
予測フレームは、以前圧縮されたフレームよりも優れた参照として機能し、圧縮性能の恩恵を受けることができる。
本実験は,学習ビデオ圧縮におけるALVC手法の最先端性能を示すものである。
論文 参考訳(メタデータ) (2022-11-13T19:53:14Z) - Inter-Frame Compression for Dynamic Point Cloud Geometry Coding [14.79613731546357]
本稿では,従来のフレームを用いて,現在のフレームの潜在表現を予測する圧縮手法を提案する。
提案するネットワークは,階層型マルチスケール3次元特徴学習による畳み込みを利用して,現在のフレームを符号化する。
提案手法は, G-PCCv20 Octreeに対して88%以上のBD-Rate (Bjontegaard Delta Rate)削減を実現する。
論文 参考訳(メタデータ) (2022-07-25T22:17:19Z) - TTVFI: Learning Trajectory-Aware Transformer for Video Frame
Interpolation [50.49396123016185]
ビデオフレーム(VFI)は、2つの連続するフレーム間の中間フレームを合成することを目的としている。
ビデオフレーム補間用トラジェクトリ対応トランス (TTVFI) を提案する。
提案手法は,4つの広く使用されているVFIベンチマークにおいて,他の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2022-07-19T03:37:49Z) - CANF-VC: Conditional Augmented Normalizing Flows for Video Compression [81.41594331948843]
CANF-VCは、エンドツーエンドの学習ベースのビデオ圧縮システムである。
条件付き拡張正規化フロー(ANF)に基づく。
論文 参考訳(メタデータ) (2022-07-12T04:53:24Z) - Extending Neural P-frame Codecs for B-frame Coding [15.102346715690755]
当社のB-frameソリューションは、既存のP-frameメソッドに基づいています。
提案手法を既存のPフレームで使用することにより,UVGデータセットのビットレートを28.5%削減できることを示す。
論文 参考訳(メタデータ) (2021-03-30T21:25:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。