論文の概要: Combining Progressive Rethinking and Collaborative Learning: A Deep
Framework for In-Loop Filtering
- arxiv url: http://arxiv.org/abs/2001.05651v3
- Date: Wed, 31 Mar 2021 09:33:27 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-11 00:48:57.224528
- Title: Combining Progressive Rethinking and Collaborative Learning: A Deep
Framework for In-Loop Filtering
- Title(参考訳): 進化的再考と協調学習を組み合わせる - ループ内フィルタリングのためのディープフレームワーク
- Authors: Dezhao Wang, Sifeng Xia, Wenhan Yang, and Jiaying Liu
- Abstract要約: 再構築されたフレーム内およびフレーム間の品質を改善するために,プログレッシブな再考と協調学習機構を備えたディープネットワークを設計する。
フレーム内情報を用いたPRNは,全イントラ(AI)構成下のHEVCベースラインと比較して平均で9.0%のBDレート低減を実現している。
- 参考スコア(独自算出の注目度): 67.22506488158707
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we aim to address issues of (1) joint spatial-temporal
modeling and (2) side information injection for deep-learning based in-loop
filter. For (1), we design a deep network with both progressive rethinking and
collaborative learning mechanisms to improve quality of the reconstructed
intra-frames and inter-frames, respectively. For intra coding, a Progressive
Rethinking Network (PRN) is designed to simulate the human decision mechanism
for effective spatial modeling. Our designed block introduces an additional
inter-block connection to bypass a high-dimensional informative feature before
the bottleneck module across blocks to review the complete past memorized
experiences and rethinks progressively. For inter coding, the current
reconstructed frame interacts with reference frames (peak quality frame and the
nearest adjacent frame) collaboratively at the feature level. For (2), we
extract both intra-frame and inter-frame side information for better context
modeling. A coarse-to-fine partition map based on HEVC partition trees is built
as the intra-frame side information. Furthermore, the warped features of the
reference frames are offered as the inter-frame side information. Our PRN with
intra-frame side information provides 9.0% BD-rate reduction on average
compared to HEVC baseline under All-intra (AI) configuration. While under
Low-Delay B (LDB), Low-Delay P (LDP) and Random Access (RA) configuration, our
PRN with inter-frame side information provides 9.0%, 10.6% and 8.0% BD-rate
reduction on average respectively. Our project webpage is
https://dezhao-wang.github.io/PRN-v2/.
- Abstract(参考訳): 本稿では,(1)空間・時空間モデリングと(2)深層学習型インループフィルタの側面情報注入の問題に対処することを目的とする。
1) フレーム間およびフレーム間の品質を向上させるために, プログレッシブな再考機構と協調学習機構の両方を備えた深層ネットワークを設計した。
イントラコーディングのために、プログレッシブリ思考ネットワーク(prn)は、効果的な空間モデリングのために人間の決定機構をシミュレートするために設計されている。
我々の設計したブロックは、ブロックにまたがるボトルネックモジュールの前に高次元情報機能をバイパスするブロック間接続を導入し、過去の記憶された経験を完全にレビューし、徐々に再考する。
インターコーディングでは、現在の再構成フレームは、特徴レベルで参照フレーム(ピーク品質フレームと隣接フレーム)と協調的に相互作用する。
2)では、フレーム内とフレーム間の両方の情報を抽出し、コンテキストモデリングを改善する。
HEVCパーティションツリーに基づく粗大なパーティションマップをフレーム内側情報として構築する。
さらに、参照フレームの歪んだ特徴をフレーム間側情報として提供する。
フレーム内情報を用いたPRNは,全イントラ(AI)構成下のHEVCベースラインと比較して平均で9.0%のBDレート低減を実現している。
低遅延B(LDB)、低遅延P(LDP)、ランダムアクセス(RA)構成では、フレーム間情報をそれぞれ平均9.0%、10.6%、および8.0%のBDレートで提供する。
私たちのプロジェクトwebページはhttps://dezhao-wang.github.io/prn-v2/です。
関連論文リスト
- Unite-Divide-Unite: Joint Boosting Trunk and Structure for High-accuracy
Dichotomous Image Segmentation [48.995367430746086]
Dichotomous Image rendering (DIS) は、自然の風景からカテゴリーに依存しない前景の物体をピンポイントすることを目的としている。
本稿では, トランクと構造同定の有効性を高めるために, 相補的特徴を再構成し, 分割的に配置する, UDUN (Unite-Divide-Unite Network) を提案する。
1024*1024入力を用いて、ResNet-18で65.3fpsのリアルタイム推論を可能にする。
論文 参考訳(メタデータ) (2023-07-26T09:04:35Z) - Learning Target-aware Representation for Visual Tracking via Informative
Interactions [49.552877881662475]
トラッキングのための特徴表現のターゲット認識能力を改善するために,新しいバックボーンアーキテクチャを提案する。
提案したGIMモジュールとInBN機構は、CNNやTransformerなど、さまざまなバックボーンタイプに適用可能である。
論文 参考訳(メタデータ) (2022-01-07T16:22:27Z) - Deep Recurrent Neural Network with Multi-scale Bi-directional
Propagation for Video Deblurring [36.94523101375519]
本稿では,RNN-MBP(Multiscale Bi-directional Propagation)を用いたディープリカレントニューラルネットワークを提案する。
提案したアルゴリズムと既存の最先端の手法を現実世界のぼやけたシーンでよりよく評価するために、リアルワールドのぼやけたビデオデータセットも作成する。
提案アルゴリズムは3つの典型的なベンチマークにおける最先端の手法に対して良好に動作する。
論文 参考訳(メタデータ) (2021-12-09T11:02:56Z) - Asymmetric Bilateral Motion Estimation for Video Frame Interpolation [50.44508853885882]
非対称な左右運動推定(ABME)に基づく新しいビデオフレームアルゴリズムを提案する。
我々は左右対称運動場を予測してアンカーフレームを補間する。
アンカーフレームから入力フレームへの非対称な左右運動場を推定する。
第三に、非対称場を用いて入力フレームを後方にワープし、中間フレームを再構築する。
論文 参考訳(メタデータ) (2021-08-15T21:11:35Z) - Group-based Bi-Directional Recurrent Wavelet Neural Networks for Video
Super-Resolution [4.9136996406481135]
ビデオ超解像(VSR)は、低解像度(LR)フレームから高解像度(HR)フレームを推定することを目的としている。
VSRの鍵となる課題は、フレーム内の空間的相関と連続フレーム間の時間的依存を効果的に活用することにある。
論文 参考訳(メタデータ) (2021-06-14T06:36:13Z) - PDWN: Pyramid Deformable Warping Network for Video Interpolation [11.62213584807003]
Pyramid Deformable Warping Network (PDWN) と呼ばれる軽量かつ効果的なモデルを提案する。
PDWNはピラミッド構造を使用して、既知のフレームに関して未知の中間フレームのDConvオフセットを生成します。
提案手法は,複数のデータセットの最先端モデルと比較して精度が向上する。
論文 参考訳(メタデータ) (2021-04-04T02:08:57Z) - Multi-Stage Progressive Image Restoration [167.6852235432918]
本稿では、これらの競合する目標を最適にバランスできる新しい相乗的設計を提案する。
本提案では, 劣化した入力の復元関数を段階的に学習する多段階アーキテクチャを提案する。
MPRNetという名前の密接な相互接続型マルチステージアーキテクチャは、10のデータセットに対して強力なパフォーマンス向上を実現している。
論文 参考訳(メタデータ) (2021-02-04T18:57:07Z) - ASAP-Net: Attention and Structure Aware Point Cloud Sequence
Segmentation [49.15948235059343]
我々は、ASAPと呼ばれるフレキシブルモジュールにより、ポイントテンポラルクラウド機能をさらに改善する。
我々のASAPモジュールは、フレーム間の比較的情報性の高い局所的特徴を連続的に融合させるために、注意深い時間的埋め込み層を含んでいる。
本稿では、ポイントクラウドシーケンシャルセグメンテーションのための異なる計算バックボーンネットワークを持つASAPモジュールの一般化能力を示す。
論文 参考訳(メタデータ) (2020-08-12T07:37:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。