論文の概要: Learned Distributed Image Compression with Multi-Scale Patch Matching in
Feature Domai
- arxiv url: http://arxiv.org/abs/2209.02514v1
- Date: Tue, 6 Sep 2022 14:06:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-07 15:31:01.182396
- Title: Learned Distributed Image Compression with Multi-Scale Patch Matching in
Feature Domai
- Title(参考訳): 特徴ドマイにおけるマルチスケールパッチマッチングによる分散画像圧縮の学習
- Authors: Yujun Huang, Bin Chen, Shiyu Qin, Jiawei Li, Yaowei Wang, Tao Dai,
Shu-Tao Xia
- Abstract要約: 分散画像圧縮モデルのデコーダの側情報を完全に活用するためのマルチスケール特徴領域マッチング(MSFDPM)を提案する。
MSFDPMは、サイド情報特徴抽出器、マルチスケール機能領域パッチマッチングモジュール、マルチスケール機能融合ネットワークから構成される。
マルチスケールの特徴領域におけるパッチマッチングは,画像領域におけるパッチマッチング手法と比較して圧縮率を約20%向上させる。
- 参考スコア(独自算出の注目度): 62.88240343479615
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Beyond achieving higher compression efficiency over classical image
compression codecs, deep image compression is expected to be improved with
additional side information, e.g., another image from a different perspective
of the same scene. To better utilize the side information under the distributed
compression scenario, the existing method (Ayzik and Avidan 2020) only
implements patch matching at the image domain to solve the parallax problem
caused by the difference in viewing points. However, the patch matching at the
image domain is not robust to the variance of scale, shape, and illumination
caused by the different viewing angles, and can not make full use of the rich
texture information of the side information image. To resolve this issue, we
propose Multi-Scale Feature Domain Patch Matching (MSFDPM) to fully utilizes
side information at the decoder of the distributed image compression model.
Specifically, MSFDPM consists of a side information feature extractor, a
multi-scale feature domain patch matching module, and a multi-scale feature
fusion network. Furthermore, we reuse inter-patch correlation from the shallow
layer to accelerate the patch matching of the deep layer. Finally, we nd that
our patch matching in a multi-scale feature domain further improves compression
rate by about 20% compared with the patch matching method at image domain
(Ayzik and Avidan 2020).
- Abstract(参考訳): 古典的な画像圧縮コーデックよりも高い圧縮効率を達成する以外に、深部画像圧縮は、例えば同じシーンの異なる視点からの別の画像のような追加のサイド情報で改善されることが期待されている。
分散圧縮シナリオ下での副作用をよりよく活用するために、既存の方法(AyzikとAvidan 2020)は、画像領域におけるパッチマッチングのみを実装して、視聴点の違いによるパララックス問題を解決する。
しかし、画像領域におけるパッチマッチングは、異なる視角によるスケール、形状、照明のばらつきに対して堅牢ではなく、側情報画像の豊かなテクスチャ情報を完全に活用することはできない。
この問題を解決するために,分散画像圧縮モデルのデコーダの側情報を完全に活用するマルチスケール特徴領域マッチング(MSFDPM)を提案する。
具体的には、MSFDPMは、サイド情報特徴抽出器、マルチスケール機能ドメインパッチマッチングモジュール、マルチスケール機能融合ネットワークから構成される。
さらに,浅層からのパッチ間相関を再利用し,深層のパッチマッチングを高速化する。
最後に,マルチスケールの機能領域におけるパッチマッチングは,画像領域におけるパッチマッチング手法と比較して圧縮率を約20%向上させる(Ayzik,Avidan 2020)。
関連論文リスト
- Progressive Learning with Visual Prompt Tuning for Variable-Rate Image
Compression [60.689646881479064]
本稿では,変圧器を用いた可変レート画像圧縮のためのプログレッシブラーニングパラダイムを提案する。
視覚的プロンプトチューニングにインスパイアされた私たちは,エンコーダ側とデコーダ側でそれぞれ入力画像と隠蔽特徴のプロンプトを抽出するためにLPMを使用する。
提案モデルでは, 速度歪み特性の観点から現行の可変画像法よりも優れ, スクラッチから訓練した最先端の固定画像圧縮法にアプローチする。
論文 参考訳(メタデータ) (2023-11-23T08:29:32Z) - You Can Mask More For Extremely Low-Bitrate Image Compression [80.7692466922499]
近年,学習画像圧縮(lic)法は大きな進歩を遂げている。
licメソッドは、画像圧縮に不可欠な画像構造とテクスチャコンポーネントを明示的に探索することができない。
原画像の構造とテクスチャに基づいて可視パッチをサンプリングするDA-Maskを提案する。
極めて低ビットレート圧縮のために, lic と lic のエンドツーエンドを統一する最初のフレームワークである, 単純で効果的なマスク付き圧縮モデル (MCM) を提案する。
論文 参考訳(メタデータ) (2023-06-27T15:36:22Z) - DBAT: Dynamic Backward Attention Transformer for Material Segmentation
with Cross-Resolution Patches [8.812837829361923]
クロスレゾリューション特徴を集約する動的後方アテンション変換器(DBAT)を提案する。
実験の結果,DBATの精度は86.85%であり,最先端のリアルタイムモデルの中では最高の性能であることがわかった。
さらに,提案モデルが他の手法よりも優れた材料関連特徴を抽出できることを示すため,セマンティックなラベルにアライメントし,ネットワーク分割を行う。
論文 参考訳(メタデータ) (2023-05-06T03:47:20Z) - HIPA: Hierarchical Patch Transformer for Single Image Super Resolution [62.7081074931892]
本稿では,階層型パッチ分割を用いた高解像度画像を段階的に復元する新しいトランスフォーマーアーキテクチャHIPAを提案する。
入力画像を複数のステージで処理するカスケードモデルを構築し、小さなパッチサイズでトークンから始めて、徐々に全解像度にマージします。
このような階層的なパッチ機構は、複数の解像度で機能集約を可能にするだけでなく、異なる画像領域に対するパッチ認識機能も適応的に学習する。
論文 参考訳(メタデータ) (2022-03-19T05:09:34Z) - The Devil Is in the Details: Window-based Attention for Image
Compression [58.1577742463617]
既存の学習画像圧縮モデルは畳み込みニューラルネットワーク(CNN)に基づいている。
本稿では,複数種類の注意機構が局所特徴学習に与える影響について検討し,より単純で効果的なウィンドウベースの局所的注意ブロックを提案する。
提案されたウィンドウベースのアテンションは非常に柔軟で、CNNとTransformerモデルを強化するためのプラグイン・アンド・プレイコンポーネントとして機能する可能性がある。
論文 参考訳(メタデータ) (2022-03-16T07:55:49Z) - Patch-Based Stochastic Attention for Image Editing [4.8201607588546]
PatchMatchアルゴリズムをベースとした,近接する近傍近傍の同定に有効なアテンション層を提案する。
画像インペイント, ガイド画像のカラー化, シングルイメージ超解像など, 画像編集作業におけるPSALの有用性を示す。
論文 参考訳(メタデータ) (2022-02-07T13:42:00Z) - Variable-Rate Deep Image Compression through Spatially-Adaptive Feature
Transform [58.60004238261117]
空間特徴変換(SFT arXiv:1804.02815)に基づく多目的深部画像圧縮ネットワークを提案する。
本モデルは,任意の画素単位の品質マップによって制御される単一モデルを用いて,幅広い圧縮速度をカバーしている。
提案するフレームワークにより,様々なタスクに対してタスク対応の画像圧縮を行うことができる。
論文 参考訳(メタデータ) (2021-08-21T17:30:06Z) - SimPatch: A Nearest Neighbor Similarity Match between Image Patches [0.0]
比較的小さなパッチではなく、大きなパッチを使って、各パッチにより多くの情報が含まれるようにしています。
特徴行列を構成する個々の画像パッチの特徴を抽出するために,異なる特徴抽出機構を用いる。
最寄りのパッチは、与えられた画像に対するクエリパッチに対して、2つの異なる近接アルゴリズムを用いて計算される。
論文 参考訳(メタデータ) (2020-08-07T10:51:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。