論文の概要: Semantically Structured Image Compression via Irregular Group-Based
Decoupling
- arxiv url: http://arxiv.org/abs/2305.02586v1
- Date: Thu, 4 May 2023 06:40:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-05 16:49:34.150907
- Title: Semantically Structured Image Compression via Irregular Group-Based
Decoupling
- Title(参考訳): 不規則群に基づくデカップリングによる意味的構造化画像圧縮
- Authors: Ruoyu Feng, Yixin Gao, Xin Jin, Runsen Feng, Zhibo Chen
- Abstract要約: 本稿では,グループマスクのカスタマイズにより,画像を不規則な形状の複数のグループに分離することを提案する。
我々のフレームワークは、ビットストリームを無視可能なコストで構成し、視覚的品質と知的タスクサポートの両方において優れた性能を示す。
- 参考スコア(独自算出の注目度): 25.953688887766383
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Image compression techniques typically focus on compressing rectangular
images for human consumption, however, resulting in transmitting redundant
content for downstream applications. To overcome this limitation, some previous
works propose to semantically structure the bitstream, which can meet specific
application requirements by selective transmission and reconstruction.
Nevertheless, they divide the input image into multiple rectangular regions
according to semantics and ignore avoiding information interaction among them,
causing waste of bitrate and distorted reconstruction of region boundaries. In
this paper, we propose to decouple an image into multiple groups with irregular
shapes based on a customized group mask and compress them independently. Our
group mask describes the image at a finer granularity, enabling significant
bitrate saving by reducing the transmission of redundant content. Moreover, to
ensure the fidelity of selective reconstruction, this paper proposes the
concept of group-independent transform that maintain the independence among
distinct groups. And we instantiate it by the proposed Group-Independent
Swin-Block (GI Swin-Block). Experimental results demonstrate that our framework
structures the bitstream with negligible cost, and exhibits superior
performance on both visual quality and intelligent task supporting.
- Abstract(参考訳): 画像圧縮技術は通常、人間の消費のために長方形の画像を圧縮することに重点を置いている。
この制限を克服するために、いくつかの以前の研究は、選択的送信と再構成によって特定のアプリケーション要求を満たすビットストリームを意味的に構造化することを提案した。
それにもかかわらず、入力画像をセマンティクスに従って複数の矩形領域に分割し、それらの間の情報相互作用を無視し、ビットレートの浪費と領域境界の歪んだ再構成を引き起こす。
本稿では,カスタマイズしたグループマスクに基づいて,画像を不規則な形状の複数のグループに分離し,個別に圧縮する手法を提案する。
グループマスクは,画像の粒度を細かく表現し,冗長コンテンツの伝送を低減し,ビットレートを大幅に節約する。
さらに, 選択的再構成の忠実性を確保するために, 異なる集団間の独立性を維持する群非依存変換の概念を提案する。
そして、提案されている Group-Independent Swin-Block (GI Swin-Block) によってインスタンス化する。
実験の結果,我々のフレームワークはビットストリームを不要なコストで構成し,視覚的品質とインテリジェントなタスクサポートの両方において優れた性能を示すことがわかった。
関連論文リスト
- Perceptual Image Compression with Cooperative Cross-Modal Side
Information [53.356714177243745]
本稿では,テキスト誘導側情報を用いた新しい深層画像圧縮手法を提案する。
具体的には,CLIPテキストエンコーダとSemantic-Spatial Awareブロックを用いてテキストと画像の特徴を融合する。
論文 参考訳(メタデータ) (2023-11-23T08:31:11Z) - You Can Mask More For Extremely Low-Bitrate Image Compression [80.7692466922499]
近年,学習画像圧縮(lic)法は大きな進歩を遂げている。
licメソッドは、画像圧縮に不可欠な画像構造とテクスチャコンポーネントを明示的に探索することができない。
原画像の構造とテクスチャに基づいて可視パッチをサンプリングするDA-Maskを提案する。
極めて低ビットレート圧縮のために, lic と lic のエンドツーエンドを統一する最初のフレームワークである, 単純で効果的なマスク付き圧縮モデル (MCM) を提案する。
論文 参考訳(メタデータ) (2023-06-27T15:36:22Z) - Beyond Learned Metadata-based Raw Image Reconstruction [86.1667769209103]
生画像は、線形性や微細な量子化レベルなど、sRGB画像に対して明確な利点がある。
ストレージの要求が大きいため、一般ユーザからは広く採用されていない。
本稿では,メタデータとして,潜在空間におけるコンパクトな表現を学習する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-21T06:59:07Z) - Inharmonious Region Localization via Recurrent Self-Reasoning [18.963031309495005]
合成画像の品質向上のためには,不調和領域の局所化が重要でありながら課題である。
古典的なクラスタリングアルゴリズムにインスパイアされた我々は、ピクセルを2つのクラスタ、すなわち不調和なクラスタとバックグラウンドクラスタにグループ化することを目指している。
論文 参考訳(メタデータ) (2022-10-05T05:50:24Z) - Image Inpainting with Edge-guided Learnable Bidirectional Attention Maps [85.67745220834718]
不規則な穴の画像インペインティングを改善するためのエッジガイド学習可能な双方向注意マップ(Edge-LBAM)を紹介します。
当社のEdge-LBAMメソッドには、予測エッジによる構造認識マスク更新を含むデュアルプロシージャが含まれています。
広範な実験により,エッジlbamはコヒーレントな画像構造を生成し,色差やぼやけを防止できることがわかった。
論文 参考訳(メタデータ) (2021-04-25T07:25:16Z) - Information-Theoretic Segmentation by Inpainting Error Maximization [30.520622129165456]
画像画素をフォアグラウンドとバックグラウンドにグループ化し,一方のセットの予測可能性を最小限に抑えることを目標とした。
本手法はディープネットワークのトレーニングを含まず,計算量的に安価であり,クラス非依存であり,単一のラベルなし画像に対して単独で適用可能である。
論文 参考訳(メタデータ) (2020-12-14T06:42:27Z) - Invariant Deep Compressible Covariance Pooling for Aerial Scene
Categorization [80.55951673479237]
本研究では,空気シーン分類におけるニュアンス変動を解決するために,新しい不変な深部圧縮性共分散プール (IDCCP) を提案する。
本研究では,公開空間画像データセットに関する広範な実験を行い,最先端の手法と比較して,この手法の優位性を実証する。
論文 参考訳(メタデータ) (2020-11-11T11:13:07Z) - Image Fine-grained Inpainting [89.17316318927621]
拡張畳み込みの密結合を利用してより大きく効果的な受容場を得る一段階モデルを提案する。
この効率的なジェネレータをよく訓練するために、頻繁に使用されるVGG特徴整合損失を除いて、新しい自己誘導回帰損失を設計する。
また、局所的・グローバルな分枝を持つ識別器を用いて、局所的・グローバルな内容の整合性を確保する。
論文 参考訳(メタデータ) (2020-02-07T03:45:25Z) - Large Hole Image Inpainting With Compress-Decompression Network [0.0]
既存の方法では、破損した画像の修復のための畳み込みニューラルネットワークが提案されている。
既存の手法を考察し,圧縮圧縮ネットワークという新しいネットワークを提案する。
残差ネットワークを用いた圧縮ネットワークを構築し,画像の拡張に類似したテクスチャ選択アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-02-01T12:39:13Z) - Image Embedded Segmentation: Uniting Supervised and Unsupervised
Objectives for Segmenting Histopathological Images [0.0]
本稿では,意味組織分割のための完全畳み込みネットワークを学習するための新しい正規化手法を提案する。
これは教師なし学習(イメージ再構成)の利点をネットワークトレーニングに頼っている。
我々の実験は、これらのデータセットのセグメンテーション結果が、データセットのセグメンテーション結果よりも優れていることを示した。
論文 参考訳(メタデータ) (2020-01-30T08:09:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。