論文の概要: Learned Image Compression with ROI-Weighted Distortion and Bit
Allocation
- arxiv url: http://arxiv.org/abs/2401.08154v2
- Date: Wed, 17 Jan 2024 04:44:37 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-18 11:14:19.108787
- Title: Learned Image Compression with ROI-Weighted Distortion and Bit
Allocation
- Title(参考訳): ROI重み付き歪みとビットアロケーションによる学習画像圧縮
- Authors: Wei Jiang, Yongqi Zhai, Hangyu Li, Ronggang Wang
- Abstract要約: 本稿では,画像圧縮の追跡方法について述べる。
より優れた知覚品質を実現するために、現実的なテクスチャを生成するために、敵の損失を利用する。
- 参考スコア(独自算出の注目度): 23.665390687162812
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This one page paper describes our method for the track of image compression.
To achieve better perceptual quality, we use the adversarial loss to generate
realistic textures, use region of interest (ROI) mask to guide the bit
allocation for different regions. Our Team name is TLIC.
- Abstract(参考訳): 本稿では,画像圧縮の追跡方法について述べる。
より優れた知覚品質を実現するために,現実的なテクスチャを生成するために対向損失を用い,関心領域(ROI)マスクを用いて異なる領域のビット割り当てを誘導する。
私たちのチーム名はTLICです。
関連論文リスト
- Rethinking Learned Image Compression: Context is All You Need [0.6345523830122168]
本稿では,エンコーダ,デコーダ,コンテキストモデルのスケーリングパラメータの有効性を解析する。
文脈を最適化することにより、PSNRと最先端の性能をさらに向上させ、VVCよりもBD-RATEの方が14.39%向上したことを示す。
論文 参考訳(メタデータ) (2024-07-16T10:50:10Z) - Region-Adaptive Transform with Segmentation Prior for Image Compression [105.17604572081177]
本稿では,地域適応型文脈情報抽出のためのクラス非依存セグメンテーションマスクを提案する。
提案モジュールであるRerea-Adaptive Transformは,マスクによって導かれる異なる領域に適応的な畳み込みを適用する。
また、Affine Layerというプラグイン・アンド・プレイモジュールを導入し、様々な領域のリッチなコンテキストを組み込む。
論文 参考訳(メタデータ) (2024-03-01T16:03:37Z) - Perceptual Image Compression with Cooperative Cross-Modal Side
Information [53.356714177243745]
本稿では,テキスト誘導側情報を用いた新しい深層画像圧縮手法を提案する。
具体的には,CLIPテキストエンコーダとSemantic-Spatial Awareブロックを用いてテキストと画像の特徴を融合する。
論文 参考訳(メタデータ) (2023-11-23T08:31:11Z) - Progressive Learning with Visual Prompt Tuning for Variable-Rate Image
Compression [60.689646881479064]
本稿では,変圧器を用いた可変レート画像圧縮のためのプログレッシブラーニングパラダイムを提案する。
視覚的プロンプトチューニングにインスパイアされた私たちは,エンコーダ側とデコーダ側でそれぞれ入力画像と隠蔽特徴のプロンプトを抽出するためにLPMを使用する。
提案モデルでは, 速度歪み特性の観点から現行の可変画像法よりも優れ, スクラッチから訓練した最先端の固定画像圧縮法にアプローチする。
論文 参考訳(メタデータ) (2023-11-23T08:29:32Z) - You Can Mask More For Extremely Low-Bitrate Image Compression [80.7692466922499]
近年,学習画像圧縮(lic)法は大きな進歩を遂げている。
licメソッドは、画像圧縮に不可欠な画像構造とテクスチャコンポーネントを明示的に探索することができない。
原画像の構造とテクスチャに基づいて可視パッチをサンプリングするDA-Maskを提案する。
極めて低ビットレート圧縮のために, lic と lic のエンドツーエンドを統一する最初のフレームワークである, 単純で効果的なマスク付き圧縮モデル (MCM) を提案する。
論文 参考訳(メタデータ) (2023-06-27T15:36:22Z) - Beyond Learned Metadata-based Raw Image Reconstruction [86.1667769209103]
生画像は、線形性や微細な量子化レベルなど、sRGB画像に対して明確な利点がある。
ストレージの要求が大きいため、一般ユーザからは広く採用されていない。
本稿では,メタデータとして,潜在空間におけるコンパクトな表現を学習する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-21T06:59:07Z) - SINCO: A Novel structural regularizer for image compression using
implicit neural representations [10.251120382395332]
Inlicit Neural representations (INR) は、画像圧縮のためのディープラーニング(DL)ベースのソリューションとして最近提案されている。
本稿では、画像圧縮のための新しいINR法として、INR圧縮(SINCO)の構造正則化を提案する。
論文 参考訳(メタデータ) (2022-10-26T18:35:54Z) - ARF: Artistic Radiance Fields [63.79314417413371]
本稿では,任意のスタイル画像の芸術的特徴を3Dシーンに転送する方法を提案する。
点雲やメッシュ上で3次元スタイリングを行う従来の手法は、幾何的再構成誤差に敏感である。
より頑健なラディアンス場表現の体系化を提案する。
論文 参考訳(メタデータ) (2022-06-13T17:55:31Z) - Deep Implicit Volume Compression [33.81053554523246]
本稿では,3次元ボクセル格子に格納された切り離された符号付き距離場を圧縮する新しい手法について述べる。
我々の手法は、エンドツーエンドで訓練されたブロックベースのニューラルネットワークアーキテクチャに依存し、最先端の速度歪みトレードオフを実現する。
論文 参考訳(メタデータ) (2020-05-18T16:46:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。