論文の概要: TLIC: Learned Image Compression with ROI-Weighted Distortion and Bit Allocation
- arxiv url: http://arxiv.org/abs/2401.08154v3
- Date: Sat, 23 Mar 2024 08:44:14 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-27 01:55:44.269029
- Title: TLIC: Learned Image Compression with ROI-Weighted Distortion and Bit Allocation
- Title(参考訳): TLIC: ROI重み付き歪みとビットアロケーションによる学習画像圧縮
- Authors: Wei Jiang, Yongqi Zhai, Hangyu Li, Ronggang Wang,
- Abstract要約: 本稿では,画像圧縮の追跡手法について述べる。
より優れた知覚品質を実現するために、現実的なテクスチャを生成するために、敵の損失を利用する。
- 参考スコア(独自算出の注目度): 21.663109340344928
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This short paper describes our method for the track of image compression. To achieve better perceptual quality, we use the adversarial loss to generate realistic textures, use region of interest (ROI) mask to guide the bit allocation for different regions. Our Team name is TLIC.
- Abstract(参考訳): 本稿では,画像圧縮の追跡手法について述べる。
より優れた知覚品質を実現するために,現実的なテクスチャを生成するために対向損失を用い,関心領域(ROI)マスクを用いて異なる領域のビット割り当てを誘導する。
私たちのチーム名はTLICです。
関連論文リスト
- Perceptual Image Compression with Cooperative Cross-Modal Side
Information [53.356714177243745]
本稿では,テキスト誘導側情報を用いた新しい深層画像圧縮手法を提案する。
具体的には,CLIPテキストエンコーダとSemantic-Spatial Awareブロックを用いてテキストと画像の特徴を融合する。
論文 参考訳(メタデータ) (2023-11-23T08:31:11Z) - Progressive Learning with Visual Prompt Tuning for Variable-Rate Image
Compression [60.689646881479064]
本稿では,変圧器を用いた可変レート画像圧縮のためのプログレッシブラーニングパラダイムを提案する。
視覚的プロンプトチューニングにインスパイアされた私たちは,エンコーダ側とデコーダ側でそれぞれ入力画像と隠蔽特徴のプロンプトを抽出するためにLPMを使用する。
提案モデルでは, 速度歪み特性の観点から現行の可変画像法よりも優れ, スクラッチから訓練した最先端の固定画像圧縮法にアプローチする。
論文 参考訳(メタデータ) (2023-11-23T08:29:32Z) - You Can Mask More For Extremely Low-Bitrate Image Compression [80.7692466922499]
近年,学習画像圧縮(lic)法は大きな進歩を遂げている。
licメソッドは、画像圧縮に不可欠な画像構造とテクスチャコンポーネントを明示的に探索することができない。
原画像の構造とテクスチャに基づいて可視パッチをサンプリングするDA-Maskを提案する。
極めて低ビットレート圧縮のために, lic と lic のエンドツーエンドを統一する最初のフレームワークである, 単純で効果的なマスク付き圧縮モデル (MCM) を提案する。
論文 参考訳(メタデータ) (2023-06-27T15:36:22Z) - Beyond Learned Metadata-based Raw Image Reconstruction [86.1667769209103]
生画像は、線形性や微細な量子化レベルなど、sRGB画像に対して明確な利点がある。
ストレージの要求が大きいため、一般ユーザからは広く採用されていない。
本稿では,メタデータとして,潜在空間におけるコンパクトな表現を学習する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-21T06:59:07Z) - Random-Access Neural Compression of Material Textures [1.2971248363246106]
材料テクスチャに特化して設計された新しいニューラル圧縮手法を提案する。
我々は低圧縮でさらに2つの詳細レベル、すなわち16倍のテクセルをアンロックする。
本手法では,ランダムアクセスによるオンデマンドリアルタイム圧縮が可能で,ディスクやメモリ上での圧縮が可能となる。
論文 参考訳(メタデータ) (2023-05-26T17:16:22Z) - Raw Image Reconstruction with Learned Compact Metadata [61.62454853089346]
本稿では,メタデータとしての潜在空間におけるコンパクトな表現をエンドツーエンドで学習するための新しいフレームワークを提案する。
提案する生画像圧縮方式は,グローバルな視点から重要な画像領域に適応的により多くのビットを割り当てることができることを示す。
論文 参考訳(メタデータ) (2023-02-25T05:29:45Z) - SINCO: A Novel structural regularizer for image compression using
implicit neural representations [10.251120382395332]
Inlicit Neural representations (INR) は、画像圧縮のためのディープラーニング(DL)ベースのソリューションとして最近提案されている。
本稿では、画像圧縮のための新しいINR法として、INR圧縮(SINCO)の構造正則化を提案する。
論文 参考訳(メタデータ) (2022-10-26T18:35:54Z) - ARF: Artistic Radiance Fields [63.79314417413371]
本稿では,任意のスタイル画像の芸術的特徴を3Dシーンに転送する方法を提案する。
点雲やメッシュ上で3次元スタイリングを行う従来の手法は、幾何的再構成誤差に敏感である。
より頑健なラディアンス場表現の体系化を提案する。
論文 参考訳(メタデータ) (2022-06-13T17:55:31Z) - Deep Implicit Volume Compression [33.81053554523246]
本稿では,3次元ボクセル格子に格納された切り離された符号付き距離場を圧縮する新しい手法について述べる。
我々の手法は、エンドツーエンドで訓練されたブロックベースのニューラルネットワークアーキテクチャに依存し、最先端の速度歪みトレードオフを実現する。
論文 参考訳(メタデータ) (2020-05-18T16:46:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。