Fugu-MT 論文翻訳(概要): TLIC: Learned Image Compression with ROI-Weighted Distortion and Bit Allocation

論文の概要: TLIC: Learned Image Compression with ROI-Weighted Distortion and Bit Allocation

arxiv url: http://arxiv.org/abs/2401.08154v3
Date: Sat, 23 Mar 2024 08:44:14 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-27 01:55:44.269029
Title: TLIC: Learned Image Compression with ROI-Weighted Distortion and Bit Allocation
Title（参考訳）: TLIC: ROI重み付き歪みとビットアロケーションによる学習画像圧縮
Authors: Wei Jiang, Yongqi Zhai, Hangyu Li, Ronggang Wang,
Abstract要約: 本稿では,画像圧縮の追跡手法について述べる。より優れた知覚品質を実現するために、現実的なテクスチャを生成するために、敵の損失を利用する。
参考スコア（独自算出の注目度）: 21.663109340344928
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: This short paper describes our method for the track of image compression. To achieve better perceptual quality, we use the adversarial loss to generate realistic textures, use region of interest (ROI) mask to guide the bit allocation for different regions. Our Team name is TLIC.
Abstract（参考訳）: 本稿では,画像圧縮の追跡手法について述べる。より優れた知覚品質を実現するために,現実的なテクスチャを生成するために対向損失を用い,関心領域(ROI)マスクを用いて異なる領域のビット割り当てを誘導する。私たちのチーム名はTLICです。

関連論文リスト

ROI-based Deep Image Compression with Implicit Bit Allocation [15.62284701009422]
関心領域(ROI)に基づく画像圧縮は、重要な領域で高い忠実性を維持する能力によって急速に発展してきた。既存の圧縮方法は、量子化前に背景情報を抑圧するためにマスクを適用している。本研究は,暗黙的ビット割り当てを伴うROIに基づく効率的な深部画像圧縮モデルを提案する。
論文参考訳（メタデータ） (2025-11-12T02:55:18Z)
Range Image-Based Implicit Neural Compression for LiDAR Point Clouds [10.143205531474907]
我々は,3次元LiDAR観測の軽量なフォーマットとして,2Dレンジ画像(RI)に着目した。本稿では,浮動小数点値画素を効果的に処理する暗黙的ニューラル表現(INR)に基づくRI圧縮法を提案する。 KITTIデータセットを用いた実験により,提案手法は既存の画像,点雲,RI,INRに基づく圧縮手法を3次元再構成および検出品質で上回ることがわかった。
論文参考訳（メタデータ） (2025-04-24T03:41:57Z)
Rethinking Learned Image Compression: Context is All You Need [0.6345523830122168]
本稿では,エンコーダ,デコーダ,コンテキストモデルのスケーリングパラメータの有効性を解析する。文脈を最適化することにより、PSNRと最先端の性能をさらに向上させ、VVCよりもBD-RATEの方が14.39%向上したことを示す。
論文参考訳（メタデータ） (2024-07-16T10:50:10Z)
Region-Adaptive Transform with Segmentation Prior for Image Compression [105.17604572081177]
本稿では,地域適応型文脈情報抽出のためのクラス非依存セグメンテーションマスクを提案する。提案モジュールであるRerea-Adaptive Transformは,マスクによって導かれる異なる領域に適応的な畳み込みを適用する。また、Affine Layerというプラグイン・アンド・プレイモジュールを導入し、様々な領域のリッチなコンテキストを組み込む。
論文参考訳（メタデータ） (2024-03-01T16:03:37Z)
Perceptual Image Compression with Cooperative Cross-Modal Side Information [53.356714177243745]
本稿では,テキスト誘導側情報を用いた新しい深層画像圧縮手法を提案する。具体的には,CLIPテキストエンコーダとSemantic-Spatial Awareブロックを用いてテキストと画像の特徴を融合する。
論文参考訳（メタデータ） (2023-11-23T08:31:11Z)
Progressive Learning with Visual Prompt Tuning for Variable-Rate Image Compression [60.689646881479064]
本稿では,変圧器を用いた可変レート画像圧縮のためのプログレッシブラーニングパラダイムを提案する。視覚的プロンプトチューニングにインスパイアされた私たちは,エンコーダ側とデコーダ側でそれぞれ入力画像と隠蔽特徴のプロンプトを抽出するためにLPMを使用する。提案モデルでは, 速度歪み特性の観点から現行の可変画像法よりも優れ, スクラッチから訓練した最先端の固定画像圧縮法にアプローチする。
論文参考訳（メタデータ） (2023-11-23T08:29:32Z)
You Can Mask More For Extremely Low-Bitrate Image Compression [80.7692466922499]
近年,学習画像圧縮(lic)法は大きな進歩を遂げている。 licメソッドは、画像圧縮に不可欠な画像構造とテクスチャコンポーネントを明示的に探索することができない。原画像の構造とテクスチャに基づいて可視パッチをサンプリングするDA-Maskを提案する。極めて低ビットレート圧縮のために, lic と lic のエンドツーエンドを統一する最初のフレームワークである, 単純で効果的なマスク付き圧縮モデル (MCM) を提案する。
論文参考訳（メタデータ） (2023-06-27T15:36:22Z)
Beyond Learned Metadata-based Raw Image Reconstruction [86.1667769209103]
生画像は、線形性や微細な量子化レベルなど、sRGB画像に対して明確な利点がある。ストレージの要求が大きいため、一般ユーザからは広く採用されていない。本稿では,メタデータとして,潜在空間におけるコンパクトな表現を学習する新しいフレームワークを提案する。
論文参考訳（メタデータ） (2023-06-21T06:59:07Z)
SINCO: A Novel structural regularizer for image compression using implicit neural representations [10.251120382395332]
Inlicit Neural representations (INR) は、画像圧縮のためのディープラーニング(DL)ベースのソリューションとして最近提案されている。本稿では、画像圧縮のための新しいINR法として、INR圧縮(SINCO)の構造正則化を提案する。
論文参考訳（メタデータ） (2022-10-26T18:35:54Z)
ARF: Artistic Radiance Fields [63.79314417413371]
本稿では,任意のスタイル画像の芸術的特徴を3Dシーンに転送する方法を提案する。点雲やメッシュ上で3次元スタイリングを行う従来の手法は、幾何的再構成誤差に敏感である。より頑健なラディアンス場表現の体系化を提案する。
論文参考訳（メタデータ） (2022-06-13T17:55:31Z)
Deep Implicit Volume Compression [33.81053554523246]
本稿では,3次元ボクセル格子に格納された切り離された符号付き距離場を圧縮する新しい手法について述べる。我々の手法は、エンドツーエンドで訓練されたブロックベースのニューラルネットワークアーキテクチャに依存し、最先端の速度歪みトレードオフを実現する。
論文参考訳（メタデータ） (2020-05-18T16:46:13Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。