論文の概要: Recognition-Aware Learned Image Compression
- arxiv url: http://arxiv.org/abs/2202.00198v1
- Date: Tue, 1 Feb 2022 03:33:51 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-03 00:08:48.397219
- Title: Recognition-Aware Learned Image Compression
- Title(参考訳): 認識認識による画像圧縮
- Authors: Maxime Kawawa-Beaudan, Ryan Roggenkemper, Avideh Zakhor
- Abstract要約: 本稿では,タスク固有の損失と並行して,速度歪み損失を最適化する認識認識型学習圧縮手法を提案する。
提案手法は,BPGなどの従来の手法と比較して,同等値での認識精度が26%向上する。
- 参考スコア(独自算出の注目度): 0.5801044612920815
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Learned image compression methods generally optimize a rate-distortion loss,
trading off improvements in visual distortion for added bitrate. Increasingly,
however, compressed imagery is used as an input to deep learning networks for
various tasks such as classification, object detection, and superresolution. We
propose a recognition-aware learned compression method, which optimizes a
rate-distortion loss alongside a task-specific loss, jointly learning
compression and recognition networks. We augment a hierarchical
autoencoder-based compression network with an EfficientNet recognition model
and use two hyperparameters to trade off between distortion, bitrate, and
recognition performance. We characterize the classification accuracy of our
proposed method as a function of bitrate and find that for low bitrates our
method achieves as much as 26% higher recognition accuracy at equivalent
bitrates compared to traditional methods such as Better Portable Graphics
(BPG).
- Abstract(参考訳): 学習画像圧縮手法は一般にレート歪み損失を最適化し、付加ビットレートに対する視覚歪みの改善をトレードオフする。
しかし、圧縮画像は分類、物体検出、超解像など様々なタスクの深層学習ネットワークへの入力として使われるようになっている。
本稿では,タスク固有の損失を伴う速度歪み損失を最適化し,共同学習型圧縮・認識ネットワークを提案する。
階層型オートエンコーダに基づく圧縮ネットワークを高効率ネット認識モデルで拡張し、2つのハイパーパラメータを用いて歪み、ビットレート、認識性能をトレードオフする。
本研究では,提案手法の分類精度をビットレートの関数として特徴付け,低ビットレートの場合の認識精度をbetter portable graphics (bpg) などの従来の手法と比較して26%向上させることを示す。
関連論文リスト
- Rate-Distortion-Cognition Controllable Versatile Neural Image Compression [47.72668401825835]
速度歪み認識制御可能な多目的画像圧縮法を提案する。
本手法は, 良好なICM性能とフレキシブルレート・ディストーション・コグニテーション制御を実現する。
論文 参考訳(メタデータ) (2024-07-16T13:17:51Z) - Enhancing the Rate-Distortion-Perception Flexibility of Learned Image
Codecs with Conditional Diffusion Decoders [7.485128109817576]
本研究では,デコーダとして使用する場合,条件拡散モデルが生成圧縮タスクにおいて有望な結果をもたらすことを示す。
本稿では,デコーダとして使用する場合,条件拡散モデルが生成圧縮タスクにおいて有望な結果をもたらすことを示す。
論文 参考訳(メタデータ) (2024-03-05T11:48:35Z) - Semantic Ensemble Loss and Latent Refinement for High-Fidelity Neural Image Compression [58.618625678054826]
本研究は、最適な視覚的忠実度のために設計された強化されたニューラル圧縮手法を提案する。
我々は,洗練されたセマンティック・アンサンブル・ロス,シャルボニエ・ロス,知覚的損失,スタイル・ロス,非バイナリ・ディバイザ・ロスを組み込んだモデルを構築した。
実験により,本手法は神経画像圧縮の統計的忠実度を著しく向上させることが示された。
論文 参考訳(メタデータ) (2024-01-25T08:11:27Z) - Progressive Learning with Visual Prompt Tuning for Variable-Rate Image
Compression [60.689646881479064]
本稿では,変圧器を用いた可変レート画像圧縮のためのプログレッシブラーニングパラダイムを提案する。
視覚的プロンプトチューニングにインスパイアされた私たちは,エンコーダ側とデコーダ側でそれぞれ入力画像と隠蔽特徴のプロンプトを抽出するためにLPMを使用する。
提案モデルでは, 速度歪み特性の観点から現行の可変画像法よりも優れ, スクラッチから訓練した最先端の固定画像圧縮法にアプローチする。
論文 参考訳(メタデータ) (2023-11-23T08:29:32Z) - You Can Mask More For Extremely Low-Bitrate Image Compression [80.7692466922499]
近年,学習画像圧縮(lic)法は大きな進歩を遂げている。
licメソッドは、画像圧縮に不可欠な画像構造とテクスチャコンポーネントを明示的に探索することができない。
原画像の構造とテクスチャに基づいて可視パッチをサンプリングするDA-Maskを提案する。
極めて低ビットレート圧縮のために, lic と lic のエンドツーエンドを統一する最初のフレームワークである, 単純で効果的なマスク付き圧縮モデル (MCM) を提案する。
論文 参考訳(メタデータ) (2023-06-27T15:36:22Z) - Estimating the Resize Parameter in End-to-end Learned Image Compression [50.20567320015102]
本稿では,最近の画像圧縮モデルの速度歪みトレードオフをさらに改善する検索自由化フレームワークについて述べる。
提案手法により,Bjontegaard-Deltaレート(BD-rate)を最大10%向上させることができる。
論文 参考訳(メタデータ) (2022-04-26T01:35:02Z) - Neural JPEG: End-to-End Image Compression Leveraging a Standard JPEG
Encoder-Decoder [73.48927855855219]
本稿では,エンコーダとデコーダの両端に内在するニューラル表現を強化することで,符号化性能の向上を図るシステムを提案する。
実験により,提案手法はJPEGに対する速度歪み性能を,様々な品質指標で改善することを示した。
論文 参考訳(メタデータ) (2022-01-27T20:20:03Z) - High-Fidelity Generative Image Compression [39.04379573099481]
そこで我々は, ジェネリック・アドリアル・ネットワークと学習圧縮を併用して, 最先端の縮退型圧縮システムを得る方法について検討した。
特に,正規化レイヤ,ジェネレータおよび識別器アーキテクチャ,トレーニング戦略,知覚的損失について検討する。
論文 参考訳(メタデータ) (2020-06-17T16:21:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。