論文の概要: Rethinking Image Compression on the Web with Generative AI
- arxiv url: http://arxiv.org/abs/2407.04542v1
- Date: Fri, 5 Jul 2024 14:29:12 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-08 13:10:54.648763
- Title: Rethinking Image Compression on the Web with Generative AI
- Title(参考訳): ジェネレーティブAIによるWeb上の画像圧縮の再考
- Authors: Shayan Ali Hassan, Danish Humair, Ihsan Ayyub Qazi, Zafar Ayyub Qazi,
- Abstract要約: 本稿では、生成AIを用いて、エッジやクライアント側で画像の再構成を行う新しいアプローチについて検討する。
テキストプロンプトを活用し,Cannyエッジやカラーパレットなどの条件入力をテキスト・ツー・イメージモデルに付加するフレームワークを開発した。
本手法は従来の圧縮法よりも画像の意味と構造を効果的に保存する。
- 参考スコア(独自算出の注目度): 1.941594765886385
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The rapid growth of the Internet, driven by social media, web browsing, and video streaming, has made images central to the Web experience, resulting in significant data transfer and increased webpage sizes. Traditional image compression methods, while reducing bandwidth, often degrade image quality. This paper explores a novel approach using generative AI to reconstruct images at the edge or client-side. We develop a framework that leverages text prompts and provides additional conditioning inputs like Canny edges and color palettes to a text-to-image model, achieving up to 99.8% bandwidth savings in the best cases and 92.6% on average, while maintaining high perceptual similarity. Empirical analysis and a user study show that our method preserves image meaning and structure more effectively than traditional compression methods, offering a promising solution for reducing bandwidth usage and improving Internet affordability with minimal degradation in image quality.
- Abstract(参考訳): インターネットの急速な成長は、ソーシャルメディア、ウェブブラウジング、ビデオストリーミングによって、画像がWebエクスペリエンスの中心となり、データ転送が大幅に増加し、Webページサイズが増加した。
従来の画像圧縮方式は帯域幅を減らしながら、画質を劣化させることが多い。
本稿では、生成AIを用いて、エッジやクライアント側の画像再構成を行う新しいアプローチについて検討する。
我々は,テキストプロンプトを活用し,キャニーエッジやカラーパレットなどの条件入力をテキスト・ツー・イメージモデルに付加するフレームワークを開発し,最高のケースで99.8%,平均で92.6%の帯域節約を実現し,高い知覚的類似性を維持した。
経験的分析とユーザスタディにより,従来の圧縮法よりも画像の意味と構造を効果的に保存し,帯域幅の削減と画像品質の低下を最小限に抑え,インターネットの可利用性向上を図った。
関連論文リスト
- Transferable Learned Image Compression-Resistant Adversarial
Perturbations [69.79762292033553]
敵対的攻撃は容易に画像分類システムを破壊し、DNNベースの認識タスクの脆弱性を明らかにする。
我々は、学習した画像圧縮機を前処理モジュールとして利用する画像分類モデルをターゲットにした新しいパイプラインを提案する。
論文 参考訳(メタデータ) (2024-01-06T03:03:28Z) - Perceptual Image Compression with Cooperative Cross-Modal Side
Information [53.356714177243745]
本稿では,テキスト誘導側情報を用いた新しい深層画像圧縮手法を提案する。
具体的には,CLIPテキストエンコーダとSemantic-Spatial Awareブロックを用いてテキストと画像の特徴を融合する。
論文 参考訳(メタデータ) (2023-11-23T08:31:11Z) - Extreme Generative Image Compression by Learning Text Embedding from
Diffusion Models [13.894251782142584]
本稿では,画像を短いテキスト埋め込みとして保存する可能性を示す生成画像圧縮手法を提案する。
本手法は、知覚的品質と多様性の両方の観点から、他の最先端のディープラーニング手法よりも優れている。
論文 参考訳(メタデータ) (2022-11-14T22:54:19Z) - A Unified Image Preprocessing Framework For Image Compression [5.813935823171752]
そこで我々は,既存のコーデックの性能向上を図るために,Kuchenと呼ばれる統合された画像圧縮前処理フレームワークを提案する。
このフレームワークは、ハイブリッドデータラベリングシステムと、パーソナライズされた前処理をシミュレートする学習ベースのバックボーンで構成されている。
その結果,我々の統合前処理フレームワークによって最適化された現代のコーデックは,常に最先端圧縮の効率を向上することを示した。
論文 参考訳(メタデータ) (2022-08-15T10:41:00Z) - Analysis of the Effect of Low-Overhead Lossy Image Compression on the
Performance of Visual Crowd Counting for Smart City Applications [78.55896581882595]
画像圧縮技術は画像の品質を低下させ、精度を低下させる。
本稿では,低オーバヘッド損失画像圧縮法の適用が視覚的群集カウントの精度に与える影響を解析する。
論文 参考訳(メタデータ) (2022-07-20T19:20:03Z) - Estimating the Resize Parameter in End-to-end Learned Image Compression [50.20567320015102]
本稿では,最近の画像圧縮モデルの速度歪みトレードオフをさらに改善する検索自由化フレームワークについて述べる。
提案手法により,Bjontegaard-Deltaレート(BD-rate)を最大10%向上させることができる。
論文 参考訳(メタデータ) (2022-04-26T01:35:02Z) - Learned Image Coding for Machines: A Content-Adaptive Approach [24.749491401730065]
マシン間通信は新しい課題であり、データ圧縮の文脈で新しい視点を開く。
本稿では、エンドツーエンドの学習画像の潜在表現を最適化する推論時コンテンツ適応微調整手法を提案する。
我々のシステムは最先端画像/ビデオ符号化(VVC)に対して30.54%のBDレートを達成する。
論文 参考訳(メタデータ) (2021-08-23T07:53:35Z) - Early Exit or Not: Resource-Efficient Blind Quality Enhancement for
Compressed Images [54.40852143927333]
ロスシー画像圧縮は、通信帯域を節約するために広範に行われ、望ましくない圧縮アーティファクトをもたらす。
圧縮画像に対する資源効率の高いブラインド品質向上手法(RBQE)を提案する。
提案手法は, 評価された画像の品質に応じて, 自動的にエンハンスメントを終了するか, 継続するかを決定することができる。
論文 参考訳(メタデータ) (2020-06-30T07:38:47Z) - Learning End-to-End Lossy Image Compression: A Benchmark [90.35363142246806]
まず,学習した画像の圧縮方法に関する総合的な文献調査を行う。
本稿では,最先端の学習画像圧縮手法のマイルストーンについて述べるとともに,既存の幅広い作品について概観し,その歴史的開発ルートについて考察する。
エントロピー推定と信号再構成のための粗大な超高次モデルを導入することにより、速度歪み性能の向上を実現する。
論文 参考訳(メタデータ) (2020-02-10T13:13:43Z) - Large Hole Image Inpainting With Compress-Decompression Network [0.0]
既存の方法では、破損した画像の修復のための畳み込みニューラルネットワークが提案されている。
既存の手法を考察し,圧縮圧縮ネットワークという新しいネットワークを提案する。
残差ネットワークを用いた圧縮ネットワークを構築し,画像の拡張に類似したテクスチャ選択アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-02-01T12:39:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。