論文の概要: Leveraging Domain Knowledge using Machine Learning for Image Compression
in Internet-of-Things
- arxiv url: http://arxiv.org/abs/2009.06742v1
- Date: Mon, 14 Sep 2020 20:59:19 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-18 13:02:01.969423
- Title: Leveraging Domain Knowledge using Machine Learning for Image Compression
in Internet-of-Things
- Title(参考訳): インターネットにおける画像圧縮のための機械学習を用いたドメイン知識の活用
- Authors: Prabuddha Chakraborty, Jonathan Cruz, Swarup Bhunia
- Abstract要約: MAGICは、新しい機械学習(ML)ガイド画像圧縮フレームワークである。
MAGIC フレームワークは JPEG 2000 および WebP の標準品質限界を超えて圧縮可能であることを示す。
JPEG 2000 や WebP と比較して,画像間の圧縮速度のばらつきが低いことを示す。
- 参考スコア(独自算出の注目度): 8.937905773981702
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The emergent ecosystems of intelligent edge devices in diverse Internet of
Things (IoT) applications, from automatic surveillance to precision
agriculture, increasingly rely on recording and processing variety of image
data. Due to resource constraints, e.g., energy and communication bandwidth
requirements, these applications require compressing the recorded images before
transmission. For these applications, image compression commonly requires: (1)
maintaining features for coarse-grain pattern recognition instead of the
high-level details for human perception due to machine-to-machine
communications; (2) high compression ratio that leads to improved energy and
transmission efficiency; (3) large dynamic range of compression and an easy
trade-off between compression factor and quality of reconstruction to
accommodate a wide diversity of IoT applications as well as their time-varying
energy/performance needs. To address these requirements, we propose, MAGIC, a
novel machine learning (ML) guided image compression framework that judiciously
sacrifices visual quality to achieve much higher compression when compared to
traditional techniques, while maintaining accuracy for coarse-grained vision
tasks. The central idea is to capture application-specific domain knowledge and
efficiently utilize it in achieving high compression. We demonstrate that the
MAGIC framework is configurable across a wide range of compression/quality and
is capable of compressing beyond the standard quality factor limits of both
JPEG 2000 and WebP. We perform experiments on representative IoT applications
using two vision datasets and show up to 42.65x compression at similar accuracy
with respect to the source. We highlight low variance in compression rate
across images using our technique as compared to JPEG 2000 and WebP.
- Abstract(参考訳): iot(internet of things)アプリケーションにおけるインテリジェントエッジデバイスの創発的なエコシステムは、自動監視から精密農業まで、さまざまなイメージデータの記録と処理に依存している。
リソースの制約、例えばエネルギーと通信帯域幅の要件により、これらのアプリケーションは送信前に記録された画像を圧縮する必要がある。
For these applications, image compression commonly requires: (1) maintaining features for coarse-grain pattern recognition instead of the high-level details for human perception due to machine-to-machine communications; (2) high compression ratio that leads to improved energy and transmission efficiency; (3) large dynamic range of compression and an easy trade-off between compression factor and quality of reconstruction to accommodate a wide diversity of IoT applications as well as their time-varying energy/performance needs.
そこで本研究では,従来の手法に比べて高い圧縮を実現するため,粗視タスクの精度を維持しつつ,視覚的品質を犠牲にしてはるかに高い圧縮を実現する,新しい機械学習(ml)誘導画像圧縮フレームワークであるmagicを提案する。
中心的な考え方は、アプリケーション固有のドメイン知識を取り込み、高い圧縮を達成するために効率的に利用することである。
我々は、MAGICフレームワークが幅広い圧縮/品質で構成可能であり、JPEG 2000とWebPの標準品質制限を超えて圧縮可能であることを実証した。
2つのビジョンデータセットを使用して代表的IoTアプリケーションの実験を行い、ソースに対して同様の精度で42.65倍の圧縮を示す。
JPEG 2000 や WebP と比較して,画像間の圧縮速度のばらつきが低いことを示す。
関連論文リスト
- Large Language Models for Lossless Image Compression: Next-Pixel Prediction in Language Space is All You Need [53.584140947828004]
前例のないインテリジェンスを持つ言語大モデル(LLM)は、様々なデータモダリティのための汎用ロスレス圧縮機である。
P$2$-LLMは,様々な入念な洞察と方法論を統合した次世代の予測型LLMである。
ベンチマークデータセットの実験では、P$2$-LLMがSOTAの古典的および学習的コーデックに勝ることを示した。
論文 参考訳(メタデータ) (2024-11-19T12:15:40Z) - Learned Image Compression for HE-stained Histopathological Images via Stain Deconvolution [33.69980388844034]
本稿では,一般的なJPEGアルゴリズムがさらなる圧縮に適していないことを示す。
Stain Quantized Latent Compression, a novel DL based histopathology data compression approach。
提案手法はJPEGのような従来の手法と比較して,下流タスクの分類において優れた性能を示すことを示す。
論文 参考訳(メタデータ) (2024-06-18T13:47:17Z) - Implicit Neural Image Field for Biological Microscopy Image Compression [37.0218688308699]
Inlicit Neural Representation (INR) に基づく適応圧縮ワークフローを提案する。
このアプローチは、任意の形状の画像を圧縮し、任意のピクセル単位の圧縮が可能な、アプリケーション固有の圧縮目的を許容する。
我々は,我々のワークフローが高精細圧縮比を達成しただけでなく,下流解析に不可欠な詳細な情報も保存できることを,広範囲にわたる顕微鏡画像で実証した。
論文 参考訳(メタデータ) (2024-05-29T11:51:33Z) - UniCompress: Enhancing Multi-Data Medical Image Compression with Knowledge Distillation [59.3877309501938]
Inlicit Neural Representation (INR) ネットワークは、その柔軟な圧縮比のため、顕著な汎用性を示している。
周波数領域情報を含むコードブックをINRネットワークへの事前入力として導入する。
これにより、INRの表現力が向上し、異なる画像ブロックに対して特異な条件付けが提供される。
論文 参考訳(メタデータ) (2024-05-27T05:52:13Z) - RAGE for the Machine: Image Compression with Low-Cost Random Access for
Embedded Applications [5.199703527082964]
RAGEは画像圧縮フレームワークで、一般的に矛盾する4つの目的を達成する。
RAGEは、最先端のロスレス画像圧縮機と類似またはより良い圧縮比を有することを示す。
また、RAGE-Qは、組込みグラフィックスの歪みという点でJPEGを数倍上回っていることを示す。
論文 参考訳(メタデータ) (2024-02-07T19:28:33Z) - Transferable Learned Image Compression-Resistant Adversarial Perturbations [66.46470251521947]
敵対的攻撃は容易に画像分類システムを破壊し、DNNベースの認識タスクの脆弱性を明らかにする。
我々は、学習した画像圧縮機を前処理モジュールとして利用する画像分類モデルをターゲットにした新しいパイプラインを提案する。
論文 参考訳(メタデータ) (2024-01-06T03:03:28Z) - Machine Perception-Driven Image Compression: A Layered Generative
Approach [32.23554195427311]
階層型生成画像圧縮モデルを提案する。
タスクに依存しない学習に基づく圧縮モデルを提案し、様々な圧縮されたドメインベースの分析タスクを効果的にサポートする。
圧縮比、再構成画像品質、下流知覚性能の最良のバランス点を得るために、共同最適化スケジュールを採用する。
論文 参考訳(メタデータ) (2023-04-14T02:12:38Z) - A Unified Image Preprocessing Framework For Image Compression [5.813935823171752]
そこで我々は,既存のコーデックの性能向上を図るために,Kuchenと呼ばれる統合された画像圧縮前処理フレームワークを提案する。
このフレームワークは、ハイブリッドデータラベリングシステムと、パーソナライズされた前処理をシミュレートする学習ベースのバックボーンで構成されている。
その結果,我々の統合前処理フレームワークによって最適化された現代のコーデックは,常に最先端圧縮の効率を向上することを示した。
論文 参考訳(メタデータ) (2022-08-15T10:41:00Z) - Early Exit or Not: Resource-Efficient Blind Quality Enhancement for
Compressed Images [54.40852143927333]
ロスシー画像圧縮は、通信帯域を節約するために広範に行われ、望ましくない圧縮アーティファクトをもたらす。
圧縮画像に対する資源効率の高いブラインド品質向上手法(RBQE)を提案する。
提案手法は, 評価された画像の品質に応じて, 自動的にエンハンスメントを終了するか, 継続するかを決定することができる。
論文 参考訳(メタデータ) (2020-06-30T07:38:47Z) - Learning for Video Compression with Hierarchical Quality and Recurrent
Enhancement [164.7489982837475]
本稿では,階層型ビデオ圧縮(HLVC)手法を提案する。
我々のHLVCアプローチでは、エンコーダ側とデコーダ側の低品質フレームの圧縮と強化を容易にするため、階層的品質は符号化効率の恩恵を受ける。
論文 参考訳(メタデータ) (2020-03-04T09:31:37Z) - Discernible Image Compression [124.08063151879173]
本稿では、外観と知覚の整合性の両方を追求し、圧縮画像を作成することを目的とする。
エンコーダ・デコーダ・フレームワークに基づいて,事前学習したCNNを用いて,オリジナル画像と圧縮画像の特徴を抽出する。
ベンチマーク実験により,提案手法を用いて圧縮した画像は,その後の視覚認識・検出モデルでもよく認識できることが示された。
論文 参考訳(メタデータ) (2020-02-17T07:35:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。