論文の概要: Leveraging Domain Knowledge using Machine Learning for Image Compression
in Internet-of-Things
- arxiv url: http://arxiv.org/abs/2009.06742v1
- Date: Mon, 14 Sep 2020 20:59:19 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-18 13:02:01.969423
- Title: Leveraging Domain Knowledge using Machine Learning for Image Compression
in Internet-of-Things
- Title(参考訳): インターネットにおける画像圧縮のための機械学習を用いたドメイン知識の活用
- Authors: Prabuddha Chakraborty, Jonathan Cruz, Swarup Bhunia
- Abstract要約: MAGICは、新しい機械学習(ML)ガイド画像圧縮フレームワークである。
MAGIC フレームワークは JPEG 2000 および WebP の標準品質限界を超えて圧縮可能であることを示す。
JPEG 2000 や WebP と比較して,画像間の圧縮速度のばらつきが低いことを示す。
- 参考スコア(独自算出の注目度): 8.937905773981702
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The emergent ecosystems of intelligent edge devices in diverse Internet of
Things (IoT) applications, from automatic surveillance to precision
agriculture, increasingly rely on recording and processing variety of image
data. Due to resource constraints, e.g., energy and communication bandwidth
requirements, these applications require compressing the recorded images before
transmission. For these applications, image compression commonly requires: (1)
maintaining features for coarse-grain pattern recognition instead of the
high-level details for human perception due to machine-to-machine
communications; (2) high compression ratio that leads to improved energy and
transmission efficiency; (3) large dynamic range of compression and an easy
trade-off between compression factor and quality of reconstruction to
accommodate a wide diversity of IoT applications as well as their time-varying
energy/performance needs. To address these requirements, we propose, MAGIC, a
novel machine learning (ML) guided image compression framework that judiciously
sacrifices visual quality to achieve much higher compression when compared to
traditional techniques, while maintaining accuracy for coarse-grained vision
tasks. The central idea is to capture application-specific domain knowledge and
efficiently utilize it in achieving high compression. We demonstrate that the
MAGIC framework is configurable across a wide range of compression/quality and
is capable of compressing beyond the standard quality factor limits of both
JPEG 2000 and WebP. We perform experiments on representative IoT applications
using two vision datasets and show up to 42.65x compression at similar accuracy
with respect to the source. We highlight low variance in compression rate
across images using our technique as compared to JPEG 2000 and WebP.
- Abstract(参考訳): iot(internet of things)アプリケーションにおけるインテリジェントエッジデバイスの創発的なエコシステムは、自動監視から精密農業まで、さまざまなイメージデータの記録と処理に依存している。
リソースの制約、例えばエネルギーと通信帯域幅の要件により、これらのアプリケーションは送信前に記録された画像を圧縮する必要がある。
For these applications, image compression commonly requires: (1) maintaining features for coarse-grain pattern recognition instead of the high-level details for human perception due to machine-to-machine communications; (2) high compression ratio that leads to improved energy and transmission efficiency; (3) large dynamic range of compression and an easy trade-off between compression factor and quality of reconstruction to accommodate a wide diversity of IoT applications as well as their time-varying energy/performance needs.
そこで本研究では,従来の手法に比べて高い圧縮を実現するため,粗視タスクの精度を維持しつつ,視覚的品質を犠牲にしてはるかに高い圧縮を実現する,新しい機械学習(ml)誘導画像圧縮フレームワークであるmagicを提案する。
中心的な考え方は、アプリケーション固有のドメイン知識を取り込み、高い圧縮を達成するために効率的に利用することである。
我々は、MAGICフレームワークが幅広い圧縮/品質で構成可能であり、JPEG 2000とWebPの標準品質制限を超えて圧縮可能であることを実証した。
2つのビジョンデータセットを使用して代表的IoTアプリケーションの実験を行い、ソースに対して同様の精度で42.65倍の圧縮を示す。
JPEG 2000 や WebP と比較して,画像間の圧縮速度のばらつきが低いことを示す。
関連論文リスト
- MISC: Ultra-low Bitrate Image Semantic Compression Driven by Large
Multimodal Model [81.35367970135778]
本稿では,マルチモーダル画像セマンティック圧縮法を提案する。
画像の意味情報を抽出するLMMエンコーダと、その意味に対応する領域を特定するマップエンコーダと、非常に圧縮されたビットストリームを生成する画像エンコーダと、前記情報に基づいて画像を再構成するデコーダとからなる。
知覚50%を節約しながら最適な一貫性と知覚結果を達成することができ、これは次世代のストレージと通信において強力な可能性を持つ。
論文 参考訳(メタデータ) (2024-02-26T17:11:11Z) - RAGE for the Machine: Image Compression with Low-Cost Random Access for
Embedded Applications [5.199703527082964]
RAGEは画像圧縮フレームワークで、一般的に矛盾する4つの目的を達成する。
RAGEは、最先端のロスレス画像圧縮機と類似またはより良い圧縮比を有することを示す。
また、RAGE-Qは、組込みグラフィックスの歪みという点でJPEGを数倍上回っていることを示す。
論文 参考訳(メタデータ) (2024-02-07T19:28:33Z) - Transferable Learned Image Compression-Resistant Adversarial
Perturbations [69.79762292033553]
敵対的攻撃は容易に画像分類システムを破壊し、DNNベースの認識タスクの脆弱性を明らかにする。
我々は、学習した画像圧縮機を前処理モジュールとして利用する画像分類モデルをターゲットにした新しいパイプラインを提案する。
論文 参考訳(メタデータ) (2024-01-06T03:03:28Z) - Machine Perception-Driven Image Compression: A Layered Generative
Approach [32.23554195427311]
階層型生成画像圧縮モデルを提案する。
タスクに依存しない学習に基づく圧縮モデルを提案し、様々な圧縮されたドメインベースの分析タスクを効果的にサポートする。
圧縮比、再構成画像品質、下流知覚性能の最良のバランス点を得るために、共同最適化スケジュールを採用する。
論文 参考訳(メタデータ) (2023-04-14T02:12:38Z) - Attention-Based Generative Neural Image Compression on Solar Dynamics
Observatory [12.283978726972752]
NASAのSolar Dynamics Observatory(SDO)ミッションは、地球同期軌道から毎日1.4テラバイトのデータを収集する。
近年、画像圧縮を行う上で、エンドツーエンド最適化された人工知能(ANN)が大きな可能性を示している。
我々は、宇宙ミッションで格納・回収されるデータ量を削減するために、アドホックなANNベースの画像圧縮スキームを設計した。
論文 参考訳(メタデータ) (2022-10-12T17:39:08Z) - Data Efficient Visual Place Recognition Using Extremely JPEG-Compressed
Images [17.847661026367767]
本稿では,JPEG圧縮が視覚的位置認識技術の性能に与える影響について検討する。
圧縮を導入することにより、特に高い圧縮スペクトルにおいて、VPR性能が大幅に低下することを示す。
我々は、JPEG圧縮データに最適化された微調整CNNを提案し、非常に圧縮されたJPEG画像で検出された画像変換とより一貫した性能を示す。
論文 参考訳(メタデータ) (2022-09-17T14:46:28Z) - A Unified Image Preprocessing Framework For Image Compression [5.813935823171752]
そこで我々は,既存のコーデックの性能向上を図るために,Kuchenと呼ばれる統合された画像圧縮前処理フレームワークを提案する。
このフレームワークは、ハイブリッドデータラベリングシステムと、パーソナライズされた前処理をシミュレートする学習ベースのバックボーンで構成されている。
その結果,我々の統合前処理フレームワークによって最適化された現代のコーデックは,常に最先端圧縮の効率を向上することを示した。
論文 参考訳(メタデータ) (2022-08-15T10:41:00Z) - Analysis of the Effect of Low-Overhead Lossy Image Compression on the
Performance of Visual Crowd Counting for Smart City Applications [78.55896581882595]
画像圧縮技術は画像の品質を低下させ、精度を低下させる。
本稿では,低オーバヘッド損失画像圧縮法の適用が視覚的群集カウントの精度に与える影響を解析する。
論文 参考訳(メタデータ) (2022-07-20T19:20:03Z) - Early Exit or Not: Resource-Efficient Blind Quality Enhancement for
Compressed Images [54.40852143927333]
ロスシー画像圧縮は、通信帯域を節約するために広範に行われ、望ましくない圧縮アーティファクトをもたらす。
圧縮画像に対する資源効率の高いブラインド品質向上手法(RBQE)を提案する。
提案手法は, 評価された画像の品質に応じて, 自動的にエンハンスメントを終了するか, 継続するかを決定することができる。
論文 参考訳(メタデータ) (2020-06-30T07:38:47Z) - Learning for Video Compression with Hierarchical Quality and Recurrent
Enhancement [164.7489982837475]
本稿では,階層型ビデオ圧縮(HLVC)手法を提案する。
我々のHLVCアプローチでは、エンコーダ側とデコーダ側の低品質フレームの圧縮と強化を容易にするため、階層的品質は符号化効率の恩恵を受ける。
論文 参考訳(メタデータ) (2020-03-04T09:31:37Z) - Discernible Image Compression [124.08063151879173]
本稿では、外観と知覚の整合性の両方を追求し、圧縮画像を作成することを目的とする。
エンコーダ・デコーダ・フレームワークに基づいて,事前学習したCNNを用いて,オリジナル画像と圧縮画像の特徴を抽出する。
ベンチマーク実験により,提案手法を用いて圧縮した画像は,その後の視覚認識・検出モデルでもよく認識できることが示された。
論文 参考訳(メタデータ) (2020-02-17T07:35:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。