論文の概要: Exploiting Richness of Learned Compressed Representation of Images for
Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2307.01524v1
- Date: Tue, 4 Jul 2023 07:10:39 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-06 17:57:44.187032
- Title: Exploiting Richness of Learned Compressed Representation of Images for
Semantic Segmentation
- Title(参考訳): セマンティックセグメンテーションのための画像の学習圧縮表現の爆発的富化
- Authors: Ravi Kakaiya, Rakshith Sathish, Ramanathan Sethuraman
- Abstract要約: 本稿では,標準パイプラインの減圧操作に発生する遅延のオーバーヘッドを軽減するために,学習ベースの圧縮コーデックを提案する。
提案したパイプラインをCityscapesデータセット上で実験的に検証し、圧縮係数を最大6.6倍の値で達成しました。
- 参考スコア(独自算出の注目度): 0.5156484100374058
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Autonomous vehicles and Advanced Driving Assistance Systems (ADAS) have the
potential to radically change the way we travel. Many such vehicles currently
rely on segmentation and object detection algorithms to detect and track
objects around its surrounding. The data collected from the vehicles are often
sent to cloud servers to facilitate continual/life-long learning of these
algorithms. Considering the bandwidth constraints, the data is compressed
before sending it to servers, where it is typically decompressed for training
and analysis. In this work, we propose the use of a learning-based compression
Codec to reduce the overhead in latency incurred for the decompression
operation in the standard pipeline. We demonstrate that the learned compressed
representation can also be used to perform tasks like semantic segmentation in
addition to decompression to obtain the images. We experimentally validate the
proposed pipeline on the Cityscapes dataset, where we achieve a compression
factor up to $66 \times$ while preserving the information required to perform
segmentation with a dice coefficient of $0.84$ as compared to $0.88$ achieved
using decompressed images while reducing the overall compute by $11\%$.
- Abstract(参考訳): 自動運転車とADAS(Advanced Driving Assistance Systems)は、旅行のやり方を根本的に変える可能性がある。
これらの車両の多くは、周囲の物体を検知し追跡するために、現在セグメンテーションと物体検出アルゴリズムに依存している。
車両から収集されたデータは、これらのアルゴリズムの継続的な/一生の学習を容易にするために、しばしばクラウドサーバに送られる。
帯域幅の制約を考慮すると、データはサーバに送信する前に圧縮され、トレーニングや分析のためにデ圧縮される。
本研究では,標準パイプラインにおける減圧縮動作に発生するレイテンシのオーバーヘッドを削減するために,学習ベースの圧縮コーデックを用いることを提案する。
得られた圧縮表現は,画像を得るための減算に加えて,意味セグメンテーションなどのタスクの実行にも利用できることを示す。
我々は、cityscapesデータセット上で提案されたパイプラインを実験的に検証し、圧縮係数を最大6,6 \times$とし、除算された画像を用いて達成した0.88$に対して、サイス係数0.84$でセグメンテーションを行うために必要な情報を保存し、全体的な計算を1,1\%$で削減した。
関連論文リスト
- Neural-based Compression Scheme for Solar Image Data [8.374518151411612]
我々は、NASAのデータ集約画像ミッションで使用されるニューラルネットワークに基づく損失圧縮手法を提案する。
本研究では,画像の局所構造と大域構造の両方を捉えるために,局所的および非局所的アテンションモジュールを備えた逆トレーニングニューラルネットワークを提案する。
このアルゴリズムをSDOデータ解析に使用するための概念実証として、圧縮画像を用いてコロナホール(CH)検出を行った。
論文 参考訳(メタデータ) (2023-11-06T04:13:58Z) - CompaCT: Fractal-Based Heuristic Pixel Segmentation for Lossless Compression of High-Color DICOM Medical Images [0.0]
医用画像は、医師による正確な分析のために、ピクセル単位の12ビットの高色深度を必要とする。
フィルタリングによる画像の標準圧縮はよく知られているが、具体化されていない実装のため、医療領域ではまだ最適ではない。
本研究では,動的に拡張されたデータ処理のための画素濃度の空間的特徴とパターンをターゲットとした医用画像圧縮アルゴリズムCompaCTを提案する。
論文 参考訳(メタデータ) (2023-08-24T21:43:04Z) - Are Visual Recognition Models Robust to Image Compression? [23.280147529096908]
画像圧縮が視覚認知タスクに与える影響を解析する。
我々は、0.1ビットから2ビット/ピクセル(bpp)までの幅広い圧縮レベルについて検討する。
これら3つのタスクすべてにおいて,強い圧縮を使用する場合,認識能力に大きな影響があることが判明した。
論文 参考訳(メタデータ) (2023-04-10T11:30:11Z) - Deep Lossy Plus Residual Coding for Lossless and Near-lossless Image
Compression [85.93207826513192]
本稿では、損失のない画像圧縮とほぼロスレス画像圧縮の両面において、統合された強力な深い損失+残差(DLPR)符号化フレームワークを提案する。
VAEのアプローチにおける連立損失と残留圧縮の問題を解く。
ほぼロスレスモードでは、元の残差を量子化し、与えられた$ell_infty$エラー境界を満たす。
論文 参考訳(メタデータ) (2022-09-11T12:11:56Z) - Crowd Counting on Heavily Compressed Images with Curriculum Pre-Training [90.76576712433595]
ディープニューラルネットワークによって処理された画像に損失圧縮を適用することで、大幅な精度低下につながる可能性がある。
カリキュラム学習のパラダイムに着想を得て,圧縮画像の群集カウントのためのカリキュラム事前学習(CPT)と呼ばれる新しいトレーニング手法を提案する。
論文 参考訳(メタデータ) (2022-08-15T08:43:21Z) - Optimizing Image Compression via Joint Learning with Denoising [49.83680496296047]
スマートフォンカメラに搭載された比較的小さなセンサーのため、今日の撮像画像には高レベルのノイズが通常存在している。
計算コストを少なくして目的をシンプルかつ効果的に実現できるように,プラグイン機能付き2分岐重み共有アーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-07-22T04:23:01Z) - Estimating the Resize Parameter in End-to-end Learned Image Compression [50.20567320015102]
本稿では,最近の画像圧縮モデルの速度歪みトレードオフをさらに改善する検索自由化フレームワークについて述べる。
提案手法により,Bjontegaard-Deltaレート(BD-rate)を最大10%向上させることができる。
論文 参考訳(メタデータ) (2022-04-26T01:35:02Z) - Supervised Compression for Resource-constrained Edge Computing Systems [26.676557573171618]
フルスケールのディープニューラルネットワークは、エネルギーとストレージの面でリソース集約的すぎることが多い。
本稿では、知識蒸留とニューラルイメージ圧縮のアイデアを採用し、中間特徴表現をより効率的に圧縮する。
教師付きレート歪み性能を向上するとともに、エンドツーエンドのレイテンシも小さくする。
論文 参考訳(メタデータ) (2021-08-21T11:10:29Z) - Learning Scalable $\ell_\infty$-constrained Near-lossless Image
Compression via Joint Lossy Image and Residual Compression [118.89112502350177]
本稿では,$ell_infty$-constrained near-lossless image compressionを学習するための新しいフレームワークを提案する。
元の残差の学習確率モデルを定量化し、量子化残差の確率モデルを導出する。
論文 参考訳(メタデータ) (2021-03-31T11:53:36Z) - Modeling Lost Information in Lossy Image Compression [72.69327382643549]
ロスシー画像圧縮は、デジタル画像の最もよく使われる演算子の1つである。
Invertible Lossy Compression (ILC) と呼ばれる新しい非可逆的フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-22T04:04:56Z) - Distributed Learning and Inference with Compressed Images [40.07509530656681]
本稿では,自律運転に対する視覚に基づく認識をパラダイムシナリオとして取り上げる。
生成逆ネットワーク(GAN)を用いた画像復元に基づくデータセット復元を提案する。
本手法は,特定の画像圧縮手法と下流タスクの両方に非依存である。
論文 参考訳(メタデータ) (2020-04-22T11:20:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。