論文の概要: Semantic Segmentation in Learned Compressed Domain
- arxiv url: http://arxiv.org/abs/2209.01355v1
- Date: Sat, 3 Sep 2022 07:59:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-07 14:57:45.307574
- Title: Semantic Segmentation in Learned Compressed Domain
- Title(参考訳): 学習した圧縮領域のセマンティックセグメンテーション
- Authors: Jinming Liu and Heming Sun and Jiro Katto
- Abstract要約: セグメント化タスクを改善するために,圧縮された領域に基づく手法を提案する。
2つの異なるモジュールを探索、解析し、圧縮された表現をセグメンテーションネットワークの特徴として変換するのに役立つ。
- 参考スコア(独自算出の注目度): 21.53261818914534
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Most machine vision tasks (e.g., semantic segmentation) are based on images
encoded and decoded by image compression algorithms (e.g., JPEG). However,
these decoded images in the pixel domain introduce distortion, and they are
optimized for human perception, making the performance of machine vision tasks
suboptimal. In this paper, we propose a method based on the compressed domain
to improve segmentation tasks. i) A dynamic and a static channel selection
method are proposed to reduce the redundancy of compressed representations that
are obtained by encoding. ii) Two different transform modules are explored and
analyzed to help the compressed representation be transformed as the features
in the segmentation network. The experimental results show that we can save up
to 15.8\% bitrates compared with a state-of-the-art compressed domain-based
work while saving up to about 83.6\% bitrates and 44.8\% inference time
compared with the pixel domain-based method.
- Abstract(参考訳): ほとんどのマシンビジョンタスク(セマンティックセグメンテーションなど)は、画像圧縮アルゴリズム(JPEGなど)によって符号化されデコードされた画像に基づいている。
しかし、これらのデコードされた画像は歪みを導入し、人間の知覚に最適化され、マシンビジョンタスクの性能が準最適となる。
本稿では,圧縮領域をベースとしたセグメンテーションタスクの改善手法を提案する。
一 符号化により得られる圧縮表現の冗長性を低減するため、動的及び静的チャネル選択法を提案する。
二) 圧縮表現をセグメンテーションネットワークの特徴として変換するために、2つの異なる変換モジュールを探索し、分析する。
実験の結果,最先端の圧縮ドメインベースに比べて最大15.8\%のビットレートを節約できる一方で,最大83.6\%のビットレートと44.8\%の推論時間を節約できることがわかった。
関連論文リスト
- Progressive Learning with Visual Prompt Tuning for Variable-Rate Image
Compression [60.689646881479064]
本稿では,変圧器を用いた可変レート画像圧縮のためのプログレッシブラーニングパラダイムを提案する。
視覚的プロンプトチューニングにインスパイアされた私たちは,エンコーダ側とデコーダ側でそれぞれ入力画像と隠蔽特徴のプロンプトを抽出するためにLPMを使用する。
提案モデルでは, 速度歪み特性の観点から現行の可変画像法よりも優れ, スクラッチから訓練した最先端の固定画像圧縮法にアプローチする。
論文 参考訳(メタデータ) (2023-11-23T08:29:32Z) - CompaCT: Fractal-Based Heuristic Pixel Segmentation for Lossless Compression of High-Color DICOM Medical Images [0.0]
医用画像は、医師による正確な分析のために、ピクセル単位の12ビットの高色深度を必要とする。
フィルタリングによる画像の標準圧縮はよく知られているが、具体化されていない実装のため、医療領域ではまだ最適ではない。
本研究では,動的に拡張されたデータ処理のための画素濃度の空間的特徴とパターンをターゲットとした医用画像圧縮アルゴリズムCompaCTを提案する。
論文 参考訳(メタデータ) (2023-08-24T21:43:04Z) - You Can Mask More For Extremely Low-Bitrate Image Compression [80.7692466922499]
近年,学習画像圧縮(lic)法は大きな進歩を遂げている。
licメソッドは、画像圧縮に不可欠な画像構造とテクスチャコンポーネントを明示的に探索することができない。
原画像の構造とテクスチャに基づいて可視パッチをサンプリングするDA-Maskを提案する。
極めて低ビットレート圧縮のために, lic と lic のエンドツーエンドを統一する最初のフレームワークである, 単純で効果的なマスク付き圧縮モデル (MCM) を提案する。
論文 参考訳(メタデータ) (2023-06-27T15:36:22Z) - DNN-Compressed Domain Visual Recognition with Feature Adaptation [19.79803434998116]
学習に基づく画像圧縮は、最先端の変換ベースのコーデックと競合する性能を発揮することが示されている。
これはJPEG-AIのような新しい学習ベースのビジュアル圧縮標準の開発を動機づけた。
本稿では,圧縮領域表現を用いて,圧縮領域内で直接視覚処理やコンピュータビジョンタスクを行う学習ベース圧縮方式について述べる。
論文 参考訳(メタデータ) (2023-05-13T20:45:17Z) - Neural JPEG: End-to-End Image Compression Leveraging a Standard JPEG
Encoder-Decoder [73.48927855855219]
本稿では,エンコーダとデコーダの両端に内在するニューラル表現を強化することで,符号化性能の向上を図るシステムを提案する。
実験により,提案手法はJPEGに対する速度歪み性能を,様々な品質指標で改善することを示した。
論文 参考訳(メタデータ) (2022-01-27T20:20:03Z) - A New Image Codec Paradigm for Human and Machine Uses [53.48873918537017]
本研究では,人間用と機械用の両方にスケーラブルな画像パラダイムを提案する。
高レベルのインスタンスセグメンテーションマップと低レベルの信号特徴をニューラルネットワークで抽出する。
画像は16ビットのグレースケールプロファイルと信号特徴を持つ一般的な画質のイメージ再構成を実現するために設計および訓練される。
論文 参考訳(メタデータ) (2021-12-19T06:17:38Z) - A Novel Upsampling and Context Convolution for Image Semantic
Segmentation [0.966840768820136]
最近のセマンティックセグメンテーションの方法は、しばしば深い畳み込みニューラルネットワークを用いたエンコーダデコーダ構造を採用している。
ネットワーク内の画像の空間情報を効率的に保存するために,ガイドフィルタに基づく高密度アップサンプリング畳み込み法を提案する。
ADE20KとPascal-Contextのベンチマークデータセットでは,それぞれ82.86%,81.62%の画素精度を記録した。
論文 参考訳(メタデータ) (2021-03-20T06:16:42Z) - End-to-end optimized image compression for multiple machine tasks [3.8323580808203785]
我々は,圧縮コンテンツの直接変換を可能にするために,デコーダとタスクアルゴリズムの間に挿入される「コネクタ」を導入する。
画像分類とオブジェクトセグメンテーションの両方において高いレート精度向上を実現し,提案手法の有効性を実証する。
論文 参考訳(メタデータ) (2021-03-06T19:09:05Z) - Image Compression with Encoder-Decoder Matched Semantic Segmentation [15.536056887418676]
レイヤー画像圧縮は有望な方向です。
セマンティックセグメントを圧縮された画像データと共に送信する作業もある。
エンコーダマッチングセマンティックセグメンテーション(EDMS)を用いた新しいレイヤー画像圧縮フレームワークを提案する。
提案されたEDMSフレームワークは、HEVCベース(BPG)エンコーディング時間よりも最大35.31%のBDレート削減を達成できる。
論文 参考訳(メタデータ) (2021-01-24T04:11:05Z) - Modeling Lost Information in Lossy Image Compression [72.69327382643549]
ロスシー画像圧縮は、デジタル画像の最もよく使われる演算子の1つである。
Invertible Lossy Compression (ILC) と呼ばれる新しい非可逆的フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-22T04:04:56Z) - Discernible Image Compression [124.08063151879173]
本稿では、外観と知覚の整合性の両方を追求し、圧縮画像を作成することを目的とする。
エンコーダ・デコーダ・フレームワークに基づいて,事前学習したCNNを用いて,オリジナル画像と圧縮画像の特徴を抽出する。
ベンチマーク実験により,提案手法を用いて圧縮した画像は,その後の視覚認識・検出モデルでもよく認識できることが示された。
論文 参考訳(メタデータ) (2020-02-17T07:35:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。