論文の概要: Object Detection-Based Variable Quantization Processing
- arxiv url: http://arxiv.org/abs/2009.00189v1
- Date: Tue, 1 Sep 2020 02:40:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-23 01:20:50.174213
- Title: Object Detection-Based Variable Quantization Processing
- Title(参考訳): 物体検出に基づく可変量子化処理
- Authors: Likun Liu, Hua Qi
- Abstract要約: 本稿では,従来の画像エンコーダとビデオエンコーダの事前処理手法を提案する。
静止フレームや画像は、まず物体検出器を通り抜ける。
この処理方法は、適応量子化プロセスを利用して、ドロップするデータの一部を決定する。
- 参考スコア(独自算出の注目度): 0.8376091455761261
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we propose a preprocessing method for conventional image and
video encoders that can make these existing encoders content-aware. By going
through our process, a higher quality parameter could be set on a traditional
encoder without increasing the output size. A still frame or an image will
firstly go through an object detector. Either the properties of the detection
result will decide the parameters of the following procedures, or the system
will be bypassed if no object is detected in the given frame. The processing
method utilizes an adaptive quantization process to determine the portion of
data to be dropped. This method is primarily based on the JPEG compression
theory and is optimum for JPEG-based encoders such as JPEG encoders and the
Motion JPEG encoders. However, other DCT-based encoders like MPEG part 2,
H.264, etc. can also benefit from this method. In the experiments, we compare
the MS-SSIM under the same bitrate as well as similar MS-SSIM but enhanced
bitrate. As this method is based on human perception, even with similar
MS-SSIM, the overall watching experience will be better than the direct encoded
ones.
- Abstract(参考訳): 本稿では,既存のエンコーダをコンテンツ認識できる従来の画像およびビデオエンコーダのプリプロセッシング手法を提案する。
我々のプロセスを通じて、出力サイズを増大させることなく、従来のエンコーダにより高い品質パラメータを設定することができる。
静止フレームまたは画像は、まずオブジェクト検出器を通過します。
検出結果の特性が次の手順のパラメータを決定するか、あるいは与えられたフレームにオブジェクトが検出されていない場合、システムはバイパスされる。
この処理方法は、降下するデータの一部を決定するために適応量子化プロセスを利用する。
この手法は主にJPEG圧縮理論に基づいており、JPEGエンコーダやモーションJPEGエンコーダのようなJPEGベースのエンコーダに最適である。
しかし、MPEG部2、H.264などの他のDCTベースのエンコーダもこの方法の恩恵を受けることができる。
実験では,同じビットレートのMS-SSIMと類似のMS-SSIMとの比較を行った。
この方法は人間の知覚に基づいており、同様のMS-SSIMであっても、全体的な視聴体験は直接符号化されたものよりも優れている。
関連論文リスト
- JDEC: JPEG Decoding via Enhanced Continuous Cosine Coefficients [17.437568540883106]
本稿では,コサインの連続的定式化による局所的暗黙的ニューラル表現を用いたJPEG画像デコーディングの実践的手法を提案する。
提案するネットワークは,フレキシブルカラー画像JPEGアーティファクト削除タスクにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2024-04-03T03:28:04Z) - MISC: Ultra-low Bitrate Image Semantic Compression Driven by Large Multimodal Model [78.4051835615796]
本稿では,マルチモーダル画像セマンティック圧縮法を提案する。
画像の意味情報を抽出するLMMエンコーダと、その意味に対応する領域を特定するマップエンコーダと、非常に圧縮されたビットストリームを生成する画像エンコーダと、前記情報に基づいて画像を再構成するデコーダとからなる。
知覚50%を節約しながら最適な一貫性と知覚結果を達成することができ、これは次世代のストレージと通信において強力な可能性を持つ。
論文 参考訳(メタデータ) (2024-02-26T17:11:11Z) - High-Perceptual Quality JPEG Decoding via Posterior Sampling [13.238373528922194]
JPEGアーチファクト修正のための異なるパラダイムを提案する。
我々は、圧縮された入力と整合しながら、シャープで詳細で視覚的に再構成された画像を得ることを目指している。
我々のソリューションは、完全な整合性のある入力に対して、多種多様な可塑性かつ高速な再構成を提供する。
論文 参考訳(メタデータ) (2022-11-21T19:47:59Z) - Neural JPEG: End-to-End Image Compression Leveraging a Standard JPEG
Encoder-Decoder [73.48927855855219]
本稿では,エンコーダとデコーダの両端に内在するニューラル表現を強化することで,符号化性能の向上を図るシステムを提案する。
実験により,提案手法はJPEGに対する速度歪み性能を,様々な品質指標で改善することを示した。
論文 参考訳(メタデータ) (2022-01-27T20:20:03Z) - A New Image Codec Paradigm for Human and Machine Uses [53.48873918537017]
本研究では,人間用と機械用の両方にスケーラブルな画像パラダイムを提案する。
高レベルのインスタンスセグメンテーションマップと低レベルの信号特徴をニューラルネットワークで抽出する。
画像は16ビットのグレースケールプロファイルと信号特徴を持つ一般的な画質のイメージ再構成を実現するために設計および訓練される。
論文 参考訳(メタデータ) (2021-12-19T06:17:38Z) - Learning to Improve Image Compression without Changing the Standard
Decoder [100.32492297717056]
本稿では,標準デコーダによる符号化性能向上のための学習法を提案する。
具体的には、DCT係数の分布を最適化する周波数領域事前編集法を提案する。
JPEGデコーダは変更しないので、広く使われている標準JPEGデコーダで画像を見る際には、我々のアプローチが適用可能である。
論文 参考訳(メタデータ) (2020-09-27T19:24:42Z) - Modeling Lost Information in Lossy Image Compression [72.69327382643549]
ロスシー画像圧縮は、デジタル画像の最もよく使われる演算子の1つである。
Invertible Lossy Compression (ILC) と呼ばれる新しい非可逆的フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-22T04:04:56Z) - A Multiparametric Class of Low-complexity Transforms for Image and Video
Coding [0.0]
本稿では,Bouguezel,Ahmed,Swamyの一連の論文に基づいて,低複素度8点DCT近似の新たなクラスを導入する。
最適DCT近似は、符号化効率と画像品質の指標の点で魅力的な結果を示すことを示す。
論文 参考訳(メタデータ) (2020-06-19T21:56:58Z) - Quantization Guided JPEG Artifact Correction [69.04777875711646]
我々はJPEGファイル量子化行列を用いたアーティファクト修正のための新しいアーキテクチャを開発した。
これにより、特定の品質設定のためにトレーニングされたモデルに対して、単一のモデルで最先端のパフォーマンスを達成できます。
論文 参考訳(メタデータ) (2020-04-17T00:10:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。