論文の概要: Compressing Sign Information in DCT-based Image Coding via Deep Sign Retrieval
- arxiv url: http://arxiv.org/abs/2209.10712v2
- Date: Fri, 10 May 2024 11:19:16 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-13 20:56:05.868197
- Title: Compressing Sign Information in DCT-based Image Coding via Deep Sign Retrieval
- Title(参考訳): ディープサイン検索によるDCT画像符号化における符号情報圧縮
- Authors: Kei Suzuki, Chihiro Tsutake, Keita Takahashi, Toshiaki Fujii,
- Abstract要約: 我々は,手話検索と呼ばれる手話情報に対する効率的な圧縮手法を提案する。
この方法は、古典的な信号復元問題である位相検索にインスパイアされている。
提案手法は,従来の手法よりも符号とコストのビット量で優れていたことを示す。
- 参考スコア(独自算出の注目度): 7.265802362714621
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Compressing the sign information of discrete cosine transform (DCT) coefficients is an intractable problem in image coding schemes due to the equiprobable characteristics of the signs. To overcome this difficulty, we propose an efficient compression method for the sign information called "sign retrieval." This method is inspired by phase retrieval, which is a classical signal restoration problem of finding the phase information of discrete Fourier transform coefficients from their magnitudes. The sign information of all DCT coefficients is excluded from a bitstream at the encoder and is complemented at the decoder through our sign retrieval method. We show through experiments that our method outperforms previous ones in terms of the bit amount for the signs and computation cost. Our method, implemented in Python language, is available from https://github.com/ctsutake/dsr.
- Abstract(参考訳): 離散コサイン変換(DCT)係数の符号情報を圧縮することは、符号の等価性に起因する画像符号化方式における難解な問題である。
この難しさを克服するために,手話検索と呼ばれる手話情報に対する効率的な圧縮手法を提案する。
この方法は、離散フーリエ変換係数の位相情報をその大きさから求める古典的な信号復元問題である位相探索に着想を得たものである。
全てのDCT係数の符号情報はエンコーダのビットストリームから除外され、この符号検索手法によりデコーダで補完される。
実験により,提案手法は,符号のビット量や計算コストにおいて,従来の手法よりも優れていたことを示す。
私たちのメソッドはPython言語で実装されており、https://github.com/ctsutake/dsr.comから利用可能です。
関連論文リスト
- Transformer based Pluralistic Image Completion with Reduced Information Loss [72.92754600354199]
トランスフォーマーをベースとした手法は,近年,イメージインペイントにおいて大きな成功を収めている。
彼らは各ピクセルをトークンとみなし、情報損失の問題に悩まされる。
我々はPUTと呼ばれる新しいトランスフォーマーベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-31T01:20:16Z) - Hierarchical Sketch Induction for Paraphrase Generation [79.87892048285819]
本稿では、高密度符号化の分解を学習するHRQ-VAE(Hierarchical Refinement Quantized Variational Autoencoders)を紹介する。
HRQ-VAEを用いて、入力文の構文形式を階層化の経路としてエンコードすることで、テスト時の構文スケッチをより容易に予測できる。
論文 参考訳(メタデータ) (2022-03-07T15:28:36Z) - Reducing Redundancy in the Bottleneck Representation of the Autoencoders [98.78384185493624]
オートエンコーダは教師なしニューラルネットワークの一種であり、様々なタスクを解くのに使用できる。
本稿では,ボトルネック表現における特徴冗長性を明示的に罰する手法を提案する。
我々は,3つの異なるデータセットを用いた次元削減,MNISTデータセットを用いた画像圧縮,ファッションMNISTを用いた画像デノナイズという,さまざまなタスクにまたがってアプローチを検証した。
論文 参考訳(メタデータ) (2022-02-09T18:48:02Z) - Signal Processing Based Deep Learning for Blind Symbol Decoding and
Modulation Classification [14.276414947868727]
信号の盲目的復号には、未知の送信パラメータを推定し、無線チャネルの障害を補償し、変調タイプを特定する必要がある。
本稿では、DSP操作の信号経路と、未知の送信パラメータを推定するニューラルネットワークの特徴経路からなる二重経路ネットワーク(DPN)を提案する。
論文 参考訳(メタデータ) (2021-06-19T18:00:31Z) - CoDERT: Distilling Encoder Representations with Co-learning for
Transducer-based Speech Recognition [14.07385381963374]
トランスデューサのエンコーダ出力は自然に高いエントロピーを持ち、音響的に類似した単語-ピースの混同に関する豊富な情報を含んでいることを示す。
本稿では,教師のトランスデューサのエンコーダのロジットを蒸留するための補助的損失を導入し,このエンコーダ蒸留が効果的に機能するトレーニング戦略を探る。
論文 参考訳(メタデータ) (2021-06-14T20:03:57Z) - Neural Distributed Source Coding [59.630059301226474]
相関構造に依存せず,高次元までスケール可能な損失DSCのためのフレームワークを提案する。
提案手法は,複数のデータセット上で評価し,複雑な相関関係と最先端PSNRを扱えることを示す。
論文 参考訳(メタデータ) (2021-06-05T04:50:43Z) - Autoencoding Variational Autoencoder [56.05008520271406]
我々は,この行動が学習表現に与える影響と,自己整合性の概念を導入することでそれを修正する結果について検討する。
自己整合性アプローチで訓練されたエンコーダは、敵攻撃による入力の摂動に対して頑健な(無神経な)表現につながることを示す。
論文 参考訳(メタデータ) (2020-12-07T14:16:14Z) - Solving Phase Retrieval with a Learned Reference [18.76940558836028]
フーリエ位相探索は、フーリエ係数の振幅測定から画像の回復を扱う古典的な問題である。
本稿では、振幅測定を行う前に、既知の(学習した)参照を信号に追加すると仮定する。
本手法はホログラフィーに参照信号を追加する原理に着想を得たものである。
論文 参考訳(メタデータ) (2020-07-29T06:17:25Z) - Modeling Lost Information in Lossy Image Compression [72.69327382643549]
ロスシー画像圧縮は、デジタル画像の最もよく使われる演算子の1つである。
Invertible Lossy Compression (ILC) と呼ばれる新しい非可逆的フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-22T04:04:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。