論文の概要: Exploring Compressed Image Representation as a Perceptual Proxy: A Study
- arxiv url: http://arxiv.org/abs/2401.07200v1
- Date: Sun, 14 Jan 2024 04:37:17 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-17 19:20:53.935459
- Title: Exploring Compressed Image Representation as a Perceptual Proxy: A Study
- Title(参考訳): 知覚的プロキシとしての圧縮画像表現の探索
- Authors: Chen-Hsiu Huang and Ja-Ling Wu
- Abstract要約: 本稿では,解析変換をオブジェクト分類タスクと共同で訓練する,エンドツーエンドの学習画像圧縮を提案する。
本研究は、圧縮された潜在表現が、カスタマイズされたDNNベースの品質指標に匹敵する精度で人間の知覚距離判定を予測できることを確認した。
- 参考スコア(独自算出の注目度): 1.0878040851638
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: We propose an end-to-end learned image compression codec wherein the analysis
transform is jointly trained with an object classification task. This study
affirms that the compressed latent representation can predict human perceptual
distance judgments with an accuracy comparable to a custom-tailored DNN-based
quality metric. We further investigate various neural encoders and demonstrate
the effectiveness of employing the analysis transform as a perceptual loss
network for image tasks beyond quality judgments. Our experiments show that the
off-the-shelf neural encoder proves proficient in perceptual modeling without
needing an additional VGG network. We expect this research to serve as a
valuable reference developing of a semantic-aware and coding-efficient neural
encoder.
- Abstract(参考訳): 本稿では,対象分類タスクと解析変換を併用したエンドツーエンド学習画像圧縮コーデックを提案する。
本研究は、圧縮された潜在表現が、カスタマイズされたDNNベースの品質指標に匹敵する精度で人間の知覚距離判定を予測できることを確認した。
さらに,様々なニューラルエンコーダを調査し,画像課題に対する知覚損失ネットワークとしての解析変換の有効性を,品質判断を超えて実証する。
実験の結果,市販のニューラルエンコーダは,付加的なVGGネットワークを必要とせず,知覚モデリングに熟練していることがわかった。
この研究は、セマンティック認識とコーディング効率のよいニューラルエンコーダの貴重な参照開発として役立つことを期待している。
関連論文リスト
- Blind Image Quality Assessment via Transformer Predicted Error Map and
Perceptual Quality Token [19.67014524146261]
近年,非参照画像品質評価(NR-IQA)が注目されている。
予測された客観的誤差マップと知覚的品質トークンを用いたTransformerベースのNR-IQAモデルを提案する。
提案手法は, 実画像データベースと合成画像データベースの両方において, 現在の最先端技術よりも優れている。
論文 参考訳(メタデータ) (2023-05-16T11:17:54Z) - Convolutional Neural Generative Coding: Scaling Predictive Coding to
Natural Images [79.07468367923619]
畳み込み型神経生成符号化(Conv-NGC)を開発した。
我々は、潜伏状態マップを段階的に洗練する柔軟な神経生物学的動機付けアルゴリズムを実装した。
本研究は,脳にインスパイアされたニューラル・システムによる再建と画像復調の課題に対する効果について検討する。
論文 参考訳(メタデータ) (2022-11-22T06:42:41Z) - Rate-Distortion in Image Coding for Machines [26.32381277880991]
監視などの多くのアプリケーションでは、画像は主として自動分析のために送信され、人間が見ることは滅多にない。
このシナリオの従来の圧縮はビットレートの点で非効率であることが示されている。
このようなスケーラブルなモデルのマシンサイドを作成する方法の1つは、マシンタスクを実行するディープニューラルネットワークにおいて、中間層の機能マッチングを実行することである。
論文 参考訳(メタデータ) (2022-09-21T20:24:14Z) - Toward a Geometrical Understanding of Self-supervised Contrastive
Learning [55.83778629498769]
自己教師付き学習(SSL)は、人間のアノテーションがなければ、伝達学習に有効なデータ表現を作成するための最重要技術の一つである。
メインストリームSSL技術は、エンコーダとプロジェクタという2つのカスケードニューラルネットワークを備えた、特定のディープニューラルネットワークアーキテクチャに依存している。
本稿では,データ拡張ポリシーの強みがデータ埋め込みに与える影響について検討する。
論文 参考訳(メタデータ) (2022-05-13T23:24:48Z) - Data-driven emergence of convolutional structure in neural networks [83.4920717252233]
識別タスクを解くニューラルネットワークが、入力から直接畳み込み構造を学習できることを示す。
データモデルを慎重に設計することにより、このパターンの出現は、入力の非ガウス的、高次局所構造によって引き起こされることを示す。
論文 参考訳(メタデータ) (2022-02-01T17:11:13Z) - Image Quality Assessment using Contrastive Learning [50.265638572116984]
我々は、補助的な問題を解決するために、対照的な対の目的を用いて深層畳み込みニューラルネットワーク(CNN)を訓練する。
本研究では,最新のNR画像品質モデルと比較して,ContriQUEが競争性能を向上することを示す。
以上の結果から,大きなラベル付き主観的画像品質データセットを必要とせずに,知覚的関連性を持つ強力な品質表現が得られることが示唆された。
論文 参考訳(メタデータ) (2021-10-25T21:01:00Z) - Video Coding for Machine: Compact Visual Representation Compression for
Intelligent Collaborative Analytics [101.35754364753409]
Video Coding for Machines (VCM) は、ビデオ/画像圧縮と特徴圧縮をある程度別々の研究トラックにブリッジすることを約束している。
本稿では,既存の学術・産業活動に基づくVCM方法論と哲学を要約する。
論文 参考訳(メタデータ) (2021-10-18T12:42:13Z) - Blind microscopy image denoising with a deep residual and multiscale
encoder/decoder network [0.0]
深層マルチスケール畳み込みエンコーダデコーダニューラルネットワークを提案する。
提案されたモデルは、PSNRの平均38.38、SSIMの0.98の57458画像セットに到達した。
論文 参考訳(メタデータ) (2021-05-01T14:54:57Z) - A Neuro-Inspired Autoencoding Defense Against Adversarial Perturbations [11.334887948796611]
ディープニューラルネットワーク(DNN)は敵の攻撃に対して脆弱である。
現在の最も効果的な防御策は、敵に摂動された例を使ってネットワークを訓練することである。
本稿では,神経に誘発される防御機構について検討する。
論文 参考訳(メタデータ) (2020-11-21T21:03:08Z) - Semantics-aware Adaptive Knowledge Distillation for Sensor-to-Vision
Action Recognition [131.6328804788164]
本稿では,視覚・センサ・モダリティ(動画)における行動認識を強化するためのフレームワーク,Semantics-Aware Adaptive Knowledge Distillation Networks (SAKDN)を提案する。
SAKDNは複数のウェアラブルセンサーを教師のモダリティとして使用し、RGB動画を学生のモダリティとして使用している。
論文 参考訳(メタデータ) (2020-09-01T03:38:31Z) - Learning to Learn to Compress [25.23586503813838]
画像圧縮のためのエンドツーエンドのメタ学習システムを提案する。
メタラーニングに基づく学習画像圧縮のための新しい訓練パラダイムを提案する。
論文 参考訳(メタデータ) (2020-07-31T13:13:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。