論文の概要: Towards Analysis-friendly Face Representation with Scalable Feature and
Texture Compression
- arxiv url: http://arxiv.org/abs/2004.10043v2
- Date: Mon, 19 Apr 2021 16:40:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-11 07:33:28.640242
- Title: Towards Analysis-friendly Face Representation with Scalable Feature and
Texture Compression
- Title(参考訳): スケーラブルな特徴とテクスチャ圧縮を用いた分析フレンドリーな顔表現に向けて
- Authors: Shurun Wang, Shiqi Wang, Wenhan Yang, Xinfeng Zhang, Shanshe Wang,
Siwei Ma, Wen Gao
- Abstract要約: 普遍的で協調的な視覚情報表現は階層的な方法で実現できることを示す。
ディープニューラルネットワークの強力な生成能力に基づいて、基本特徴層と強化層の間のギャップは、特徴レベルのテクスチャ再構築によってさらに埋められる。
提案するフレームワークの効率を改善するために,ベース層ニューラルネットワークをマルチタスクでトレーニングする。
- 参考スコア(独自算出の注目度): 113.30411004622508
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: It plays a fundamental role to compactly represent the visual information
towards the optimization of the ultimate utility in myriad visual data centered
applications. With numerous approaches proposed to efficiently compress the
texture and visual features serving human visual perception and machine
intelligence respectively, much less work has been dedicated to studying the
interactions between them. Here we investigate the integration of feature and
texture compression, and show that a universal and collaborative visual
information representation can be achieved in a hierarchical way. In
particular, we study the feature and texture compression in a scalable coding
framework, where the base layer serves as the deep learning feature and
enhancement layer targets to perfectly reconstruct the texture. Based on the
strong generative capability of deep neural networks, the gap between the base
feature layer and enhancement layer is further filled with the feature level
texture reconstruction, aiming to further construct texture representation from
feature. As such, the residuals between the original and reconstructed texture
could be further conveyed in the enhancement layer. To improve the efficiency
of the proposed framework, the base layer neural network is trained in a
multi-task manner such that the learned features enjoy both high quality
reconstruction and high accuracy analysis. We further demonstrate the framework
and optimization strategies in face image compression, and promising coding
performance has been achieved in terms of both rate-fidelity and rate-accuracy.
- Abstract(参考訳): 無数のビジュアルデータセンタアプリケーションにおける究極のユーティリティの最適化に向けて、視覚情報をコンパクトに表現する基本的な役割を担っている。
人間の視覚知覚と機械知に寄与するテクスチャと視覚的特徴を効率的に圧縮するための多くのアプローチが提案されており、それら間の相互作用を研究するための作業は少なくなっている。
本稿では,特徴とテクスチャの圧縮の統合について検討し,階層的手法で普遍的かつ協調的な視覚情報表現を実現することができることを示す。
特に,その特徴とテクスチャの圧縮をスケーラブルな符号化フレームワークで検討し,基礎層がディープラーニング機能および拡張層ターゲットとして機能し,テクスチャを完璧に再構築する。
ディープニューラルネットワークの強力な生成能力に基づき、基本特徴層と強調層との間のギャップは、特徴からテクスチャ表現をさらに構築するために、特徴レベルのテクスチャ再構成によってさらに埋められる。
これにより、元のテクスチャと再構成されたテクスチャの間の残余をさらにエンハンスメント層に搬送することができる。
提案フレームワークの効率を向上させるために,ベース層ニューラルネットワークをマルチタスクで訓練し,学習した特徴を高品質な再構成と高精度解析の両方を享受する。
さらに,顔画像圧縮におけるフレームワークと最適化戦略を実証し,レート忠実度とレート精度の両面で有望な符号化性能を実現した。
関連論文リスト
- Toward Scalable Image Feature Compression: A Content-Adaptive and Diffusion-Based Approach [44.03561901593423]
本稿では,スケーラブルな画像圧縮のためのコンテンツ適応拡散モデルを提案する。
提案手法は拡散過程を通じて微細なテクスチャを符号化し,知覚品質を向上する。
画像再構成および下流マシンビジョンタスクにおいて,提案手法の有効性を示す実験を行った。
論文 参考訳(メタデータ) (2024-10-08T15:48:34Z) - Texture-guided Coding for Deep Features [33.05814372247946]
本稿では,特徴とテクスチャを考察し,その特徴に基づくテクスチャ誘導型特徴圧縮戦略を提案する。
この戦略は、特徴層とテクスチャ層から構成されており、特徴層は、特徴選択モジュールと特徴再構成ネットワークを含む、マシンを提供する。
テクスチャ画像の助けを借りて、視覚的なタスクに関連するチャンネルを選択的に圧縮し、送信し、特徴データを低減し、マシンに高品質な機能を提供する。
本手法は,テクスチャの特徴と特徴をフル活用し,特徴冗長性を排除し,人間の高品質なプレビュー画像を再構成し,意思決定を支援する。
論文 参考訳(メタデータ) (2024-05-30T03:38:44Z) - ENTED: Enhanced Neural Texture Extraction and Distribution for
Reference-based Blind Face Restoration [51.205673783866146]
我々は,高品質でリアルな肖像画を復元することを目的とした,ブラインドフェイス修復のための新しいフレームワークであるENTEDを提案する。
劣化した入力画像と参照画像の間で高品質なテクスチャ特徴を伝達するために,テクスチャ抽出と分布の枠組みを利用する。
われわれのフレームワークにおけるStyleGANのようなアーキテクチャは、現実的な画像を生成するために高品質な潜伏符号を必要とする。
論文 参考訳(メタデータ) (2024-01-13T04:54:59Z) - Semantic-aware Texture-Structure Feature Collaboration for Underwater
Image Enhancement [58.075720488942125]
水中画像の強調は海洋工学や水生ロボット工学において重要な技術として注目されている。
我々は,高レベルな意味認識事前学習モデルと協調して,効率的でコンパクトな拡張ネットワークを開発する。
また,提案手法を水中の有意な物体検出タスクに適用し,高レベルの視覚タスクに適した意味認識能力を明らかにする。
論文 参考訳(メタデータ) (2022-11-19T07:50:34Z) - Video Coding for Machine: Compact Visual Representation Compression for
Intelligent Collaborative Analytics [101.35754364753409]
Video Coding for Machines (VCM) は、ビデオ/画像圧縮と特徴圧縮をある程度別々の研究トラックにブリッジすることを約束している。
本稿では,既存の学術・産業活動に基づくVCM方法論と哲学を要約する。
論文 参考訳(メタデータ) (2021-10-18T12:42:13Z) - Conceptual Compression via Deep Structure and Texture Synthesis [42.68994438290913]
本稿では,視覚データをコンパクトな構造とテクスチャ表現にエンコードし,深層合成方式でデコードする,新しい概念圧縮フレームワークを提案する。
特に,2つの相補的な視覚特徴からなる二重層モデルを用いて画像の圧縮を提案する。
エンコーダ側では、構造地図とテクスチャ表現を個別に抽出して圧縮し、コンパクトで解釈可能な、相互運用可能なビットストリームを生成する。
復号段階では, 階層的融合GAN (HF-GAN) が提案され, テクスチャがデコードされた構造写像に描画される合成パラダイムを学習し, 高品質な再構成を実現する。
論文 参考訳(メタデータ) (2020-11-10T08:48:32Z) - Region-adaptive Texture Enhancement for Detailed Person Image Synthesis [86.69934638569815]
RATE-Netは、シャープなテクスチャで人物画像を合成するための新しいフレームワークである。
提案するフレームワークは,テクスチャ強化モジュールを利用して,画像から外観情報を抽出する。
DeepFashionベンチマークデータセットで実施された実験は、既存のネットワークと比較して、我々のフレームワークの優位性を実証した。
論文 参考訳(メタデータ) (2020-05-26T02:33:21Z) - End-to-End Facial Deep Learning Feature Compression with Teacher-Student
Enhancement [57.18801093608717]
本稿では,ディープニューラルネットワークの表現と学習能力を活用することで,エンドツーエンドの特徴圧縮手法を提案する。
特に、抽出した特徴量を、レート歪みコストを最適化することにより、エンドツーエンドでコンパクトに符号化する。
提案モデルの有効性を顔の特徴で検証し, 圧縮性能を高いレート精度で評価した。
論文 参考訳(メタデータ) (2020-02-10T10:08:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。