論文の概要: End-to-End Facial Deep Learning Feature Compression with Teacher-Student
Enhancement
- arxiv url: http://arxiv.org/abs/2002.03627v1
- Date: Mon, 10 Feb 2020 10:08:44 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-02 09:28:43.076014
- Title: End-to-End Facial Deep Learning Feature Compression with Teacher-Student
Enhancement
- Title(参考訳): 教師の指導力向上による顔面深層学習の特徴圧縮
- Authors: Shurun Wang, Wenhan Yang, Shiqi Wang
- Abstract要約: 本稿では,ディープニューラルネットワークの表現と学習能力を活用することで,エンドツーエンドの特徴圧縮手法を提案する。
特に、抽出した特徴量を、レート歪みコストを最適化することにより、エンドツーエンドでコンパクトに符号化する。
提案モデルの有効性を顔の特徴で検証し, 圧縮性能を高いレート精度で評価した。
- 参考スコア(独自算出の注目度): 57.18801093608717
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we propose a novel end-to-end feature compression scheme by
leveraging the representation and learning capability of deep neural networks,
towards intelligent front-end equipped analysis with promising accuracy and
efficiency. In particular, the extracted features are compactly coded in an
end-to-end manner by optimizing the rate-distortion cost to achieve
feature-in-feature representation. In order to further improve the compression
performance, we present a latent code level teacher-student enhancement model,
which could efficiently transfer the low bit-rate representation into a high
bit rate one. Such a strategy further allows us to adaptively shift the
representation cost to decoding computations, leading to more flexible feature
compression with enhanced decoding capability. We verify the effectiveness of
the proposed model with the facial feature, and experimental results reveal
better compression performance in terms of rate-accuracy compared with existing
models.
- Abstract(参考訳): 本稿では,ディープニューラルネットワークの表現能力と学習能力を活用して,精度と効率を期待できるインテリジェントなフロントエンド機器分析を行う新しいエンドツーエンド特徴圧縮方式を提案する。
特に、レート歪みコストを最適化して特徴量表現を達成することで、抽出された特徴をエンドツーエンドでコンパクトに符号化する。
圧縮性能をさらに向上させるため,低ビットレート表現を高ビットレート表現に効率的に転送できる潜在コードレベルの教師・学生エンハンスメントモデルを提案する。
このような戦略により、表現コストをデコードに適応的にシフトさせ、デコード機能を強化したより柔軟な特徴圧縮を実現することができる。
提案モデルの有効性を顔特徴量で検証し, 既存のモデルと比較して圧縮性能が良好であることを実験的に明らかにした。
関連論文リスト
- Multi-Scale Feature Prediction with Auxiliary-Info for Neural Image Compression [13.076563599765176]
本稿では,ニューラルビデオ圧縮にインスパイアされた補助粗いネットワークと主ネットワークからなる新しい予測構造を導入する。
我々のモデルは、他のニューラル画像圧縮モデルより優れており、Tecnickデータセット上のVVCよりも19.49%高い速度歪み性能を実現している。
論文 参考訳(メタデータ) (2024-09-19T12:41:53Z) - Joint Hierarchical Priors and Adaptive Spatial Resolution for Efficient
Neural Image Compression [11.25130799452367]
ニューラル画像圧縮(NIC)のための絶対画像圧縮変換器(ICT)を提案する。
ICTは、潜在表現からグローバルコンテキストとローカルコンテキストの両方をキャプチャし、量子化された潜在表現の分布をパラメータ化する。
我々のフレームワークは、多目的ビデオ符号化(VVC)参照符号化(VTM-18.0)とニューラルスウィンT-ChARMに対する符号化効率とデコーダ複雑性のトレードオフを大幅に改善する。
論文 参考訳(メタデータ) (2023-07-05T13:17:14Z) - Learning Accurate Performance Predictors for Ultrafast Automated Model
Compression [86.22294249097203]
フレキシブルネットワーク展開のための超高速自動モデル圧縮フレームワークSeerNetを提案する。
本手法は,探索コストを大幅に削減した競合精度・複雑度トレードオフを実現する。
論文 参考訳(メタデータ) (2023-04-13T10:52:49Z) - LVQAC: Lattice Vector Quantization Coupled with Spatially Adaptive
Companding for Efficient Learned Image Compression [24.812267280543693]
本稿では,空間適応型コンパウンディング(LVQAC)マッピングを併用した新しい格子ベクトル量子化方式を提案する。
エンドツーエンドのCNN画像圧縮モデルでは、一様量子化器をLVQACで置き換えることにより、モデルの複雑さを大幅に増大させることなく、より優れたレート歪み性能が得られる。
論文 参考訳(メタデータ) (2023-03-25T23:34:15Z) - Estimating the Resize Parameter in End-to-end Learned Image Compression [50.20567320015102]
本稿では,最近の画像圧縮モデルの速度歪みトレードオフをさらに改善する検索自由化フレームワークについて述べる。
提案手法により,Bjontegaard-Deltaレート(BD-rate)を最大10%向上させることができる。
論文 参考訳(メタデータ) (2022-04-26T01:35:02Z) - Video Coding for Machine: Compact Visual Representation Compression for
Intelligent Collaborative Analytics [101.35754364753409]
Video Coding for Machines (VCM) は、ビデオ/画像圧縮と特徴圧縮をある程度別々の研究トラックにブリッジすることを約束している。
本稿では,既存の学術・産業活動に基づくVCM方法論と哲学を要約する。
論文 参考訳(メタデータ) (2021-10-18T12:42:13Z) - End-to-end Compression Towards Machine Vision: Network Architecture
Design and Optimization [21.64194147628761]
ネットワークアーキテクチャの設計と最適化により,マシンビジョンへの圧縮がさらに改善されることが示されている。
本稿では,機械ビジョンに対するエンドツーエンド圧縮のための逆ボトルネック構造を提案する。
提案手法は,解析性能の観点から,BDレートの大幅な削減を実現していることを示す。
論文 参考訳(メタデータ) (2021-07-01T09:36:32Z) - Towards Analysis-friendly Face Representation with Scalable Feature and
Texture Compression [113.30411004622508]
普遍的で協調的な視覚情報表現は階層的な方法で実現できることを示す。
ディープニューラルネットワークの強力な生成能力に基づいて、基本特徴層と強化層の間のギャップは、特徴レベルのテクスチャ再構築によってさらに埋められる。
提案するフレームワークの効率を改善するために,ベース層ニューラルネットワークをマルチタスクでトレーニングする。
論文 参考訳(メタデータ) (2020-04-21T14:32:49Z) - Structured Sparsification with Joint Optimization of Group Convolution
and Channel Shuffle [117.95823660228537]
本稿では,効率的なネットワーク圧縮のための新しい構造空間分割法を提案する。
提案手法は, 畳み込み重みに対する構造的疎度を自動的に誘導する。
また,学習可能なチャネルシャッフル機構によるグループ間通信の問題にも対処する。
論文 参考訳(メタデータ) (2020-02-19T12:03:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。