Fugu-MT 論文翻訳(概要): Sustainable Face Recognition on Low-Power Devices with VQ-VAE Embeddings

論文の概要: Sustainable Face Recognition on Low-Power Devices with VQ-VAE Embeddings

arxiv url: http://arxiv.org/abs/2606.15355v1
Date: Sat, 13 Jun 2026 15:38:10 GMT
ステータス: 翻訳完了
システム内更新日: 2026-06-16 16:21:33.448695
Title: Sustainable Face Recognition on Low-Power Devices with VQ-VAE Embeddings
Title（参考訳）: VQ-VAE埋め込みを用いた低消費電力デバイスにおけるサステナブル顔認識
Authors: Christos Chronis, Georgios Th. Papadopoulos, Iraklis Varlamis,
Abstract要約: 本研究は,Vector-Quantized Variational Autoencoders (VQ-VAE)に基づく,持続可能なエッジ展開可能な顔認識フレームワークを提案する。エッジ上のVQ-VAE埋め込みの圧縮キャパシティと再構成品質を活用することで,最先端の顔埋め込みモデルに匹敵する精度を実現する。
参考スコア（独自算出の注目度）: 1.0718144055666488
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Face recognition has become a cornerstone of modern AI applications, yet conventional approaches often rely on computationally intensive models deployed in cloud environments, leading to increased network traffic, high energy consumption, and a heavy carbon footprint. This work introduces a sustainable, edge-deployable face recognition framework based on Vector-Quantized Variational Autoencoders (VQ-VAE), which generates compact and semantically rich latent representations of facial images. By leveraging the compression capacity and reconstruction quality of VQ-VAE embeddings on the edge and combining them with the power of pre-trained face embeddings in a knowledge distillation setup, our system achieves comparable accuracy to state-of-the-art face embedding models while significantly reducing memory and computation requirements on the edge, making it suitable for low-power edge devices. The integration of VQ-VAE compression minimizes network overhead while keeping the matching accuracy high by retaining only the most informative facial features in the latent space. As a result, the reconstructed images preserve the key identity characteristics, improving the robustness and overall performance of the face embeddings.
Abstract（参考訳）: 顔認識は現代のAIアプリケーションの基盤となっているが、従来のアプローチでは、クラウド環境にデプロイされた計算集約的なモデルに依存しており、ネットワークトラフィックの増加、高エネルギー消費、炭素フットプリントの増大につながっている。本研究では,Vector-Quantized Variational Autoencoders (VQ-VAE)をベースとした,持続的かつエッジでデプロイ可能な顔認識フレームワークを提案する。エッジにVQ-VAE埋め込みの圧縮能力と復元品質を活用し、知識蒸留装置に予め訓練済みの顔埋め込みのパワーと組み合わせることで、最先端の顔埋め込みモデルに匹敵する精度を達成し、エッジ上でのメモリおよび計算要求を大幅に低減し、低消費電力エッジデバイスに適している。 VQ-VAE圧縮の統合は、潜在空間における最も情報性の高い顔の特徴のみを保持することにより、マッチング精度を高く保ちながら、ネットワークオーバーヘッドを最小限にする。その結果、再構成された画像は重要なアイデンティティ特性を保ち、顔埋め込みの堅牢性と全体的な性能を改善した。

関連論文リスト

Lightweight Cross-Spectral Face Recognition via Contrastive Alignment and Distillation [6.690084812573466]
Heterogeneous Face Recognition (HFR) は、異なる知覚モードで撮影された顔画像のマッチングを目的としている。本稿では,ハイブリッドCNN-Transformerモデルを適用することで,軽量かつ効果的なHFRフレームワークを提案する。提案手法は,少ないペアの異種データしか持たない効率的なエンドツーエンドトレーニングを実現する。
論文参考訳（メタデータ） (2026-05-06T11:16:08Z)
ATTN-FIQA: Interpretable Attention-based Face Image Quality Assessment with Vision Transformers [19.095360516976847]
顔画像品質評価(FIQA)は、顔サンプルの認識能力を評価することを目的としており、信頼性の高い顔認識(FR)システムに必須である。近年の研究では、これらのアーキテクチャは本質的に、空間的重要性を自然にコードする注意パターンを持つ有能な学習者として機能していることが強調されている。 ATTN-FIQAは,事前学習したビジョントランスフォーマーに基づく顔認識モデルから得られたソフトマックス前注目スコアが品質指標として機能するかどうかを調査する,新しいトレーニングフリーアプローチである。
論文参考訳（メタデータ） (2026-04-21T12:46:16Z)
FACE: A Face-based Autoregressive Representation for High-Fidelity and Efficient Mesh Generation [50.71369329585773]
フェースレベルでメッシュを生成する新しいAutoregressive AutoencoderフレームワークであるFACEを紹介する。当社のワンフェイスワンツーケン戦略は、メッシュの基本構築ブロックである三角形の面を、単一の統一トークンとして扱います。 FACEは、標準ベンチマークで最先端の再構築品質を達成する。
論文参考訳（メタデータ） (2026-03-02T06:47:15Z)
Frequency-Aware Autoregressive Modeling for Efficient High-Resolution Image Synthesis [40.93077975823353]
視覚的自己回帰モデリングは、次のスケールの予測パラダイムに基づいており、画像の品質とモデルのスケーラビリティにおいて顕著な優位性を示している。しかし、高解像度の段階での計算オーバーヘッドは、相当数のトークンが関与しているため、依然として重要な課題である。 Sparsevarは、次世代の予測のためのプラグイン・アンド・プレイ・アクセラレーション・フレームワークで、追加のトレーニングを必要とせず、推論中に低周波トークンを動的に排除する。
論文参考訳（メタデータ） (2025-07-28T01:13:24Z)
EyeSim-VQA: A Free-Energy-Guided Eye Simulation Framework for Video Quality Assessment [68.77813885751308]
EyeSimVQAは、自由エネルギーベースの自己修復を取り入れた新しいVQAフレームワークである。現状の手法と比較して,EyeSimVQAは競争力や性能に優れることを示す。
論文参考訳（メタデータ） (2025-06-13T08:00:54Z)
Enhancing Variational Autoencoders with Smooth Robust Latent Encoding [54.74721202894622]
変分オートエンコーダ(VAE)は拡散に基づく生成モデルをスケールアップする上で重要な役割を果たしている。 Smooth Robust Latent VAEは、世代品質とロバスト性の両方を向上する、新しい対向トレーニングフレームワークである。実験により、SRL-VAEは、Nightshade攻撃や画像編集攻撃に対して、画像再構成とテキスト誘導画像編集において、生成品質とロバスト性の両方を改善することが示された。
論文参考訳（メタデータ） (2025-04-24T03:17:57Z)
IQPFR: An Image Quality Prior for Blind Face Restoration and Beyond [56.99331967165238]
Blind Face Restoration (BFR)は、劣化した低品質(LQ)の顔画像を高品質(HQ)の出力に再構成する課題に対処する。本研究では,非参照画像品質評価(NR-IQA)モデルから得られた画像品質優先(IQP)を組み込んだ新しいフレームワークを提案する。提案手法は,複数のベンチマークにおいて最先端技術より優れている。
論文参考訳（メタデータ） (2025-03-12T11:39:51Z)
CLR-Face: Conditional Latent Refinement for Blind Face Restoration Using Score-Based Diffusion Models [57.9771859175664]
最近の生成優先法は、有望なブラインドフェイス修復性能を示している。入力に忠実なきめ細かい顔の詳細を生成することは、依然として難しい問題である。本稿では,VQGANアーキテクチャの内部に拡散型プライマーを導入し,非破壊な潜伏埋め込みにおける分布の学習に重点を置いている。
論文参考訳（メタデータ） (2024-02-08T23:51:49Z)
Hierarchical Quantized Autoencoders [3.9146761527401432]
本稿では,Vector Quantized Variencoders (VQ-VAEs) の階層構造を用いて,高い圧縮係数を求める。量子化と階層的潜在構造の組み合わせは、確率に基づく画像圧縮に役立つことを示す。得られたスキームは、高い知覚品質の画像を再構成するマルコフ変数の列を生成する。
論文参考訳（メタデータ） (2020-02-19T11:26:34Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。