論文の概要: Quantum Down Sampling Filter for Variational Auto-encoder
- arxiv url: http://arxiv.org/abs/2501.06259v3
- Date: Thu, 06 Mar 2025 23:10:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-10 15:56:13.106333
- Title: Quantum Down Sampling Filter for Variational Auto-encoder
- Title(参考訳): 変分オートエンコーダ用量子ダウンサンプリングフィルタ
- Authors: Farina Riaz, Fakhar Zaman, Hajime Suzuki, Sharif Abuadbba, David Nguyen,
- Abstract要約: 変分オートエンコーダ(VAE)は、生成モデリングと画像再構成の基礎となる。
本研究では,量子変分オートエンコーダ(Q-VAE)のハイブリッドモデルを提案する。
Q-VAEはエンコーダに量子符号化を統合し、完全に接続された層を利用して意味のある表現を抽出する。
- 参考スコア(独自算出の注目度): 0.504868948270058
- License:
- Abstract: Variational autoencoders (VAEs) are fundamental for generative modeling and image reconstruction, yet their performance often struggles to maintain high fidelity in reconstructions. This study introduces a hybrid model, quantum variational autoencoder (Q-VAE), which integrates quantum encoding within the encoder while utilizing fully connected layers to extract meaningful representations. The decoder uses transposed convolution layers for up-sampling. The Q-VAE is evaluated against the classical VAE and the classical direct-passing VAE, which utilizes windowed pooling filters. Results on the MNIST and USPS datasets demonstrate that Q-VAE consistently outperforms classical approaches, achieving lower Fr\'echet inception distance scores, thereby indicating superior image fidelity and enhanced reconstruction quality. These findings highlight the potential of Q-VAE for high-quality synthetic data generation and improved image reconstruction in generative models.
- Abstract(参考訳): 可変オートエンコーダ(VAE)は、生成モデリングと画像再構成に基本的であるが、その性能は、しばしば再構成における高い忠実性を維持するのに苦労する。
本研究では,完全連結層を利用して有意義な表現を抽出しながら,エンコーダ内に量子符号化を統合するハイブリッドモデルQ-VAEを提案する。
デコーダはアップサンプリングに変換畳み込み層を使用する。
Q-VAEは、窓付きプールフィルタを用いた古典的VAEおよび古典的直接通過VAEに対して評価される。
MNISTおよびUSPSデータセットの結果、Q-VAEは古典的アプローチを一貫して上回り、Fr'echet開始距離スコアが低くなり、画像の忠実度が向上し、再構成品質が向上することを示した。
これらの結果は、高品質な合成データ生成のためのQ-VAEの可能性を強調し、生成モデルにおける画像再構成を改善した。
関連論文リスト
- Efficient Visual State Space Model for Image Deblurring [83.57239834238035]
畳み込みニューラルネットワーク(CNN)とビジョントランスフォーマー(ViT)は、画像復元において優れた性能を発揮している。
本稿では,画像のデブロアに対する簡易かつ効果的な視覚状態空間モデル(EVSSM)を提案する。
論文 参考訳(メタデータ) (2024-05-23T09:13:36Z) - Contrastive Pre-Training with Multi-View Fusion for No-Reference Point Cloud Quality Assessment [49.36799270585947]
No-Reference Point Cloud Quality Assessment (NR-PCQA) は、歪んだ点雲の知覚的品質を、参照なしで自動的に評価することを目的としている。
我々は,PCQA(CoPA)に適した新しいコントラスト付き事前学習フレームワークを提案する。
提案手法は,最新のPCQA手法よりも高い性能を示す。
論文 参考訳(メタデータ) (2024-03-15T07:16:07Z) - Enhancing a Convolutional Autoencoder with a Quantum Approximate
Optimization Algorithm for Image Noise Reduction [0.0]
多くの畳み込みオートエンコーダアルゴリズムは、画像の復調に有効であることが証明されている。
本研究では,QCAE(Quantum Convolutional Autoencoder)法を提案する。
論文 参考訳(メタデータ) (2024-01-12T04:35:55Z) - ConvNeXt-ChARM: ConvNeXt-based Transform for Efficient Neural Image
Compression [18.05997169440533]
ConvNeXt-ChARMは,効率的なConvNeXtベースのトランスフォーメーションコーディングフレームワークである。
ConvNeXt-ChARMは、VVC参照エンコーダ(VTM-18.0)と最先端の学習画像圧縮手法であるSwinT-ChARMに対して、平均5.24%と1.22%と、一貫したBDレート(PSNR)の低下をもたらすことを示した。
論文 参考訳(メタデータ) (2023-07-12T11:45:54Z) - Joint Hierarchical Priors and Adaptive Spatial Resolution for Efficient
Neural Image Compression [11.25130799452367]
ニューラル画像圧縮(NIC)のための絶対画像圧縮変換器(ICT)を提案する。
ICTは、潜在表現からグローバルコンテキストとローカルコンテキストの両方をキャプチャし、量子化された潜在表現の分布をパラメータ化する。
我々のフレームワークは、多目的ビデオ符号化(VVC)参照符号化(VTM-18.0)とニューラルスウィンT-ChARMに対する符号化効率とデコーダ複雑性のトレードオフを大幅に改善する。
論文 参考訳(メタデータ) (2023-07-05T13:17:14Z) - Exploring Resolution and Degradation Clues as Self-supervised Signal for
Low Quality Object Detection [77.3530907443279]
劣化した低解像度画像中の物体を検出するための,新しい自己教師型フレームワークを提案する。
本手法は, 既存手法と比較して, 異変劣化状況に直面する場合に比べ, 優れた性能を示した。
論文 参考訳(メタデータ) (2022-08-05T09:36:13Z) - Neural Data-Dependent Transform for Learned Image Compression [72.86505042102155]
ニューラルデータに依存した変換を構築し,各画像の符号化効率を最適化する連続オンラインモード決定機構を導入する。
実験の結果,提案したニューラルシンタクス設計と連続オンラインモード決定機構の有効性が示された。
論文 参考訳(メタデータ) (2022-03-09T14:56:48Z) - Patch Similarity Aware Data-Free Quantization for Vision Transformers [2.954890575035673]
Patch similarity Aware data-free Quantization framework for Vision Transformersを提案する。
本研究では,ガウス雑音と実画像の処理において,自己アテンションモジュールの特性を解析し,一般的な相違点(パッチ類似点)を明らかにする。
PSAQ-ViTの有効性を検証するため,様々なベンチマークで実験およびアブレーション実験を行った。
論文 参考訳(メタデータ) (2022-03-04T11:47:20Z) - Neural JPEG: End-to-End Image Compression Leveraging a Standard JPEG
Encoder-Decoder [73.48927855855219]
本稿では,エンコーダとデコーダの両端に内在するニューラル表現を強化することで,符号化性能の向上を図るシステムを提案する。
実験により,提案手法はJPEGに対する速度歪み性能を,様々な品質指標で改善することを示した。
論文 参考訳(メタデータ) (2022-01-27T20:20:03Z) - NVAE: A Deep Hierarchical Variational Autoencoder [102.29977384039805]
本稿では,深度ワイド分離可能な畳み込みとバッチ正規化を用いた画像生成のための階層型VAEを提案する。
NVAEは非自己回帰的確率ベースモデルにおいて最先端の結果が得られることを示す。
我々の知る限りでは、NVAEは256$times $256ピクセルの自然画像に適用された最初のVAEである。
論文 参考訳(メタデータ) (2020-07-08T04:56:56Z) - Neuromorphologicaly-preserving Volumetric data encoding using VQ-VAE [4.221619479687068]
VQ-VAEにインスパイアされたネットワークは、全解像度の3D脳の容積を効率よくエンコードし、画像の忠実さを維持しながら元のサイズの0.825%$に圧縮できることを示す。
次に、VQ-VAEデコードされた画像は、ボクセルに基づく形態学およびセグメンテーション実験により、元のデータの形態的特性を保っていることを示す。
論文 参考訳(メタデータ) (2020-02-13T18:18:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。