論文の概要: Quantum Down Sampling Filter for Variational Auto-encoder
- arxiv url: http://arxiv.org/abs/2501.06259v2
- Date: Thu, 30 Jan 2025 00:31:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-31 15:12:04.571727
- Title: Quantum Down Sampling Filter for Variational Auto-encoder
- Title(参考訳): 変分オートエンコーダ用量子ダウンサンプリングフィルタ
- Authors: Farina Riaz, Fakhar Zaman, Hajime Suzuki, Sharif Abuadbba, David Nguyen,
- Abstract要約: 変分オートエンコーダ(VAE)は、生成モデリングと画像再構成に不可欠なツールである。
本研究は, 画像の解像度を向上し, 細部を保存することにより, 画像の画質を向上させることを目的とする。
本稿では,VAEエンコーダの量子コンピューティング技術とデコーダの畳み込みニューラルネットワーク(CNN)を組み合わせたハイブリッドモデルを提案する。
- 参考スコア(独自算出の注目度): 0.504868948270058
- License:
- Abstract: Variational Autoencoders (VAEs) are essential tools in generative modeling and image reconstruction, with their performance heavily influenced by the encoder-decoder architecture. This study aims to improve the quality of reconstructed images by enhancing their resolution and preserving finer details, particularly when working with low-resolution inputs (16x16 pixels), where traditional VAEs often yield blurred or in-accurate results. To address this, we propose a hybrid model that combines quantum computing techniques in the VAE encoder with convolutional neural networks (CNNs) in the decoder. By upscaling the resolution from 16x16 to 32x32 during the encoding process, our approach evaluates how the model reconstructs images with enhanced resolution while maintaining key features and structures. This method tests the model's robustness in handling image reconstruction and its ability to preserve essential details despite training on lower-resolution data. We evaluate our proposed down sampling filter for Quantum VAE (Q-VAE) on the MNIST and USPS datasets and compare it with classical VAEs and a variant called Classical Direct Passing VAE (CDP-VAE), which uses windowing pooling filters in the encoding process. Performance is assessed using metrics such as the Frechet Inception Distance (FID) and Mean Squared Error (MSE), which measure the fidelity of reconstructed images. Our results demonstrate that the Q-VAE consistently outperforms both the Classical VAE and CDP-VAE, achieving significantly lower FID and MSE scores. Additionally, CDP-VAE yields better performance than C-VAE. These findings highlight the potential of quantum-enhanced VAEs to improve image reconstruction quality by enhancing resolution and preserving essential features, offering a promising direction for future applications in computer vision and synthetic data generation.
- Abstract(参考訳): 変分オートエンコーダ(VAE)は、生成モデリングや画像再構成において必須のツールであり、その性能はエンコーダ・デコーダアーキテクチャに大きく影響されている。
本研究の目的は,低解像度入力(16×16ピクセル)で作業する場合,特に従来のVAEがぼやけた結果や不正確な結果を得る場合において,解像度を向上し,細かな情報を保存することにより,再構成画像の品質を向上させることである。
そこで本研究では,VAEエンコーダの量子コンピューティング技術とデコーダの畳み込みニューラルネットワーク(CNN)を組み合わせたハイブリッドモデルを提案する。
符号化処理中に解像度を16x16から32x32にアップスケールすることにより、重要な特徴や構造を維持しながら解像度を向上した画像の再構成方法を評価する。
本手法は,低解像度データのトレーニングにもかかわらず,画像再構成処理におけるモデルの頑健さと重要な詳細性を維持する能力をテストする。
我々は、MNISTおよびUSPSデータセット上の量子VAE(Q-VAE)のダウンサンプリングフィルタを評価し、それを古典的なVAEと、符号化プロセスにおけるウィンドウリングプーリングフィルタを用いたCDP-VAE(Classical Direct Passing VAE)と呼ばれる変種と比較した。
Frechet Inception Distance (FID) や Mean Squared Error (MSE) といった、再構成画像の忠実度を測定するメトリクスを用いて、パフォーマンスを評価する。
以上の結果から,Q-VAEは古典的VAEとCDP-VAEのどちらよりも一貫して優れており,FIDとMSEのスコアは著しく低いことがわかった。
さらに、CDP-VAEはC-VAEよりも優れた性能が得られる。
これらの知見は、解像度を向上し、重要な特徴を保ち、コンピュータビジョンや合成データ生成における将来の応用に期待できる方向を提供することにより、画像再構成品質を向上させるための量子強化型VAEの可能性を強調している。
関連論文リスト
- Efficient Visual State Space Model for Image Deblurring [83.57239834238035]
畳み込みニューラルネットワーク(CNN)とビジョントランスフォーマー(ViT)は、画像復元において優れた性能を発揮している。
本稿では,画像のデブロアに対する簡易かつ効果的な視覚状態空間モデル(EVSSM)を提案する。
論文 参考訳(メタデータ) (2024-05-23T09:13:36Z) - Contrastive Pre-Training with Multi-View Fusion for No-Reference Point Cloud Quality Assessment [49.36799270585947]
No-Reference Point Cloud Quality Assessment (NR-PCQA) は、歪んだ点雲の知覚的品質を、参照なしで自動的に評価することを目的としている。
我々は,PCQA(CoPA)に適した新しいコントラスト付き事前学習フレームワークを提案する。
提案手法は,最新のPCQA手法よりも高い性能を示す。
論文 参考訳(メタデータ) (2024-03-15T07:16:07Z) - Enhancing a Convolutional Autoencoder with a Quantum Approximate
Optimization Algorithm for Image Noise Reduction [0.0]
多くの畳み込みオートエンコーダアルゴリズムは、画像の復調に有効であることが証明されている。
本研究では,QCAE(Quantum Convolutional Autoencoder)法を提案する。
論文 参考訳(メタデータ) (2024-01-12T04:35:55Z) - ConvNeXt-ChARM: ConvNeXt-based Transform for Efficient Neural Image
Compression [18.05997169440533]
ConvNeXt-ChARMは,効率的なConvNeXtベースのトランスフォーメーションコーディングフレームワークである。
ConvNeXt-ChARMは、VVC参照エンコーダ(VTM-18.0)と最先端の学習画像圧縮手法であるSwinT-ChARMに対して、平均5.24%と1.22%と、一貫したBDレート(PSNR)の低下をもたらすことを示した。
論文 参考訳(メタデータ) (2023-07-12T11:45:54Z) - Joint Hierarchical Priors and Adaptive Spatial Resolution for Efficient
Neural Image Compression [11.25130799452367]
ニューラル画像圧縮(NIC)のための絶対画像圧縮変換器(ICT)を提案する。
ICTは、潜在表現からグローバルコンテキストとローカルコンテキストの両方をキャプチャし、量子化された潜在表現の分布をパラメータ化する。
我々のフレームワークは、多目的ビデオ符号化(VVC)参照符号化(VTM-18.0)とニューラルスウィンT-ChARMに対する符号化効率とデコーダ複雑性のトレードオフを大幅に改善する。
論文 参考訳(メタデータ) (2023-07-05T13:17:14Z) - Exploring Resolution and Degradation Clues as Self-supervised Signal for
Low Quality Object Detection [77.3530907443279]
劣化した低解像度画像中の物体を検出するための,新しい自己教師型フレームワークを提案する。
本手法は, 既存手法と比較して, 異変劣化状況に直面する場合に比べ, 優れた性能を示した。
論文 参考訳(メタデータ) (2022-08-05T09:36:13Z) - Neural Data-Dependent Transform for Learned Image Compression [72.86505042102155]
ニューラルデータに依存した変換を構築し,各画像の符号化効率を最適化する連続オンラインモード決定機構を導入する。
実験の結果,提案したニューラルシンタクス設計と連続オンラインモード決定機構の有効性が示された。
論文 参考訳(メタデータ) (2022-03-09T14:56:48Z) - Patch Similarity Aware Data-Free Quantization for Vision Transformers [2.954890575035673]
Patch similarity Aware data-free Quantization framework for Vision Transformersを提案する。
本研究では,ガウス雑音と実画像の処理において,自己アテンションモジュールの特性を解析し,一般的な相違点(パッチ類似点)を明らかにする。
PSAQ-ViTの有効性を検証するため,様々なベンチマークで実験およびアブレーション実験を行った。
論文 参考訳(メタデータ) (2022-03-04T11:47:20Z) - Neural JPEG: End-to-End Image Compression Leveraging a Standard JPEG
Encoder-Decoder [73.48927855855219]
本稿では,エンコーダとデコーダの両端に内在するニューラル表現を強化することで,符号化性能の向上を図るシステムを提案する。
実験により,提案手法はJPEGに対する速度歪み性能を,様々な品質指標で改善することを示した。
論文 参考訳(メタデータ) (2022-01-27T20:20:03Z) - NVAE: A Deep Hierarchical Variational Autoencoder [102.29977384039805]
本稿では,深度ワイド分離可能な畳み込みとバッチ正規化を用いた画像生成のための階層型VAEを提案する。
NVAEは非自己回帰的確率ベースモデルにおいて最先端の結果が得られることを示す。
我々の知る限りでは、NVAEは256$times $256ピクセルの自然画像に適用された最初のVAEである。
論文 参考訳(メタデータ) (2020-07-08T04:56:56Z) - Neuromorphologicaly-preserving Volumetric data encoding using VQ-VAE [4.221619479687068]
VQ-VAEにインスパイアされたネットワークは、全解像度の3D脳の容積を効率よくエンコードし、画像の忠実さを維持しながら元のサイズの0.825%$に圧縮できることを示す。
次に、VQ-VAEデコードされた画像は、ボクセルに基づく形態学およびセグメンテーション実験により、元のデータの形態的特性を保っていることを示す。
論文 参考訳(メタデータ) (2020-02-13T18:18:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。