論文の概要: Implementation of Quantum Implicit Neural Representation in Deterministic and Probabilistic Autoencoders for Image Reconstruction/Generation Tasks
- arxiv url: http://arxiv.org/abs/2603.06755v1
- Date: Fri, 06 Mar 2026 13:10:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-10 15:13:13.086743
- Title: Implementation of Quantum Implicit Neural Representation in Deterministic and Probabilistic Autoencoders for Image Reconstruction/Generation Tasks
- Title(参考訳): 画像再構成・生成タスクのための決定論的・確率的オートエンコーダにおける量子暗黙的ニューラル表現の実装
- Authors: Saadet Müzehher Eren,
- Abstract要約: 本稿では,量子暗黙的ニューラル表現(QINR)に基づくオートエンコーダ(AE)と可変オートエンコーダ(VAE)を提案する。
我々の目的は、VAEとAEのQINRが潜伏空間から高度にリッチで周期的で高周波な特徴へと情報を変換できることを実証することである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a quantum implicit neural representation (QINR)-based autoencoder (AE) and variational autoencoder (VAE) for image reconstruction and generation tasks. Our purpose is to demonstrate that the QINR in VAEs and AEs can transform information from the latent space into highly rich, periodic, and high-frequency features. Additionally, we aim to show that the QINR-VAE can be more stable than various quantum generative adversarial network (QGAN) models in image generation because it can address the low diversity problem. Our quantum-classical hybrid models consist of a classical convolutional neural network (CNN) encoder and a quantum-based QINR decoder. We train the QINR-AE/VAE with binary cross-entropy with logits (BCEWithLogits) as the reconstruction loss. For the QINR-VAE, we additionally employ Kullback-Leibler divergence for latent regularization with beta/capacity scheduling to prevent posterior collapse. We introduce learnable angle-scaling in data reuploading to address optimization challenges. We test our models on the MNIST, E-MNIST, and Fashion-MNIST datasets to reconstruct and generate images. Our results demonstrate that the QINR structure in VAE can produce a wider variety of images with a small amount of data than various generative models that have been studied. We observe that the generated and reconstructed images from the QINR-VAE/AE are clear with sharp boundaries and details. Overall, we find that the addition of QINR-based quantum layers into the AE/VAE frameworks enhances the performance of reconstruction and generation with a constrained set of parameters.
- Abstract(参考訳): 本稿では,量子暗黙的ニューラル表現(QINR)に基づくオートエンコーダ(AE)と可変オートエンコーダ(VAE)を提案する。
我々の目的は、VAEとAEのQINRが潜伏空間から高度にリッチで周期的で高周波な特徴へと情報を変換できることを実証することである。
さらに,QINR-VAEは,低多様性問題に対処できるため,画像生成における様々な量子生成逆ネットワーク(QGAN)モデルよりも安定であることを示す。
我々の量子古典ハイブリッドモデルは、古典的畳み込みニューラルネットワーク(CNN)エンコーダと量子ベースのQINRデコーダからなる。
再建損失として2値クロスエントロピー(BCEWithLogits)でQINR-AE/VAEをトレーニングする。
QINR-VAEでは,後方崩壊を防止するために,ベータ/キャパシティスケジューリングによる潜時正規化にKullback-Leibler分散を用いる。
データ再アップロードにおける学習可能なアングルスケーリングを導入し、最適化の課題に対処する。
我々は、MNIST、E-MNIST、Fashion-MNISTデータセットを用いて、画像の再構成と生成を行う。
以上の結果から,VAEにおけるQINR構造は,様々な生成モデルよりも少ないデータ量でより広い範囲の画像を生成できることが示唆された。
我々は,QINR-VAE/AEから生成された画像と再構成画像が,鮮明な境界と細部を持つことが明らかとなった。
全体として、QINRベースの量子層をAE/VAEフレームワークに追加することで、制約されたパラメータセットによる再構成と生成の性能が向上することがわかった。
関連論文リスト
- Image Denoising via Quantum Reservoir Computing [0.0]
量子Reservoir Computing (QRC) は、情報処理に量子システムの自然力学を利用する。
画像復調のためのハイブリッド量子古典フレームワークにQRCを適用した。
以上の結果から,QRCに基づくアプローチは画像のシャープネスの向上と構造回復を達成できることが示唆された。
論文 参考訳(メタデータ) (2025-12-21T06:12:57Z) - VQRAE: Representation Quantization Autoencoders for Multimodal Understanding, Generation and Reconstruction [83.50898344094153]
VQRAEは、イメージ理解のための連続的セマンティック機能と、統一トークン化器内での視覚生成のためのトークンを生成する。
デザインは、多モーダル理解、離散トークンの能力を維持するために、無視可能な意味情報を可能にする。
VQRAEは、視覚的理解、生成、再構築のベンチマークで競合性能を示す。
論文 参考訳(メタデータ) (2025-11-28T17:26:34Z) - Quantum Down Sampling Filter for Variational Auto-encoder [0.504868948270058]
変分オートエンコーダ(VAE)は、生成モデリングと画像再構成の基礎となる。
本研究では,量子変分オートエンコーダ(Q-VAE)のハイブリッドモデルを提案する。
Q-VAEはエンコーダに量子符号化を統合し、完全に接続された層を利用して意味のある表現を抽出する。
論文 参考訳(メタデータ) (2025-01-09T11:08:55Z) - VAE-QWGAN: Addressing Mode Collapse in Quantum GANs via Autoencoding Priors [3.823356975862005]
VAE-QWGANは、古典的変分オートエンコーダ(VAE)とハイブリッド量子ワッサーシュタインGAN(QWGAN)の強度を組み合わせる
VAE-QWGANは既存のQGANアプローチよりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2024-09-16T14:52:22Z) - U-KAN Makes Strong Backbone for Medical Image Segmentation and Generation [48.40120035775506]
Kolmogorov-Arnold Networks (KAN)は、非線形学習可能なアクティベーション関数のスタックを通じてニューラルネットワーク学習を再構築する。
トークン化中間表現であるU-KAN上に専用kan層を統合することにより,確立したU-Netパイプラインを検証,修正,再設計する。
さらに、拡散モデルにおける代替U-Netノイズ予測器としてのU-KANの可能性を探り、タスク指向モデルアーキテクチャの生成にその適用性を実証した。
論文 参考訳(メタデータ) (2024-06-05T04:13:03Z) - Large Multi-modality Model Assisted AI-Generated Image Quality Assessment [53.182136445844904]
本稿では,AI生成画像品質評価モデル(MA-AGIQA)を提案する。
セマンティックインフォームドガイダンスを使用して意味情報を感知し、慎重に設計されたテキストプロンプトを通してセマンティックベクターを抽出する。
最先端のパフォーマンスを実現し、AI生成画像の品質を評価する上で優れた一般化能力を示す。
論文 参考訳(メタデータ) (2024-04-27T02:40:36Z) - Convolutional Neural Generative Coding: Scaling Predictive Coding to
Natural Images [79.07468367923619]
畳み込み型神経生成符号化(Conv-NGC)を開発した。
我々は、潜伏状態マップを段階的に洗練する柔軟な神経生物学的動機付けアルゴリズムを実装した。
本研究は,脳にインスパイアされたニューラル・システムによる再建と画像復調の課題に対する効果について検討する。
論文 参考訳(メタデータ) (2022-11-22T06:42:41Z) - Learning Deep Interleaved Networks with Asymmetric Co-Attention for
Image Restoration [65.11022516031463]
本稿では,高品質(本社)画像再構成のために,異なる状態の情報をどのように組み合わせるべきかを学習するディープインターリーブドネットワーク(DIN)を提案する。
本稿では,各インターリーブノードにアタッチメントされた非対称なコアテンション(AsyCA)を提案し,その特性依存性をモデル化する。
提案したDINはエンドツーエンドで訓練でき、様々な画像復元タスクに適用できる。
論文 参考訳(メタデータ) (2020-10-29T15:32:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。