論文の概要: Quantum Reinforcement Learning-Guided Diffusion Model for Image Synthesis via Hybrid Quantum-Classical Generative Model Architectures
- arxiv url: http://arxiv.org/abs/2509.14163v1
- Date: Wed, 17 Sep 2025 16:47:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-18 18:41:50.924405
- Title: Quantum Reinforcement Learning-Guided Diffusion Model for Image Synthesis via Hybrid Quantum-Classical Generative Model Architectures
- Title(参考訳): ハイブリッド量子古典生成モデルアーキテクチャによる画像合成のための量子強化学習誘導拡散モデル
- Authors: Chi-Sheng Chen, En-Jui Kuo,
- Abstract要約: 本稿では,各段階でCFGを動的に調整するQRL(quantum reinforcement learning)コントローラを提案する。
コントローラは、ハイブリッド量子-古典的アクター-批判的アーキテクチャを採用する。
CIFAR-10の実験は、QRLポリシーが知覚品質を改善することを示した。
- 参考スコア(独自算出の注目度): 2.005299372367689
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diffusion models typically employ static or heuristic classifier-free guidance (CFG) schedules, which often fail to adapt across timesteps and noise conditions. In this work, we introduce a quantum reinforcement learning (QRL) controller that dynamically adjusts CFG at each denoising step. The controller adopts a hybrid quantum--classical actor--critic architecture: a shallow variational quantum circuit (VQC) with ring entanglement generates policy features, which are mapped by a compact multilayer perceptron (MLP) into Gaussian actions over $\Delta$CFG, while a classical critic estimates value functions. The policy is optimized using Proximal Policy Optimization (PPO) with Generalized Advantage Estimation (GAE), guided by a reward that balances classification confidence, perceptual improvement, and action regularization. Experiments on CIFAR-10 demonstrate that our QRL policy improves perceptual quality (LPIPS, PSNR, SSIM) while reducing parameter count compared to classical RL actors and fixed schedules. Ablation studies on qubit number and circuit depth reveal trade-offs between accuracy and efficiency, and extended evaluations confirm robust generation under long diffusion schedules.
- Abstract(参考訳): 拡散モデルは通常、静的またはヒューリスティックな分類器フリーガイダンス(CFG)のスケジュールを採用しており、時間経過や雑音条件に適応できないことが多い。
本研究では,各段階でCFGを動的に調整する量子強化学習(QRL)コントローラを提案する。
リングエンタングルメントを持つ浅い変分量子回路(VQC)は、コンパクトな多層パーセプトロン(MLP)によって$$$Delta$CFG上のガウス作用にマッピングされ、古典的な批評家は値関数を推定する。
ポリシーは、一般アドバンテージ推定(GAE)を備えたPPO(Proximal Policy Optimization)を使用して最適化され、分類信頼性、知覚的改善、行動正規化のバランスをとる報酬によって導かれる。
CIFAR-10の実験では、従来のRLアクターや固定スケジュールと比較してパラメータ数を削減しつつ、QRLポリシーが知覚品質(LPIPS、PSNR、SSIM)を改善することが示されている。
量子ビット数と回路深度に関するアブレーション研究により、精度と効率のトレードオフが明らかとなり、長い拡散スケジュール下でのロバストな生成が検証された。
関連論文リスト
- Reinforcement Learning for Quantum Network Control with Application-Driven Objectives [53.03367590211247]
動的プログラミングと強化学習は、制御戦略を最適化するための有望なツールを提供する。
非線形で微分可能な目的関数を直接最適化する新しいRLフレームワークを提案する。
我々の研究は、RLを持つ量子ネットワークにおける非線形目的関数最適化への第一歩であり、より高度なユースケースへの道を開く。
論文 参考訳(メタデータ) (2025-09-12T18:41:10Z) - HQCC: A Hybrid Quantum-Classical Classifier with Adaptive Structure [7.836610894905161]
量子機械学習(QML)を進化させるハイブリッド量子古典(HQCC)を提案する。
HQCCはLong ShortTerm Memory (LSTM)駆動の動的回路生成器を通じて量子回路(PQC)を適応的に最適化する。
我々はMNISTとFashion MNISTのデータセットでシミュレーションを行い、97.12%の精度を達成した。
論文 参考訳(メタデータ) (2025-04-02T22:49:00Z) - RoSTE: An Efficient Quantization-Aware Supervised Fine-Tuning Approach for Large Language Models [53.571195477043496]
本稿では,RoSTE (Rotated Straight-Through-Estimator) というアルゴリズムを提案する。
RoSTEは、量子化を意識した微調整(QA-SFT)と適応的な回転戦略を組み合わせることで、アクティベーションアウトリーを減少させる。
その結果, 予測誤差は収束重みの量子化誤差と直接比例し, 最適化された回転構成により効果的に管理できることが判明した。
論文 参考訳(メタデータ) (2025-02-13T06:44:33Z) - Entanglement-enhanced optimal quantum metrology [0.7373617024876725]
本稿では,係り合いと最適化された結合相互作用を利用したQMのQOCスキームを提案する。
その結果,特定の状況下では,単一粒子のコヒーレント制御を利用したスキームが著しく制限されていることが示唆された。
論文 参考訳(メタデータ) (2024-11-06T16:08:13Z) - Model-Based Qubit Noise Spectroscopy [0.0]
古典的な信号処理からインスピレーションを得てモデルに基づくQNSアプローチを導出する。
シミュレーションと実験データの両方を通して、これらのモデルに基づくQNSアプローチが、古典的手法の統計的および計算的利点をいかに維持するかを示す。
論文 参考訳(メタデータ) (2024-05-20T09:30:38Z) - Entropy-Regularized Token-Level Policy Optimization for Language Agent Reinforcement [67.1393112206885]
大規模言語モデル(LLM)は、対話的な意思決定タスクにおいてインテリジェントなエージェントとして期待されている。
本稿では,トークンレベルでのLLMの最適化に適したエントロピー拡張RL法である,エントロピー正規化トークンレベル最適化(ETPO)を導入する。
我々は,データサイエンスコード生成を多段階対話型タスクのシリーズとしてモデル化したシミュレーション環境におけるETPOの有効性を評価する。
論文 参考訳(メタデータ) (2024-02-09T07:45:26Z) - Provable Guarantees for Generative Behavior Cloning: Bridging Low-Level
Stability and High-Level Behavior [51.60683890503293]
生成モデルを用いた複雑な専門家による実演の行動クローニングに関する理論的枠組みを提案する。
任意の専門的軌跡の時間ごとのステップ分布に一致するトラジェクトリを生成することができることを示す。
論文 参考訳(メタデータ) (2023-07-27T04:27:26Z) - Weight Re-Mapping for Variational Quantum Algorithms [54.854986762287126]
変動量子回路(VQC)における重み付けの考え方を紹介する。
我々は,8つの分類データセットに対する影響を評価するために,7つの異なる重み再マッピング関数を用いる。
以上の結果から,重量再マッピングによりVQCの収束速度が向上することが示唆された。
論文 参考訳(メタデータ) (2023-06-09T09:42:21Z) - Noise-Robust End-to-End Quantum Control using Deep Autoregressive Policy
Networks [2.5946789143276447]
変分量子固有解法は、量子コンピューティングデバイスの使用を可能にするため、近年注目を集めている。
不確実性のある方法で連続的および離散的な自由度を同時に最適化できるハイブリッドポリシグラデーショングラデーションアルゴリズムを提案する。
我々の研究は、強化学習と量子制御の相乗効果を示す。
論文 参考訳(メタデータ) (2020-12-12T02:13:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。