論文の概要: HQViT: Hybrid Quantum Vision Transformer for Image Classification
- arxiv url: http://arxiv.org/abs/2504.02730v1
- Date: Thu, 03 Apr 2025 16:13:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-04 12:57:36.192017
- Title: HQViT: Hybrid Quantum Vision Transformer for Image Classification
- Title(参考訳): HQViT:画像分類のためのハイブリッド量子ビジョン変換器
- Authors: Hui Zhang, Qinglin Zhao, Mengchu Zhou, Li Feng,
- Abstract要約: 本稿では,モデル性能を向上しつつ,モデルトレーニングを高速化するHybrid Quantum Vision Transformer(HQViT)を提案する。
HQViTは振幅エンコーディングによる全画像処理を導入し、位置エンコーディングを追加せずにグローバルな画像情報をよりよく保存する。
様々なコンピュータビジョンデータセットの実験により、HQViTは既存のモデルよりも優れており、最大10.9%(MNIST 10-classification task)の改善を実現している。
- 参考スコア(独自算出の注目度): 48.72766405978677
- License:
- Abstract: Transformer-based architectures have revolutionized the landscape of deep learning. In computer vision domain, Vision Transformer demonstrates remarkable performance on par with or even surpassing that of convolutional neural networks. However, the quadratic computational complexity of its self-attention mechanism poses challenges for classical computing, making model training with high-dimensional input data, e.g., images, particularly expensive. To address such limitations, we propose a Hybrid Quantum Vision Transformer (HQViT), that leverages the principles of quantum computing to accelerate model training while enhancing model performance. HQViT introduces whole-image processing with amplitude encoding to better preserve global image information without additional positional encoding. By leveraging quantum computation on the most critical steps and selectively handling other components in a classical way, we lower the cost of quantum resources for HQViT. The qubit requirement is minimized to $O(log_2N)$ and the number of parameterized quantum gates is only $O(log_2d)$, making it well-suited for Noisy Intermediate-Scale Quantum devices. By offloading the computationally intensive attention coefficient matrix calculation to the quantum framework, HQViT reduces the classical computational load by $O(T^2d)$. Extensive experiments across various computer vision datasets demonstrate that HQViT outperforms existing models, achieving a maximum improvement of up to $10.9\%$ (on the MNIST 10-classification task) over the state of the art. This work highlights the great potential to combine quantum and classical computing to cope with complex image classification tasks.
- Abstract(参考訳): トランスフォーマーベースのアーキテクチャは、ディープラーニングの風景に革命をもたらした。
コンピュータビジョン領域では、Vision Transformerは畳み込みニューラルネットワークと同等またはそれ以上のパフォーマンスを示す。
しかし、自己注意機構の二次計算の複雑さは古典的コンピューティングの課題を招き、高次元入力データ(例えば画像)を用いたモデルトレーニングを特に高価にする。
このような制約に対処するために,量子コンピューティングの原理を活用し,モデル性能を高めながらモデルトレーニングを加速するHybrid Quantum Vision Transformer (HQViT)を提案する。
HQViTは振幅エンコーディングによる全画像処理を導入し、位置エンコーディングを追加せずにグローバルな画像情報をよりよく保存する。
量子計算を最も重要なステップで活用し、古典的な方法で他のコンポーネントを選択的に扱うことにより、HQViTの量子リソースコストを下げる。
量子ビット要求は$O(log_2N)$に最小化され、パラメータ化された量子ゲートの数は$O(log_2d)$に限られる。
計算集約的な注意係数行列計算を量子フレームワークにオフロードすることで、HQViTは古典的な計算負荷を$O(T^2d)$に削減する。
さまざまなコンピュータビジョンデータセットにわたる大規模な実験により、HQViTは既存のモデルよりも優れており、最先端技術よりも最大10.9\%(MNIST 10-classification task)の改善が達成されている。
この研究は、複雑な画像分類タスクに対処するために量子コンピューティングと古典コンピューティングを組み合わせる大きな可能性を浮き彫りにしている。
関連論文リスト
- Hybrid Quantum-Classical Feature Extraction approach for Image Classification using Autoencoders and Quantum SVMs [0.0]
NISQ時代の量子コンピュータには、ノイズ、スケーラビリティ、読み出し時間、ゲート操作時間などの制限がある。
複雑なデータセットが量子機械学習パイプラインの全体的な効率に与える影響を軽減するために、戦略を考案する必要がある。
本稿では,ResNet10にインスパイアされた畳み込みオートエンコーダを用いた古典的特徴抽出手法を適用し,データセットの次元性を低減し,意味のある特徴を抽出する。
論文 参考訳(メタデータ) (2024-10-24T15:02:05Z) - Quantum Transfer Learning for MNIST Classification Using a Hybrid Quantum-Classical Approach [0.0]
本研究は、画像分類タスクにおける量子コンピューティングと古典的機械学習の統合について検討する。
両パラダイムの強みを生かしたハイブリッド量子古典的アプローチを提案する。
実験結果から、ハイブリッドモデルが量子コンピューティングと古典的手法を統合する可能性を示す一方で、量子結果に基づいて訓練された最終モデルの精度は、圧縮された特徴に基づいて訓練された古典的モデルよりも低いことが示唆された。
論文 参考訳(メタデータ) (2024-08-05T22:16:27Z) - Variational Quantum Circuits Enhanced Generative Adversarial Network [5.209320054725053]
我々は、GAN(QC-GAN)を改善するためのハイブリッド量子古典アーキテクチャを提案する。
QC-GANは1層ニューラルネットワークと共に量子変動回路で構成され、識別器は従来のニューラルネットワークで構成されている。
また、QC-GANが16ドル以上の画像を生成することのできない代替量子GAN、すなわちpathGANよりも優れていることを示した。
論文 参考訳(メタデータ) (2024-02-02T03:59:35Z) - Hybrid quantum transfer learning for crack image classification on NISQ
hardware [62.997667081978825]
グレー値画像のひび割れ検出に量子転送学習を適用した。
我々は、PennyLaneの標準量子ビットのパフォーマンスとトレーニング時間を、IBMのqasm_simulatorや実際のバックエンドと比較する。
論文 参考訳(メタデータ) (2023-07-31T14:45:29Z) - A general-purpose single-photon-based quantum computing platform [36.56899230501635]
本報告では,単一光子を用いたユーザ可読な汎用量子コンピューティングのプロトタイプについて報告する。
再構成可能なチップ上に、普遍線形光ネットワークを供給する高効率量子ドット単光子源を備える。
我々は、計測ベースの量子コンピューティングに向けた重要なマイルストーンである3光子エンタングルメント生成について報告する。
論文 参考訳(メタデータ) (2023-06-01T16:35:55Z) - Quantum machine learning for image classification [39.58317527488534]
本研究では、量子力学の原理を有効計算に活用する2つの量子機械学習モデルを紹介する。
我々の最初のモデルは、並列量子回路を持つハイブリッド量子ニューラルネットワークであり、ノイズの多い中間スケール量子時代においても計算の実行を可能にする。
第2のモデルは、クオン進化層を持つハイブリッド量子ニューラルネットワークを導入し、畳み込みプロセスによる画像の解像度を低下させる。
論文 参考訳(メタデータ) (2023-04-18T18:23:20Z) - Quantum Annealing for Single Image Super-Resolution [86.69338893753886]
単一画像超解像(SISR)問題を解くために,量子コンピューティングに基づくアルゴリズムを提案する。
提案したAQCアルゴリズムは、SISRの精度を維持しつつ、古典的なアナログよりも向上したスピードアップを実現する。
論文 参考訳(メタデータ) (2023-04-18T11:57:15Z) - Generation of High-Resolution Handwritten Digits with an Ion-Trap
Quantum Computer [55.41644538483948]
本稿では, 量子回路に基づく生成モデルを構築し, 生成逆数ネットワークの事前分布を学習し, サンプル化する。
我々は、このハイブリッドアルゴリズムを171ドルのYb$+$ ion qubitsに基づいてイオントラップデバイスでトレーニングし、高品質な画像を生成する。
論文 参考訳(メタデータ) (2020-12-07T18:51:28Z) - Quantum Deformed Neural Networks [83.71196337378022]
我々は,量子コンピュータ上で効率的に動作するように設計された新しい量子ニューラルネットワーク層を開発した。
入力状態の絡み合いに制限された場合、古典的なコンピュータでシミュレートすることができる。
論文 参考訳(メタデータ) (2020-10-21T09:46:12Z) - Experimental Quantum Generative Adversarial Networks for Image
Generation [93.06926114985761]
超伝導量子プロセッサを用いた実世界の手書き桁画像の学習と生成を実験的に行う。
我々の研究は、短期量子デバイス上での高度な量子生成モデル開発のためのガイダンスを提供する。
論文 参考訳(メタデータ) (2020-10-13T06:57:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。