論文の概要: Hybrid Quantum-Classical Convolutional Neural Networks for Image Classification in Multiple Color Spaces
- arxiv url: http://arxiv.org/abs/2406.02229v3
- Date: Thu, 08 May 2025 09:00:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-09 15:15:31.815041
- Title: Hybrid Quantum-Classical Convolutional Neural Networks for Image Classification in Multiple Color Spaces
- Title(参考訳): 複数色空間における画像分類のためのハイブリッド量子古典畳み込みニューラルネットワーク
- Authors: Kwok-Ho Ng, Tingting Song, Zhiquan Liu,
- Abstract要約: ハイブリッド量子古典畳み込みニューラルネットワーク(HQCNN)は、性能改善の可能性を示している。
色空間間の画像分類を評価するHQCNNを提案する。
MNIST, CIFAR-10, EuroSAT, SAT-4データセットの性能評価を行った。
- 参考スコア(独自算出の注目度): 4.048174267427361
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The growing complexity and scale of image processing tasks challenge classical convolutional neural networks (CNNs) with high computational costs. Hybrid quantum-classical convolutional neural networks (HQCNNs) show potential to improve performance by accelerating processing speed, enhancing classification accuracy, and reducing model parameters, though studies have primarily focused on the RGB color space. However, the effectiveness of HQCNNs in non-RGB color spaces, such as Lab, YCrCb, and HSV, remains largely unexplored. We propose an HQCNN to evaluate image classification across diverse color spaces. The HQCNN integrates parameterized quantum circuits (PQCs) with a classical CNN, leveraging quantum entanglement and trainable gates to enhance expressiveness across varied color representations. We assess performance on MNIST, CIFAR-10, EuroSAT, and SAT-4 datasets. Experimental results demonstrate that the HQCNN outperforms the classical CNN across all tested color spaces for the ten-class MNIST task, achieving a best accuracy of $94.3\%$ in Lab compared to $92.8\%$ in RGB for the CNN, with superior performance on other datasets in various color spaces. These findings highlight the potential of non-RGB color spaces and optimized PQC designs to improve classification performance. We provide new insights for advancing hybrid quantum-classical computer vision through optimized PQC architectures and diverse color space applications.
- Abstract(参考訳): 画像処理タスクの複雑さとスケールの増大は、計算コストの高い古典的畳み込みニューラルネットワーク(CNN)に挑戦する。
ハイブリッド量子古典畳み込みニューラルネットワーク(HQCNN)は、処理速度の高速化、分類精度の向上、モデルパラメータの削減による性能向上の可能性を示しているが、研究は主にRGB色空間に焦点を当てている。
しかし、RGB以外の色空間(Lab、YCrCb、HSV)におけるHQCNNの有効性は明らかにされていない。
色空間間の画像分類を評価するHQCNNを提案する。
HQCNNは、パラメタライズド量子回路(PQC)と古典的なCNNを統合し、量子絡み合いとトレーニング可能なゲートを活用し、様々な色表現の表現性を高める。
MNIST, CIFAR-10, EuroSAT, SAT-4データセットの性能評価を行った。
実験結果から、HQCNNは10種類のMNISTタスクでテストされたすべての色空間において古典的なCNNよりも優れており、CNNでは9,2.8 %のRGBよりも9,4.3 %の精度で、様々な色空間における他のデータセットよりも優れた性能を示している。
これらの結果は、非RGBカラー空間の可能性と、分類性能を改善するために最適化されたPQC設計を浮き彫りにした。
我々は、最適化されたPQCアーキテクチャと多様な色空間アプリケーションを通して、ハイブリッド量子古典コンピュータビジョンを進化させるための新しい洞察を提供する。
関連論文リスト
- A Hybrid Spiking-Convolutional Neural Network Approach for Advancing Machine Learning Models [6.528272856589831]
本稿では,新しいハイブリッド・スパイキング・畳み込みニューラルネットワーク(SC-NN)モデルを提案する。
我々のアプローチは、イベントベースの計算や時間処理などのSNNのユニークな機能と、CNNの強力な表現学習能力を利用する。
モデルは、マスクを使用して欠落したリージョンを生成するイメージインペイント用に特別に設計されたカスタムデータセットに基づいてトレーニングされる。
論文 参考訳(メタデータ) (2024-07-11T20:50:33Z) - Color Equivariant Convolutional Networks [50.655443383582124]
CNNは、偶然に記録された条件によって導入された色の変化の間にデータ不均衡がある場合、苦労する。
カラースペクトル間の形状特徴共有を可能にする新しいディープラーニングビルディングブロックであるカラー等変畳み込み(CEConvs)を提案する。
CEConvsの利点は、様々なタスクに対するダウンストリーム性能と、列車-テストの分散シフトを含む色の変化に対するロバスト性の改善である。
論文 参考訳(メタデータ) (2023-10-30T09:18:49Z) - Hybrid Quantum Neural Network Structures for Image Multi-classification [0.0]
2つの最近の画像分類手法が登場し、1つはPCA次元の縮小と角度符号化を採用し、もう1つはQNNをCNNに統合して性能を向上させる。
本研究では、これらのアルゴリズムの性能をマルチクラス画像分類において検討し、現在の環境に適した最適化されたハイブリッド量子ニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2023-08-30T12:48:05Z) - Name Your Colour For the Task: Artificially Discover Colour Naming via
Colour Quantisation Transformer [62.75343115345667]
そこで本研究では,色空間を定量化しつつ,画像上での認識を維持しつつ,色空間を定量化する新しい色量子化変換器CQFormerを提案する。
人工色システムと人間の言語における基本色用語との一貫性のある進化パターンを観察する。
我々のカラー量子化法は、画像記憶を効果的に圧縮する効率的な量子化法も提供する。
論文 参考訳(メタデータ) (2022-12-07T03:39:18Z) - Learning to Structure an Image with Few Colors and Beyond [59.34619548026885]
カラー量子化ネットワークであるColorCNNを提案し、分類損失を最小限に抑えて、限られた色空間で画像を構成することを学習する。
複数の色空間サイズ構成をサポートするColorCNN+を導入し、大色空間における認識精度の低下と望ましくない視覚的忠実度に関する過去の問題に対処する。
潜在的な応用として、ネットワーク認識のための画像圧縮手法としてColorCNNが利用可能であることを示す。
論文 参考訳(メタデータ) (2022-08-17T17:59:15Z) - Universal Deep Network for Steganalysis of Color Image based on Channel
Representation [41.86330101334733]
我々は空間領域とJPEG領域における普遍的なカラー画像ステガナリシスネットワーク(UCNet)を設計する。
提案手法は前処理,畳み込み,分類モジュールを含む。
本研究では, ALASKA II に関する広範囲な実験を行い, 提案手法が最先端の成果を得られることを示す。
論文 参考訳(メタデータ) (2021-11-24T02:22:13Z) - RGB Image Classification with Quantum Convolutional Ansaetze [18.379304679643436]
本稿では,RGB画像上の畳み込み操作をシミュレートする2種類の量子回路アンセッツェを提案する。
我々の知る限りでは、これはRGB画像を効果的に扱う量子畳み込み回路の最初の作品である。
また、量子回路アンサッツの大きさとハイブリッド量子古典畳み込みニューラルネットワークの学習性との関係についても検討する。
論文 参考訳(メタデータ) (2021-07-23T09:38:59Z) - CNNs for JPEGs: A Study in Computational Cost [49.97673761305336]
畳み込みニューラルネットワーク(CNN)は過去10年間で驚くべき進歩を遂げてきた。
CNNはRGBピクセルから直接データの堅牢な表現を学習することができる。
近年,圧縮領域から直接学習できる深層学習手法が注目されている。
論文 参考訳(メタデータ) (2020-12-26T15:00:10Z) - When CNNs Meet Random RNNs: Towards Multi-Level Analysis for RGB-D
Object and Scene Recognition [10.796613905980609]
オブジェクトおよびシーン認識タスクのための多モードRGB-D画像から識別的特徴表現を抽出する新しいフレームワークを提案する。
CNNアクティベーションの高次元性に対応するため、ランダムな重み付けプール方式が提案されている。
実験では、RNNステージにおける完全ランダム化構造がCNNアクティベーションを符号化し、識別的ソリッドな特徴を成功させることを確認した。
論文 参考訳(メタデータ) (2020-04-26T10:58:27Z) - Learning to Structure an Image with Few Colors [59.34619548026885]
そこで,カラー量子化ネットワークであるColorCNNを提案する。
1ビットのカラースペース(すなわち2色)だけで、提案されたネットワークはCIFAR10データセット上で82.1%のトップ-1の精度を達成した。
アプリケーションの場合、PNGでエンコードされた場合、提案したカラー量子化は、極低ビットレート方式の他の画像圧縮方法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-03-17T17:56:15Z) - Widening and Squeezing: Towards Accurate and Efficient QNNs [125.172220129257]
量子化ニューラルネットワーク(QNN)は、非常に安価な計算とストレージオーバーヘッドのため、業界にとって非常に魅力的なものだが、その性能は、完全な精度パラメータを持つネットワークよりも悪い。
既存の手法の多くは、より効果的なトレーニング技術を利用して、特にバイナリニューラルネットワークの性能を高めることを目的としている。
本稿では,従来の完全精度ネットワークで高次元量子化機能に特徴を投影することで,この問題に対処する。
論文 参考訳(メタデータ) (2020-02-03T04:11:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。