論文の概要: Quantifying Quanvolutional Neural Networks Robustness for Speech in Healthcare Applications
- arxiv url: http://arxiv.org/abs/2601.02432v1
- Date: Mon, 05 Jan 2026 06:25:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-07 17:02:12.660579
- Title: Quantifying Quanvolutional Neural Networks Robustness for Speech in Healthcare Applications
- Title(参考訳): 医療分野における音声の進化的ニューラルネットワークのロバストさの定量化
- Authors: Ha Tran, Bipasha Kashyap, Pubudu N. Pathirana,
- Abstract要約: 我々は、古典的畳み込みニューラルネットワーク(CNN)に対する量子機械学習モデルであるクオン進化ニューラルネットワーク(QNN)の堅牢性を評価する。
我々は3つのQNNモデル(Random、Basic、Strongly)とCNNベースライン(CNN-Base)、ResNet-18、VGG-16(CE、mCE、RCE、RmCE)を比較した。
QNNは、ピッチシフト、時間シフト、速度変化(重度時間シフト時のCE/RCEの最大22%低下)においてCNN-Baseよりも優れており、一方CNN-Baseはガウシアンより弾力性が高い。
- 参考スコア(独自算出の注目度): 2.5194101824751636
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Speech-based machine learning systems are sensitive to noise, complicating reliable deployment in emotion recognition and voice pathology detection. We evaluate the robustness of a hybrid quantum machine learning model, quanvolutional neural networks (QNNs) against classical convolutional neural networks (CNNs) under four acoustic corruptions (Gaussian noise, pitch shift, temporal shift, and speed variation) in a clean-train/corrupted-test regime. Using AVFAD (voice pathology) and TESS (speech emotion), we compare three QNN models (Random, Basic, Strongly) to a simple CNN baseline (CNN-Base), ResNet-18 and VGG-16 using accuracy and corruption metrics (CE, mCE, RCE, RmCE), and analyze architectural factors (circuit complexity or depth, convergence) alongside per-emotion robustness. QNNs generally outperform the CNN-Base under pitch shift, temporal shift, and speed variation (up to 22% lower CE/RCE at severe temporal shift), while the CNN-Base remains more resilient to Gaussian noise. Among quantum circuits, QNN-Basic achieves the best overall robustness on AVFAD, and QNN-Random performs strongest on TESS. Emotion-wise, fear is most robust (80-90% accuracy under severe corruptions), neutral can collapse under strong Gaussian noise (5.5% accuracy), and happy is most vulnerable to pitch, temporal, and speed distortions. QNNs also converge up to six times faster than the CNN-Base. To our knowledge, this is a systematic study of QNN robustness for speech under common non-adversarial acoustic corruptions, indicating that shallow entangling quantum front-ends can improve noise resilience while sensitivity to additive noise remains a challenge.
- Abstract(参考訳): 音声ベースの機械学習システムはノイズに敏感であり、感情認識と音声病理検出の信頼性の高い展開を複雑にしている。
本研究では,従来の畳み込みニューラルネットワーク (CNN) に対する量子機械学習モデル,QNN(QNN) の強靭性について,クリーントレイン/破損試験体制下での4つの音響劣化(ガウスノイズ,ピッチシフト,時間シフト,速度変動)下で評価する。
AVFAD(音声病理)とTESS(音声感情)を用いて、3つのQNNモデル(Random、Basic、Strongly)と単純なCNNベースライン(CNN-Base)、ResNet-18、VGG-16(CE、mCE、RCE、RmCE)を比較し、アーキテクチャ要因(回路複雑性、深さ、収束)を感情ごとの堅牢性とともに分析する。
QNNは、ピッチシフト、時間シフト、速度変化(高度時間シフト時のCE/RCEの最大22%低下)においてCNN-Baseよりも優れており、一方CNN-Baseはガウスノイズに対してより耐性がある。
量子回路の中で、QNN-BasicはAVFADで最高の総合ロバスト性を実現し、QNN-RandomはTESSで最強となる。
感情的に言えば、恐怖は最も頑丈(厳しい腐敗の下で80-90%の精度)、中立性は強いガウスノイズ(5.5%の精度)の下で崩壊し、幸福はピッチ、時間、速度の歪みに対して最も脆弱である。
QNNはCNN-Baseの最大6倍の速度で収束する。
我々の知る限り、これは一般的な非敵対的音響腐敗下での音声に対するQNNの頑健性に関する体系的な研究であり、浅い量子フロントエンドが付加雑音に対する感受性を保ちながら、ノイズの回復性を改善することができることを示している。
関連論文リスト
- Quantum Machine Learning for UAV Swarm Intrusion Detection [25.52804434998647]
UAV群における侵入検知は、高移動量、非定常交通、重度の階級不均衡によって複雑である。
量子カーネル、変分量子ニューラルネットワーク(QNN)、ハイブリッド量子学習ニューラルネットワーク(QT-NN)の3つのアプローチをベンチマークする。
すべてのモデルは8機能フロー表現を消費し、同じ前処理、バランス、ノイズモデル仮定の下で評価される。
量子カーネルとQT-NNは低データ、非線形なレジームで優れており、QNNはトレーニング容易性の問題に悩まされている。
論文 参考訳(メタデータ) (2025-09-01T22:36:30Z) - CTRQNets & LQNets: Continuous Time Recurrent and Liquid Quantum Neural Networks [76.53016529061821]
Liquid Quantum Neural Network (LQNet) とContinuous Time Recurrent Quantum Neural Network (CTRQNet) を開発した。
LQNetとCTRQNetは、バイナリ分類によってCIFAR 10で40%の精度向上を実現している。
論文 参考訳(メタデータ) (2024-08-28T00:56:03Z) - Noise Adaptor in Spiking Neural Networks [4.568827262994048]
低遅延スパイクニューラルネットワーク(SNN)アルゴリズムは大きな関心を集めている。
低遅延SNNを構築する最も効率的な方法の1つは、事前訓練された低ビット人工ニューラルネットワーク(ANN)をSNNに変換することである。
SNNを低ビットのANNから変換すると、時折ノイズが発生する可能性がある。
論文 参考訳(メタデータ) (2023-12-08T16:57:01Z) - Problem-Dependent Power of Quantum Neural Networks on Multi-Class
Classification [83.20479832949069]
量子ニューラルネットワーク(QNN)は物理世界を理解する上で重要なツールとなっているが、その利点と限界は完全には理解されていない。
本稿では,多クラス分類タスクにおけるQCの問題依存力について検討する。
我々の研究はQNNの課題依存力に光を当て、その潜在的なメリットを評価するための実践的なツールを提供する。
論文 参考訳(メタデータ) (2022-12-29T10:46:40Z) - QuantumNAT: Quantum Noise-Aware Training with Noise Injection, Quantization and Normalization [19.822514659801616]
量子回路(PQC)は、短期量子ハードウェアにおける量子優位性を約束している。
しかし、大きな量子ノイズ(エラー)のため、PQCモデルの性能は実際の量子デバイスで著しく低下する。
本稿では,PQC固有のフレームワークであるQuantumNATを提案する。
論文 参考訳(メタデータ) (2021-10-21T17:59:19Z) - Neural Architecture Dilation for Adversarial Robustness [56.18555072877193]
畳み込みニューラルネットワークの欠点は、敵の攻撃に弱いことである。
本稿では, 良好な精度を有する背骨CNNの対角的堅牢性を向上させることを目的とする。
最小限の計算オーバーヘッドの下では、拡張アーキテクチャはバックボーンCNNの標準的な性能と親和性が期待できる。
論文 参考訳(メタデータ) (2021-08-16T03:58:00Z) - Frequency Gating: Improved Convolutional Neural Networks for Speech
Enhancement in the Time-Frequency Domain [37.722450363816144]
本稿では、CNNのカーネルの乗算重みを計算するために、周波数ゲーティングと呼ばれる手法を提案する。
スキップ接続を用いたオートエンコーダニューラルネットワークの実験では、局所的および周波数的にゲーティングの両方がベースラインを上回っている。
拡張短時間客観的インテリジェンススコア(ESTOI)に基づく損失関数を導入し、標準平均二乗誤差(MSE)損失関数より優れていることを示す。
論文 参考訳(メタデータ) (2020-11-08T22:04:00Z) - On the learnability of quantum neural networks [132.1981461292324]
本稿では,量子ニューラルネットワーク(QNN)の学習可能性について考察する。
また,概念をQNNで効率的に学習することができれば,ゲートノイズがあってもQNNで効果的に学習できることを示す。
論文 参考訳(メタデータ) (2020-07-24T06:34:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。