論文の概要: HQTN-SER: Speech Emotion Recognition with Hybrid Quantum Tensor Networks
- arxiv url: http://arxiv.org/abs/2605.14523v1
- Date: Thu, 14 May 2026 08:07:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-15 21:45:34.701776
- Title: HQTN-SER: Speech Emotion Recognition with Hybrid Quantum Tensor Networks
- Title(参考訳): HQTN-SER:ハイブリッド量子テンソルネットワークを用いた音声感情認識
- Authors: Mahad Mohtashim, Nouhaila Innan, Muhammad Shafique,
- Abstract要約: 現実の環境では、音声の感情認識は脆弱である。
量子機械学習は、コンパクトモジュールによる非線形相関モデリングを導入する代替手段を提供する。
本稿では、量子テンソルネットワーク接続がSERを小ビット環境下でどのようにサポートするかを検討するハイブリッド量子古典フレームワークHQTN-SERを提案する。
- 参考スコア(独自算出の注目度): 2.417944170423441
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Speech emotion recognition (SER) remains fragile in real-world conditions because emotional cues are subtle, speaker-dependent, and easily confounded by recording variability, while high-performing deep models typically rely on large and carefully curated training sets. Quantum machine learning offers an alternative way to introduce nonlinear correlation modeling with compact modules, yet existing quantum SER studies remain limited and the impact of circuit structure is not well understood. This paper presents HQTN-SER, a hybrid quantum-classical framework that investigates how quantum tensor network connectivity can support SER under small-qubit settings. HQTN-SER introduces (i) an MPS-inspired quantum tensor network module that enforces structured interactions to model correlations in speech representations with a small number of trainable parameters, and (ii) a fusion strategy that combines quantum measurement features with a learned classical latent embedding for end-to-end emotion classification. We evaluate HQTN-SER on three public benchmarks (RAVDESS, SAVEE, and MDER) under a unified preprocessing and training protocol. The proposed model achieves consistent performance across datasets, RAVDESS = 80.12%, SAVEE = 78.26% and MDER = 73.51% accuracy, with stable convergence and low qubit counts, showing that tensor network structure can be an effective and hardware-aware design choice for quantum-assisted SER. The results provide a reproducible baseline and clarify when structured quantum modules can add value to affective computing today.
- Abstract(参考訳): 音声感情認識(SER)は、感情的な手がかりが微妙で、話者に依存し、変動を記録することで容易に構築されるため、現実の環境では脆弱である。
量子機械学習は、コンパクトモジュールによる非線形相関モデルを導入する代替手段を提供するが、既存の量子SER研究は限定的であり、回路構造の影響はよく理解されていない。
本稿では、量子テンソルネットワーク接続がSERを小ビット環境下でどのようにサポートするかを検討するハイブリッド量子古典フレームワークHQTN-SERを提案する。
HQTN-SER の紹介
(i)MPSにインスパイアされた量子テンソルネットワークモジュールで、少数の訓練可能なパラメータを持つ音声表現におけるモデル相関に対する構造的相互作用を強制する。
(II) 量子計測特徴と学習された古典的ラテント埋め込みを組み合わせた融合戦略により, エンドツーエンドの感情分類を行う。
我々は, 3つの公開ベンチマーク(RAVDESS, SAVEE, MDER)上で, HQTN-SERを統一前処理およびトレーニングプロトコルで評価した。
RAVDESS = 80.12%、SAVEE = 78.26%、MDER = 73.51%の精度で、安定収束と低量子ビット数を実現し、テンソルネットワーク構造が量子アシストSERの効果的なハードウェア対応設計選択であることを示した。
その結果、再現可能なベースラインを提供し、構造化量子モジュールが今日、感情コンピューティングに価値を付加できるかどうかを明らかにした。
関連論文リスト
- Quantum LEGO Learning: A Modular Design Principle for Hybrid Artificial Intelligence [63.39968536637762]
古典的および量子的コンポーネントを再利用可能で構成可能な学習ブロックとして扱う学習フレームワークであるQuantum LEGO Learningを紹介します。
このフレームワーク内では、トレーニング済みの古典的ニューラルネットワークがフリーズ機能ブロックとして機能し、VQCはトレーニング可能な適応モジュールとして機能する。
我々は,学習誤差を近似と推定成分に分解するブロックワイズ一般化理論を開発した。
論文 参考訳(メタデータ) (2026-01-29T14:29:21Z) - Practical Hybrid Quantum Language Models with Observable Readout on Real Hardware [0.764671395172401]
本稿では,ハイブリッド量子言語モデルとして,QRNN(Quantum Recurrent Neural Networks)とQCNN(Quantum Convolutional Neural Networks)を提案する。
我々のアーキテクチャは、ハードウェア最適化パラメトリック量子回路と軽量な古典射影層を組み合わせたものである。
IBM Quantumプロセッサの実験では、回路深さとトレーニング容易性の間の重要なトレードオフが明らかになった。
論文 参考訳(メタデータ) (2025-12-14T14:22:44Z) - Quantum Graph Attention Network: A Novel Quantum Multi-Head Attention Mechanism for Graph Learning [0.0]
量子グラフ注意ネットワーク(Quantum Graph Attention Network、QGAT)は、変動量子回路をアテンション機構に統合するハイブリッドグラフニューラルネットワークである。
複雑な構造的依存関係を捕捉するQGATの有効性を示し、帰納的シナリオにおける一般化を改善した。
実験により、量子埋め込みは特徴や構造的ノイズに対するロバスト性を高め、実世界のノイズデータを扱う利点を示唆している。
論文 参考訳(メタデータ) (2025-08-25T03:25:48Z) - TensorHyper-VQC: A Tensor-Train-Guided Hypernetwork for Robust and Scalable Variational Quantum Computing [50.95799256262098]
量子機械学習のための新しいテンソルトレイン(TT)誘導ハイパーネットワークフレームワークであるHyper-VQCを紹介する。
我々のフレームワークは、量子回路パラメータの生成を古典的なTTネットワークに委譲し、量子ハードウェアから最適化を効果的に分離する。
これらの結果から、Hyper-VQCは、短期デバイス上での実用的な量子機械学習を促進するためのスケーラブルで耐雑音性のあるフレームワークとして位置づけられる。
論文 参考訳(メタデータ) (2025-08-01T23:37:55Z) - VQC-MLPNet: An Unconventional Hybrid Quantum-Classical Architecture for Scalable and Robust Quantum Machine Learning [50.95799256262098]
変分量子回路(VQC)は量子機械学習を約束するが、表現性、訓練性、耐雑音性の課題に直面している。
本稿では,VQCが学習中に古典多層パーセプトロンの第一層重みを生成するハイブリッドアーキテクチャであるVQC-MLPNetを提案する。
論文 参考訳(メタデータ) (2025-06-12T01:38:15Z) - Representation Learning with Parameterised Quantum Circuits for Advancing Speech Emotion Recognition [37.98283871637917]
音声感情認識(SER)における量子回路(PQC)の利用について検討する。
従来の畳み込みニューラルネットワーク(CNN)にPQCを統合するハイブリッド量子古典アーキテクチャを提案する。
トレーニング可能なパラメータの50%以上を削減し,古典的なCNNベースラインに対する分類性能の向上を実現した。
論文 参考訳(メタデータ) (2025-01-21T11:23:38Z) - QKSAN: A Quantum Kernel Self-Attention Network [53.96779043113156]
量子カーネル法(Quantum Kernel Methods, QKM)のデータ表現能力とSAMの効率的な情報抽出能力を組み合わせた量子カーネル自己認識機構(Quantum Kernel Self-Attention Mechanism, QKSAM)を導入する。
量子カーネル自己保持ネットワーク(QKSAN)フレームワークは,DMP(Dederred Measurement Principle)と条件測定技術を巧みに組み込んだQKSAMに基づいて提案されている。
4つのQKSANサブモデルはPennyLaneとIBM Qiskitプラットフォームにデプロイされ、MNISTとFashion MNISTのバイナリ分類を実行する。
論文 参考訳(メタデータ) (2023-08-25T15:08:19Z) - When BERT Meets Quantum Temporal Convolution Learning for Text
Classification in Heterogeneous Computing [75.75419308975746]
本研究は,変分量子回路に基づく垂直連合学習アーキテクチャを提案し,テキスト分類のための量子化事前学習BERTモデルの競争性能を実証する。
目的分類実験により,提案したBERT-QTCモデルにより,SnipsおよびATIS音声言語データセットの競合実験結果が得られた。
論文 参考訳(メタデータ) (2022-02-17T09:55:21Z) - An end-to-end trainable hybrid classical-quantum classifier [0.0]
量子インスパイアされたテンソルネットワークと変分量子回路を組み合わせて教師付き学習タスクを行うハイブリッドモデルを提案する。
このアーキテクチャにより、モデルの古典的および量子的部分を同時にトレーニングすることができ、エンドツーエンドのトレーニングフレームワークを提供する。
論文 参考訳(メタデータ) (2021-02-04T05:19:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。