論文の概要: MuSpike: A Benchmark and Evaluation Framework for Symbolic Music Generation with Spiking Neural Networks
- arxiv url: http://arxiv.org/abs/2508.19251v1
- Date: Fri, 08 Aug 2025 04:43:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-31 21:54:20.616519
- Title: MuSpike: A Benchmark and Evaluation Framework for Symbolic Music Generation with Spiking Neural Networks
- Title(参考訳): MuSpike: スパイクニューラルネットワークを用いたシンボリック音楽生成のためのベンチマークと評価フレームワーク
- Authors: Qian Liang, Menghaoran Tang, Yi Zeng,
- Abstract要約: 我々は、ニューラルネットワーク(SNN)をスパイクするための統合ベンチマークおよび評価フレームワークであるMuSpikeを紹介する。
MuSpike氏は、確立された客観的メトリクスと大規模なリスニングスタディを組み合わせることで、包括的な評価を強調している。
その結果、異なるSNNモデルが評価次元にまたがって異なる強度を示すことが明らかとなった。
異なる音楽背景を持つ参加者は多様な知覚パターンを示し、専門家はAIによって構成された音楽に対してより寛容であることを示す。
- 参考スコア(独自算出の注目度): 5.452525790848054
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Symbolic music generation has seen rapid progress with artificial neural networks, yet remains underexplored in the biologically plausible domain of spiking neural networks (SNNs), where both standardized benchmarks and comprehensive evaluation methods are lacking. To address this gap, we introduce MuSpike, a unified benchmark and evaluation framework that systematically assesses five representative SNN architectures (SNN-CNN, SNN-RNN, SNN-LSTM, SNN-GAN and SNN-Transformer) across five typical datasets, covering tonal, structural, emotional, and stylistic variations. MuSpike emphasizes comprehensive evaluation, combining established objective metrics with a large-scale listening study. We propose new subjective metrics, targeting musical impression, autobiographical association, and personal preference, that capture perceptual dimensions often overlooked in prior work. Results reveal that (1) different SNN models exhibit distinct strengths across evaluation dimensions; (2) participants with different musical backgrounds exhibit diverse perceptual patterns, with experts showing greater tolerance toward AI-composed music; and (3) a noticeable misalignment exists between objective and subjective evaluations, highlighting the limitations of purely statistical metrics and underscoring the value of human perceptual judgment in assessing musical quality. MuSpike provides the first systematic benchmark and systemic evaluation framework for SNN models in symbolic music generation, establishing a solid foundation for future research into biologically plausible and cognitively grounded music generation.
- Abstract(参考訳): シンボリック・ミュージック・ジェネレーションは、人工知能ニューラルネットワークで急速に進歩してきたが、標準化されたベンチマークと包括的な評価方法の両方が欠落しているスパイキング・ニューラル・ネットワーク(SNN)の生物学的にもっともらしい領域ではいまだ探索されていない。
このギャップに対処するため、我々は5つの代表的なSNNアーキテクチャ(SNN-CNN、SNN-RNN、SNN-LSTM、SNN-GAN、SNN-Transformer)を、音色、構造、感情、スタイルのバリエーションを含む5つの典型的なデータセットで体系的に評価する統一的なベンチマークおよび評価フレームワークであるMuSpikeを紹介した。
MuSpike氏は、確立された客観的メトリクスと大規模なリスニングスタディを組み合わせることで、包括的な評価を強調している。
本研究では,音楽印象,自伝的関連,個人の嗜好を対象とする新たな主観的指標を提案する。
その結果,(1)異なるSNNモデルは,評価次元に異なる強みを示し,(2)異なる音楽背景を持つ参加者は,AI合成音楽に対する高い耐性を示す専門家と,(3)純粋に統計的な指標の限界を強調し,人間の知覚的判断の価値を過小評価する主観的と主観的評価の間に,顕著な相違が存在することが明らかとなった。
MuSpikeは、シンボリック・ミュージック・ジェネレーションにおけるSNNモデルのための最初の体系的ベンチマークとシステム的評価フレームワークを提供する。
関連論文リスト
- Digit Recognition using Multimodal Spiking Neural Networks [3.046906600991174]
スパイキングニューラルネットワーク(SNN)は、生物学的にデータ処理にインスパイアされた第3世代のニューラルネットワークである。
SNNは、そのニューロモルフィック性のためにイベントベースのデータを処理するために使用される。
論文 参考訳(メタデータ) (2024-08-31T22:27:40Z) - Cognitive Networks and Performance Drive fMRI-Based State Classification Using DNN Models [0.0]
我々は、個々の認知状態を分類するために、構造的に異なる2つのDNNモデルと相補的なDNNモデルを用いる。
アーキテクチャ上の違いにもかかわらず、両者のモデルが常に予測精度と個人の認知性能との間に堅牢な関係を生んでいることを示す。
論文 参考訳(メタデータ) (2024-08-14T15:25:51Z) - Information Bottleneck Analysis of Deep Neural Networks via Lossy Compression [37.69303106863453]
Information Bottleneck(IB)原則は、ディープニューラルネットワーク(DNN)のトレーニングプロセスを分析するための情報理論フレームワークを提供する。
本稿では,一般NNのICB解析を行うためのフレームワークを提案する。
また,MI力学の新たな特徴を明らかにするため,実規模に近いISB解析を行う。
論文 参考訳(メタデータ) (2023-05-13T21:44:32Z) - A Spatial-channel-temporal-fused Attention for Spiking Neural Networks [7.759491656618468]
スパイキングニューラルネットワーク(SNN)は、計算戦略を模倣し、情報処理においてかなりの能力を示す。
本研究では,SNNを誘導し,対象領域を効率的に捕捉する空間チャネル時間拡散アテンション(SCTFA)モジュールを提案する。
論文 参考訳(メタデータ) (2022-09-22T07:45:55Z) - On the benefits of robust models in modulation recognition [53.391095789289736]
畳み込み層を用いたディープニューラルネットワーク(DNN)は、通信における多くのタスクにおいて最先端である。
画像分類のような他の領域では、DNNは敵の摂動に弱いことが示されている。
最新モデルの堅牢性をテストするための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-03-27T19:58:06Z) - Neural Networks Enhancement with Logical Knowledge [83.9217787335878]
関係データに対するKENNの拡張を提案する。
その結果、KENNは、存在関係データにおいても、基礎となるニューラルネットワークの性能を高めることができることがわかった。
論文 参考訳(メタデータ) (2020-09-13T21:12:20Z) - Score-informed Networks for Music Performance Assessment [64.12728872707446]
MPAモデルにスコア情報を組み込んだディープニューラルネットワークに基づく手法はまだ研究されていない。
スコアインフォームド性能評価が可能な3つのモデルを提案する。
論文 参考訳(メタデータ) (2020-08-01T07:46:24Z) - Neural Networks with Recurrent Generative Feedback [61.90658210112138]
畳み込みニューラルネットワーク(CNN)でこの設計をインスタンス化する
実験では、標準ベンチマーク上の従来のフィードフォワードCNNに対して、CNN-Fは敵のロバスト性を大幅に改善した。
論文 参考訳(メタデータ) (2020-07-17T19:32:48Z) - Multi-Tones' Phase Coding (MTPC) of Interaural Time Difference by
Spiking Neural Network [68.43026108936029]
雑音の多い実環境下での正確な音像定位のための純粋スパイクニューラルネットワーク(SNN)に基づく計算モデルを提案する。
このアルゴリズムを,マイクロホンアレイを用いたリアルタイムロボットシステムに実装する。
実験の結果, 平均誤差方位は13度であり, 音源定位に対する他の生物学的に妥当なニューロモルフィックアプローチの精度を上回っていることがわかった。
論文 参考訳(メタデータ) (2020-07-07T08:22:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。