論文の概要: Score-informed Networks for Music Performance Assessment
- arxiv url: http://arxiv.org/abs/2008.00203v1
- Date: Sat, 1 Aug 2020 07:46:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-04 01:19:01.801425
- Title: Score-informed Networks for Music Performance Assessment
- Title(参考訳): 楽譜評価のためのスコアインフォームドネットワーク
- Authors: Jiawen Huang, Yun-Ning Hung, Ashis Pati, Siddharth Kumar Gururani,
Alexander Lerch
- Abstract要約: MPAモデルにスコア情報を組み込んだディープニューラルネットワークに基づく手法はまだ研究されていない。
スコアインフォームド性能評価が可能な3つのモデルを提案する。
- 参考スコア(独自算出の注目度): 64.12728872707446
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The assessment of music performances in most cases takes into account the
underlying musical score being performed. While there have been several
automatic approaches for objective music performance assessment (MPA) based on
extracted features from both the performance audio and the score, deep neural
network-based methods incorporating score information into MPA models have not
yet been investigated. In this paper, we introduce three different models
capable of score-informed performance assessment. These are (i) a convolutional
neural network that utilizes a simple time-series input comprising of aligned
pitch contours and score, (ii) a joint embedding model which learns a joint
latent space for pitch contours and scores, and (iii) a distance matrix-based
convolutional neural network which utilizes patterns in the distance matrix
between pitch contours and musical score to predict assessment ratings. Our
results provide insights into the suitability of different architectures and
input representations and demonstrate the benefits of score-informed models as
compared to score-independent models.
- Abstract(参考訳): ほとんどの場合の音楽演奏の評価は、演奏中の楽譜の基盤を考慮に入れている。
演奏音声と楽譜の両方から抽出した特徴に基づく客観的音楽演奏評価(MPA)の自動手法はいくつかあるが,MPAモデルにスコア情報を組み込んだディープニューラルネットワークによる手法はまだ検討されていない。
本稿では,スコアインフォームド性能評価が可能な3つのモデルを提案する。
これらは
(i)調整されたピッチ輪郭とスコアからなる単純な時系列入力を利用する畳み込みニューラルネットワーク
(二)ピッチ輪郭と楽譜のジョイント潜在空間を学習するジョイント埋め込みモデル
(iii)ピッチ輪郭と楽譜間の距離行列のパターンを利用して評価評価を行う距離行列に基づく畳み込みニューラルネットワーク。
本結果は,異なるアーキテクチャと入力表現の適合性に関する知見を提供し,スコア非依存モデルと比較して,スコアインフォームドモデルの利点を示す。
関連論文リスト
- Machine Learning Framework for Audio-Based Content Evaluation using MFCC, Chroma, Spectral Contrast, and Temporal Feature Engineering [0.0]
そこで本研究では,YouTube上の音楽カバーの音声サンプルと,オリジナル曲の音声とユーザコメントからの感情スコアを含むデータセットを構築した。
我々のアプローチは、広範囲な事前処理、音声信号を30秒のウィンドウに分割し、高次元の特徴表現を抽出することである。
回帰モデルを用いて感情スコアを0-100スケールで予測し,それぞれ3.420,5.482,2.783,4.212の根平均二乗誤差(RMSE)値を達成する。
論文 参考訳(メタデータ) (2024-10-31T20:26:26Z) - Equi-GSPR: Equivariant SE(3) Graph Network Model for Sparse Point Cloud Registration [2.814748676983944]
局所球面ユークリッド3次元等分散特性をSE(3)メッセージパッシングに基づく伝搬により埋め込んだグラフニューラルネットワークモデルを提案する。
我々のモデルは、主に記述モジュール、同変グラフ層、類似性、最終的な回帰層から構成される。
3DMatchおよびKITTIデータセットで行った実験は、最先端のアプローチと比較して、我々のモデルの魅力的で堅牢な性能を示している。
論文 参考訳(メタデータ) (2024-10-08T06:48:01Z) - Revisiting the Evaluation of Image Synthesis with GANs [55.72247435112475]
本研究では, 合成性能の評価に関する実証的研究を行い, 生成モデルの代表としてGAN(Generative Adversarial Network)を用いた。
特に、表現空間におけるデータポイントの表現方法、選択したサンプルを用いた公平距離の計算方法、各集合から使用可能なインスタンス数など、さまざまな要素の詳細な分析を行う。
論文 参考訳(メタデータ) (2023-04-04T17:54:32Z) - CONVIQT: Contrastive Video Quality Estimator [63.749184706461826]
知覚ビデオ品質評価(VQA)は、多くのストリーミングおよびビデオ共有プラットフォームにおいて不可欠な要素である。
本稿では,視覚的に関連のある映像品質表現を自己指導的に学習する問題について考察する。
本研究は, 自己教師型学習を用いて, 知覚力による説得力のある表現が得られることを示す。
論文 参考訳(メタデータ) (2022-06-29T15:22:01Z) - Deep Learning-based Non-Intrusive Multi-Objective Speech Assessment
Model with Cross-Domain Features [30.57631206882462]
MOSA-Netは、テスト音声信号を入力として、音声品質、知性、歪み評価スコアを推定するように設計されている。
音声品質(PESQ)、短時間客観性(STOI)、音声歪み指数(BLS)のスコアを、雑音および拡張音声発話の両方で正確に予測できることを,MOSA-Netが示す。
論文 参考訳(メタデータ) (2021-11-03T17:30:43Z) - Multi-modal Conditional Bounding Box Regression for Music Score
Following [7.360807642941713]
本稿では,シート画像に基づくオンラインオーディオ・スコアアライメントの問題に対処する。
条件付きニューラルネットワークアーキテクチャは、与えられた音楽演奏の各時点における完全なスコアシート画像におけるマッチング位置のx,y座標を直接予測する。
論文 参考訳(メタデータ) (2021-05-10T12:43:35Z) - ANNETTE: Accurate Neural Network Execution Time Estimation with Stacked
Models [56.21470608621633]
本稿では,アーキテクチャ検索を対象ハードウェアから切り離すための時間推定フレームワークを提案する。
提案手法は,マイクロカーネルと多層ベンチマークからモデルの集合を抽出し,マッピングとネットワーク実行時間推定のためのスタックモデルを生成する。
生成した混合モデルの推定精度と忠実度, 統計モデルとルーフラインモデル, 評価のための洗練されたルーフラインモデルを比較した。
論文 参考訳(メタデータ) (2021-05-07T11:39:05Z) - Anomaly Detection on Attributed Networks via Contrastive Self-Supervised
Learning [50.24174211654775]
本論文では,アトリビュートネットワーク上の異常検出のためのコントラスト型自己監視学習フレームワークを提案する。
このフレームワークは、新しいタイプのコントラストインスタンスペアをサンプリングすることで、ネットワークデータからのローカル情報を完全に活用します。
高次元特性と局所構造から情報埋め込みを学習するグラフニューラルネットワークに基づくコントラスト学習モデルを提案する。
論文 参考訳(メタデータ) (2021-02-27T03:17:20Z) - Structure-Aware Audio-to-Score Alignment using Progressively Dilated
Convolutional Neural Networks [8.669338893753885]
音楽演奏と楽譜の間の構造的差異の同定は、音声とスコアのアライメントにおいて難しいが不可欠なステップである。
本稿では、進化的に拡張された畳み込みニューラルネットワークを用いて、そのような違いを検出する新しい手法を提案する。
論文 参考訳(メタデータ) (2021-01-31T05:14:58Z) - Fast accuracy estimation of deep learning based multi-class musical
source separation [79.10962538141445]
本稿では,ニューラルネットワークのトレーニングやチューニングを行うことなく,任意のデータセットにおける楽器の分離性を評価する手法を提案する。
理想的な比マスクを持つオラクルの原理に基づいて、我々の手法は最先端のディープラーニング手法の分離性能を推定するための優れたプロキシである。
論文 参考訳(メタデータ) (2020-10-19T13:05:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。