論文の概要: Unsupervised Symbolic Music Segmentation using Ensemble Temporal
Prediction Errors
- arxiv url: http://arxiv.org/abs/2207.00760v1
- Date: Sat, 2 Jul 2022 07:13:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-05 14:05:45.611437
- Title: Unsupervised Symbolic Music Segmentation using Ensemble Temporal
Prediction Errors
- Title(参考訳): アンサンブル時間予測誤差を用いた教師なしシンボリック音楽セグメンテーション
- Authors: Shahaf Bassan, Yossi Adi, Jeffrey S. Rosenschein
- Abstract要約: シンボリック音楽のセグメンテーションのための教師なし手法を提案する。
提案モデルは,時間的予測誤差モデルのアンサンブルに基づく。
結果は,提案手法がEssen Folksongデータセット上で最先端の性能に達することを示唆している。
- 参考スコア(独自算出の注目度): 19.39375155501102
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Symbolic music segmentation is the process of dividing symbolic melodies into
smaller meaningful groups, such as melodic phrases. We proposed an unsupervised
method for segmenting symbolic music. The proposed model is based on an
ensemble of temporal prediction error models. During training, each model
predicts the next token to identify musical phrase changes. While at test time,
we perform a peak detection algorithm to select segment candidates. Finally, we
aggregate the predictions of each of the models participating in the ensemble
to predict the final segmentation. Results suggest the proposed method reaches
state-of-the-art performance on the Essen Folksong dataset under the
unsupervised setting when considering F-Score and R-value. We additionally
provide an ablation study to better assess the contribution of each of the
model components to the final results. As expected, the proposed method is
inferior to the supervised setting, which leaves room for improvement in future
research considering closing the gap between unsupervised and supervised
methods.
- Abstract(参考訳): シンボリック・ミュージック・セグメンテーション(symbolic music segmentation)は、シンボリック・メロディーを、旋律句のようなより小さな意味のあるグループに分割する過程である。
シンボリック音楽のセグメント化のための教師なし手法を提案する。
提案モデルは,時間的予測誤差モデルのアンサンブルに基づく。
トレーニング中、各モデルは次のトークンを予測し、音楽的フレーズの変化を特定する。
テスト時にセグメント候補を選択するためにピーク検出アルゴリズムを実行する。
最後に、アンサンブルに参加している各モデルの予測を集約し、最終的なセグメンテーションを予測する。
その結果,提案手法はFスコアとR値を考慮した場合,教師なし設定下でのEssen Folksongデータセットの最先端性能に達することが示唆された。
さらに,各モデルコンポーネントの最終的な結果への寄与度を評価するため,アブレーション研究を行った。
提案手法は,教師なし手法と教師なし手法のギャップを埋めることを考慮した将来の研究において,改善の余地を残している教師付き設定よりも劣っている。
関連論文リスト
- Serenade: A Model for Human-in-the-loop Automatic Chord Estimation [1.6385815610837167]
そこで本研究では,Human-in-the-loopアプローチにより,モデルのみのアプローチよりも高調波解析性能が向上することを示す。
我々は,ポピュラー音楽のデータセットを用いてモデル評価を行い,本手法を用いることで,モデルのみのアプローチよりも高調波解析性能が向上することを示す。
論文 参考訳(メタデータ) (2023-10-17T11:31:29Z) - Causal Unsupervised Semantic Segmentation [60.178274138753174]
教師なしセマンティックセグメンテーションは、人間のラベル付きアノテーションなしで高品質なセマンティックセマンティックセグメンテーションを実現することを目的としている。
本稿では、因果推論からの洞察を活用する新しいフレームワークCAUSE(CAusal Unsupervised Semantic sEgmentation)を提案する。
論文 参考訳(メタデータ) (2023-10-11T10:54:44Z) - Encoder-Decoder Model for Suffix Prediction in Predictive Monitoring [0.0]
接尾辞予測問題に対するほとんどのアプローチは、次の活動のみを予測する方法を学ぶことによって接尾辞を予測することを学ぶ。
本稿では,プレフィックスの表現学習を推論フェーズから分離するアテンション機構を備えたエンコーダ・デコーダモデルに基づく新しいアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-11-29T11:27:29Z) - Patch-level Gaze Distribution Prediction for Gaze Following [49.93340533068501]
トレーニング後の視線に対するパッチ分布予測(PDP)手法を提案する。
本モデルでは,アノテーションの差が大きい画像上でのより優れたヒートマップ分布を予測することにより,MSE損失の正則化を図っている。
実験により,ターゲット予測とイン/アウト予測サブタスクのギャップを埋めるモデルが得られた。
論文 参考訳(メタデータ) (2022-11-20T19:25:15Z) - Phoneme Segmentation Using Self-Supervised Speech Models [13.956691231452336]
音素セグメンテーションのタスクに伝達学習を適用し、タスクの自己教師型事前学習において学習した表現の有用性を実証する。
我々のモデルは、事前学習で学んだ特徴を操作する戦略的に配置された畳み込みによるトランスフォーマースタイルのエンコーダを拡張している。
論文 参考訳(メタデータ) (2022-11-02T19:57:31Z) - Joint Forecasting of Panoptic Segmentations with Difference Attention [72.03470153917189]
シーン内の全てのオブジェクトを共同で予測する新しいパノプティックセグメンテーション予測モデルについて検討する。
提案したモデルをCityscapesとAIODriveデータセット上で評価する。
論文 参考訳(メタデータ) (2022-04-14T17:59:32Z) - Bayesian Graph Contrastive Learning [55.36652660268726]
本稿では,ランダムな拡張がエンコーダにつながることを示すグラフコントラスト学習手法の新たな視点を提案する。
提案手法は,各ノードを決定論的ベクトルに埋め込む既存の手法とは対照的に,各ノードを潜在空間の分布で表現する。
いくつかのベンチマークデータセットにおける既存の最先端手法と比較して,性能が大幅に向上したことを示す。
論文 参考訳(メタデータ) (2021-12-15T01:45:32Z) - Parameter Decoupling Strategy for Semi-supervised 3D Left Atrium
Segmentation [0.0]
本稿では,パラメータ分離戦略に基づく半教師付きセグメンテーションモデルを提案する。
提案手法は,Atrial Challengeデータセット上での最先端の半教師付き手法と競合する結果を得た。
論文 参考訳(メタデータ) (2021-09-20T14:51:42Z) - Test-time Collective Prediction [73.74982509510961]
マシンラーニングの複数のパーティは、将来のテストポイントを共同で予測したいと考えています。
エージェントは、すべてのエージェントの集合の集合的な専門知識の恩恵を受けることを望んでいるが、データやモデルパラメータを解放する意思はないかもしれない。
我々は、各エージェントの事前学習モデルを利用して、テスト時に集合的な予測を行う分散型メカニズムを探索する。
論文 参考訳(メタデータ) (2021-06-22T18:29:58Z) - Self-Supervised Contrastive Learning for Unsupervised Phoneme
Segmentation [37.054709598792165]
このモデルは畳み込みニューラルネットワークであり、生波形上で直接動作する。
ノイズコントラスト推定原理を用いて信号のスペクトル変化を同定する。
テスト時には、モデル出力にピーク検出アルゴリズムを適用して最終境界を生成する。
論文 参考訳(メタデータ) (2020-07-27T12:10:21Z) - Predicting Temporal Sets with Deep Neural Networks [50.53727580527024]
本稿では,時間集合予測のためのディープニューラルネットワークに基づく統合解を提案する。
ユニークな視点は、セットレベルの共起グラフを構築することで要素関係を学ぶことである。
我々は,要素や集合の時間依存性を適応的に学習するアテンションベースのモジュールを設計する。
論文 参考訳(メタデータ) (2020-06-20T03:29:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。