論文の概要: An approach to melodic segmentation and classification based on filtering with the Haar-wavelet
- arxiv url: http://arxiv.org/abs/2504.20822v1
- Date: Tue, 29 Apr 2025 14:41:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:54.939147
- Title: An approach to melodic segmentation and classification based on filtering with the Haar-wavelet
- Title(参考訳): ハールウェーブレットを用いたフィルタリングに基づくメロディックセグメンテーションと分類に関する研究
- Authors: Gissel Velarde, Tillman Weyde, David Meredith,
- Abstract要約: 記号表現におけるメロディーの分類とセグメンテーションの新しい手法を提案する。
この方法はハールウェーブレットを用いた信号としてピッチをフィルタリングする。
オランダの民謡360曲を26曲に分類する際には、ピッチ信号に匹敵する。
- 参考スコア(独自算出の注目度): 2.4774640776820105
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a novel method of classification and segmentation of melodies in symbolic representation. The method is based on filtering pitch as a signal over time with the Haar-wavelet, and we evaluate it on two tasks. The filtered signal corresponds to a single-scale signal ws from the continuous Haar wavelet transform. The melodies are first segmented using local maxima or zero-crossings of w_s. The segments of w_s are then classified using the k-nearest neighbour algorithm with Euclidian and city-block distances. The method proves more effective than using unfiltered pitch signals and Gestalt-based segmentation when used to recognize the parent works of segments from Bach's Two-Part Inventions (BWV 772-786). When used to classify 360 Dutch folk tunes into 26 tune families, the performance of the method is comparable to the use of pitch signals, but not as good as that of string-matching methods based on multiple features.
- Abstract(参考訳): 記号表現におけるメロディーの分類とセグメンテーションの新しい手法を提案する。
本手法はハールウェーブレットを用いた信号としてピッチをフィルタリングし,2つのタスクで評価する。
フィルタ信号は連続ハールウェーブレット変換からの単一スケール信号wsに対応する。
メロディーはまず、w_sの局所極大またはゼロ交叉を用いて分割される。
w_sのセグメントは、ユークリディアンと都市ブロック距離を持つk-アネレスト近傍アルゴリズムを用いて分類される。
この方法は、Bach の Two-Part Inventions (BWV 772-786) からセグメントの親作品を認識する際に、未フィルタリングのピッチ信号やゲシュタルトに基づくセグメンテーションを使用するよりも効果的である。
オランダの民謡を26曲に分類する際には、ピッチ信号に匹敵する性能を持つが、複数の特徴に基づく弦合奏法に匹敵する性能はない。
関連論文リスト
- Wavelet-Filtering of Symbolic Music Representations for Folk Tune Segmentation and Classification [2.4774640776820105]
本研究の目的は,民謡の記号表現を分類し,ハールウェーブレットフィルタリングを用いたチューンファミリーに分類する機械学習手法を評価することである。
連続ウェーブレット変換(CWT)をハールウェーブレットに特定のスケールで適用し、特定の時間スケールで情報を強調するメロディのフィルタ版を得る。
その結果,ピッチ信号のウェーブレットに基づくセグメンテーションとウェーブレットフィルタリングにより,時間スケールや他のパラメータが最適化された場合のクロスバリデーション評価において,分類精度が向上することが判明した。
論文 参考訳(メタデータ) (2025-04-29T08:02:37Z) - An Explainable Proxy Model for Multiabel Audio Segmentation [1.7611027732647493]
音声活動(SAD)、音楽(MD)、ノイズ(ND)、重畳音声検出(OSD)を同時に解くための説明可能なマルチラベルセグメンテーションモデルを提案する。
2つのデータセットで実施された実験は、トレーニング済みのブラックボックスモデルと同様のパフォーマンスを示しながら、強い説明可能性を示している。
論文 参考訳(メタデータ) (2024-01-16T10:41:33Z) - SegRefiner: Towards Model-Agnostic Segmentation Refinement with Discrete
Diffusion Process [102.18226145874007]
そこで我々は,異なるセグメンテーションモデルによって生成されるオブジェクトマスクの品質を高めるために,SegRefinerと呼ばれるモデルに依存しないソリューションを提案する。
SegRefinerは粗いマスクを入力として取り、離散拡散プロセスを用いてそれらを洗練する。
さまざまな種類の粗いマスクにわたるセグメンテーションメトリックとバウンダリメトリックの両方を一貫して改善する。
論文 参考訳(メタデータ) (2023-12-19T18:53:47Z) - CorrMatch: Label Propagation via Correlation Matching for
Semi-Supervised Semantic Segmentation [73.89509052503222]
本稿では、CorrMatchと呼ばれる、単純だが実行可能な半教師付きセマンティックセマンティックセマンティックセマンティクス手法を提案する。
相関写像は、同一カテゴリのクラスタリングピクセルを容易に実現できるだけでなく、良好な形状情報も含んでいることを観察する。
我々は,高信頼画素を拡大し,さらに掘り出すために,画素の対の類似性をモデル化して画素伝搬を行う。
そして、相関地図から抽出した正確なクラス非依存マスクを用いて、領域伝搬を行い、擬似ラベルを強化する。
論文 参考訳(メタデータ) (2023-06-07T10:02:29Z) - Speech segmentation using multilevel hybrid filters [0.0]
マルチレベルハイブリッド(平均/最小)フィルタ(MHF)に基づく音声分割の新しい手法を提案する。
提案手法はスペクトル変化に基づいて,音声を均質な音響セグメントに分割することを目的としている。
このアルゴリズムは、音声合成された音声コーダに使われ、良好な結果が得られている。
論文 参考訳(メタデータ) (2022-02-24T00:03:02Z) - A Novel Falling-Ball Algorithm for Image Segmentation [0.14337588659482517]
領域ベースセグメンテーションアルゴリズムである領域ベースFalling-Ballアルゴリズムを提案する。
提案アルゴリズムは,丘陵地帯から落下する球が捕集流域で止まると仮定して,捕集流域を検出する。
論文 参考訳(メタデータ) (2021-05-06T12:41:10Z) - PointFlow: Flowing Semantics Through Points for Aerial Image
Segmentation [96.76882806139251]
本論文では,FPN(Feature Pyramid Network)フレームワークに基づく点親和性伝播モジュールであるPointFlowを提案する。
密接な親和性学習ではなく、隣接する特徴間の選択された点にスパース親和性マップを生成する。
3つの異なる空中セグメンテーションデータセットの実験結果から,提案手法は最先端の汎用セグメンテーション法よりも効率的かつ効率的であることが示唆された。
論文 参考訳(メタデータ) (2021-03-11T09:42:32Z) - Simultaneous Grouping and Denoising via Sparse Convex Wavelet Clustering [3.2116198597240846]
散在な凸ウェーブレットクラスタリングアプローチを開発し、同時にグループをノイズ化し、発見します。
本手法は、解釈性およびデータ圧縮の両方を改善する非ノイズ化(ウェーブレットスパース)クラスタセントロイドを生成する。
論文 参考訳(メタデータ) (2020-12-08T22:00:38Z) - Learning Noise-Aware Encoder-Decoder from Noisy Labels by Alternating
Back-Propagation for Saliency Detection [54.98042023365694]
本稿では,ノイズを考慮したエンコーダ・デコーダ・フレームワークを提案する。
提案モデルはニューラルネットワークによってパラメータ化された2つのサブモデルから構成される。
論文 参考訳(メタデータ) (2020-07-23T18:47:36Z) - Differentiable Hierarchical Graph Grouping for Multi-Person Pose
Estimation [95.72606536493548]
複数の人の身体のキーポイントを同時にローカライズするため、複数の人物のポーズ推定は困難である。
ボトムアップ型多人数ポーズ推定タスクにおけるグラフグループ化を学習するための,新しい微分可能な階層グラフグループ化(HGG)手法を提案する。
論文 参考訳(メタデータ) (2020-07-23T08:46:22Z) - Deep Affinity Net: Instance Segmentation via Affinity [48.498706304017674]
Deep Affinity Netは、グラフ分割アルゴリズムCascade-GAECを伴って、効果的なアフィニティベースのアプローチである。
すべてのアフィニティベースのモデルの中で、最高のシングルショット結果と最速のランニングタイムを達成する。
また、リージョンベースのMask R-CNNよりも優れています。
論文 参考訳(メタデータ) (2020-03-15T15:22:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。