論文の概要: Soft Dynamic Time Warping for Multi-Pitch Estimation and Beyond
- arxiv url: http://arxiv.org/abs/2304.05032v1
- Date: Tue, 11 Apr 2023 07:39:16 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-12 16:00:05.818711
- Title: Soft Dynamic Time Warping for Multi-Pitch Estimation and Beyond
- Title(参考訳): マルチピッチ推定のためのソフトダイナミック・タイムワープ
- Authors: Michael Krause, Christof Wei{\ss}, Meinard M\"uller
- Abstract要約: ソフトダイナミック・タイム・ワープ(SoftDTW)がCTCの代替となることを示す。
以上の結果から,SoftDTWはCTCの最先端のマルチラベル拡張と同等の結果が得られることを示す。
- 参考スコア(独自算出の注目度): 0.483420384410068
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many tasks in music information retrieval (MIR) involve weakly aligned data,
where exact temporal correspondences are unknown. The connectionist temporal
classification (CTC) loss is a standard technique to learn feature
representations based on weakly aligned training data. However, CTC is limited
to discrete-valued target sequences and can be difficult to extend to
multi-label problems. In this article, we show how soft dynamic time warping
(SoftDTW), a differentiable variant of classical DTW, can be used as an
alternative to CTC. Using multi-pitch estimation as an example scenario, we
show that SoftDTW yields results on par with a state-of-the-art multi-label
extension of CTC. In addition to being more elegant in terms of its algorithmic
formulation, SoftDTW naturally extends to real-valued target sequences.
- Abstract(参考訳): 音楽情報検索(MIR)における多くのタスクは、正確な時間的対応が不明な弱い整列データを含む。
コネクショニスト時間分類(ctc)損失は、弱いアライントレーニングデータに基づいて特徴表現を学ぶための標準的な手法である。
しかし、CTCは離散値のターゲットシーケンスに限られており、マルチラベル問題に拡張することは困難である。
本稿では,従来のDTWの微分可能な変種であるSoftDTW(SoftDTW)が,CTCの代替としてどのように使用できるかを示す。
マルチピッチ推定を例に挙げると,SoftDTW は CTC の最先端のマルチラベル拡張と同等の結果が得られることを示す。
アルゴリズムの定式化に関してよりエレガントなことに加えて、SoftDTWは自然に実数値のターゲットシーケンスにまで拡張する。
関連論文リスト
- Temporal-aware Hierarchical Mask Classification for Video Semantic
Segmentation [62.275143240798236]
ビデオセマンティックセグメンテーションデータセットは、ビデオ毎のカテゴリが限られている。
VSSトレーニング中に意味のある勾配更新を受けるために、クエリの10%未満がマッチする可能性がある。
提案手法は,最新のVSSベンチマークVSPWにおいてベルやホイッスルを使わずに,最先端の性能を実現する。
論文 参考訳(メタデータ) (2023-09-14T20:31:06Z) - OTW: Optimal Transport Warping for Time Series [75.69837166816501]
動的時間温暖化(DTW)は時系列間の距離を測定するための実用的な選択肢となっている。
最適アライメント行列を正確に計算する必要がある場合、それは避けられない二次時間複雑性に悩まされる。
我々は、OTW(Optimal Transport Warping)と呼ばれる、最適輸送フレームワークに基づく時系列データのための新しいメトリクスを導入する。
論文 参考訳(メタデータ) (2023-06-01T12:45:00Z) - Deep Declarative Dynamic Time Warping for End-to-End Learning of
Alignment Paths [54.53208538517505]
本稿では、動的時間ワープ(DTW)による時間的アライメントステップを含む時系列データのエンドツーエンド学習モデルについて述べる。
そこで我々は,2レベル最適化とDecDTWと呼ばれる深層宣言ネットワークに基づくDTW層を提案する。
この特性は、下流損失関数が最適アライメントパス自身で定義されるアプリケーションに特に有用であることを示す。
論文 参考訳(メタデータ) (2023-03-19T21:58:37Z) - FormerTime: Hierarchical Multi-Scale Representations for Multivariate
Time Series Classification [53.55504611255664]
formerTimeは、多変量時系列分類タスクの分類能力を改善する階層的表現モデルである。
1)時系列データから階層的なマルチスケール表現を学習し、(2)トランスフォーマーと畳み込みネットワークの強さを継承し、(3)自己維持メカニズムによって引き起こされる効率の課題に取り組む。
論文 参考訳(メタデータ) (2023-02-20T07:46:14Z) - Approximating DTW with a convolutional neural network on EEG data [9.409281517596396]
動的時間ラッピング(DTW)の高速かつ微分可能な近似法を提案する。
提案手法は,計算効率が向上した他のDTW主近似と同等以上の精度が得られることを示す。
論文 参考訳(メタデータ) (2023-01-30T13:27:47Z) - LB-SimTSC: An Efficient Similarity-Aware Graph Neural Network for
Semi-Supervised Time Series Classification [4.7828959446344275]
本稿では,新しいグラフ構築モジュールを用いた,効率的な半教師付き時系列分類手法 LB-SimTSC を提案する。
LB_Keoghを用いてペア距離行列を構築し,グラフニューラルネットワークのためのグラフを構築する。
その結果、大規模なデータセット上でグラフを構築する場合、このアプローチはSimTSCの最大104倍高速であることが示された。
論文 参考訳(メタデータ) (2023-01-12T06:49:55Z) - Scaling Multimodal Pre-Training via Cross-Modality Gradient
Harmonization [68.49738668084693]
自己教師付き事前学習は、最近、大規模マルチモーダルデータで成功している。
クロスモダリティアライメント(CMA)は、弱くノイズの多い監視である。
CMAは、モダリティ間の衝突や偏見を引き起こす可能性がある。
論文 参考訳(メタデータ) (2022-11-03T18:12:32Z) - Towards Similarity-Aware Time-Series Classification [51.2400839966489]
時系列データマイニングの基本課題である時系列分類(TSC)について検討する。
グラフニューラルネットワーク(GNN)を用いて類似情報をモデル化するフレームワークであるSimTSCを提案する。
論文 参考訳(メタデータ) (2022-01-05T02:14:57Z) - Time-Series Representation Learning via Temporal and Contextual
Contrasting [14.688033556422337]
時間・文脈コントラスト(TS-TCC)を用いた教師なし時系列表現学習フレームワークを提案する。
第一に、生の時系列データは、弱い、強い拡張を用いて、2つの異なる相関するビューに変換される。
第2に,厳密な横断的予測タスクを設計することにより,頑健な時間的表現を学習するための新しい時間的コントラストモジュールを提案する。
第三に、識別的表現をさらに学習するために、時間的コントラストモジュールからコンテキスト上に構築された文脈的コントラストモジュールを提案する。
論文 参考訳(メタデータ) (2021-06-26T23:56:31Z) - TC-DTW: Accelerating Multivariate Dynamic Time Warping Through Triangle
Inequality and Point Clustering [6.502892821109196]
今日最もよく使われているアルゴリズムは17年前に開発されたアルゴリズムである。
tc-dtwと名付けられた新しいソリューションは、三角不等式と点クラスタリングをアルゴリズム設計に導入する。
DTWをベースとした近接探索実験では、新しい解は最大98%(平均60%)のDTW距離計算を回避し、最大25倍(平均7.5倍)のスピードアップをもたらす。
論文 参考訳(メタデータ) (2021-01-15T16:38:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。