論文の概要: Tempo vs. Pitch: understanding self-supervised tempo estimation
- arxiv url: http://arxiv.org/abs/2304.06868v1
- Date: Fri, 14 Apr 2023 00:08:08 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-17 15:02:33.300346
- Title: Tempo vs. Pitch: understanding self-supervised tempo estimation
- Title(参考訳): tempo vs. pitch: 自己教師付きテンポ推定を理解する
- Authors: Giovana Morais, Matthew E. P. Davies, Marcelo Queiroz, and Magdalena
Fuentes
- Abstract要約: 自己超越法は、人間が生成したラベルを必要としないプレテキストタスクを解くことで表現を学習する。
自己教師型テンポ推定における入力表現とデータ分布の関係について検討する。
- 参考スコア(独自算出の注目度): 0.783970968131292
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Self-supervision methods learn representations by solving pretext tasks that
do not require human-generated labels, alleviating the need for time-consuming
annotations. These methods have been applied in computer vision, natural
language processing, environmental sound analysis, and recently in music
information retrieval, e.g. for pitch estimation. Particularly in the context
of music, there are few insights about the fragility of these models regarding
different distributions of data, and how they could be mitigated. In this
paper, we explore these questions by dissecting a self-supervised model for
pitch estimation adapted for tempo estimation via rigorous experimentation with
synthetic data. Specifically, we study the relationship between the input
representation and data distribution for self-supervised tempo estimation.
- Abstract(参考訳): 自己スーパービジョンメソッドは、人間が生成したラベルを必要としないプリテキストタスクを解決することで表現を学習し、時間のかかるアノテーションの必要性を軽減する。
これらの手法はコンピュータビジョン、自然言語処理、環境音解析、近年ではピッチ推定などの音楽情報検索に応用されている。
特に音楽の文脈では、異なるデータの分布に関するこれらのモデルの脆弱性や、それらをどのように緩和するかについての知見はほとんどない。
本稿では,合成データを用いた厳密な実験を通じて,テンポ推定に適したピッチ推定のための自己教師付きモデルについて検討する。
具体的には,自己教師付きテンポ推定のための入力表現とデータ分布の関係について検討する。
関連論文リスト
- A Survey on Diffusion Models for Time Series and Spatio-Temporal Data [92.1255811066468]
時系列データの研究は、時間とともにトレンドや異常を理解するために不可欠であり、様々な分野にわたる予測的な洞察を可能にする。
近年,拡散モデルが時系列やS時間データマイニングに広く応用されている。
時系列およびS時間データにおける拡散モデルの利用について概説し、それらをモデルカテゴリ、タスクタイプ、データモダリティ、実用的なアプリケーションドメインで分類する。
本調査は,医療,レコメンデーション,気候,エネルギー,オーディオ,交通など,さまざまな分野の応用を幅広くカバーしている。
論文 参考訳(メタデータ) (2024-04-29T17:19:40Z) - Tempo estimation as fully self-supervised binary classification [6.255143207183722]
ラベル付きデータに依存しない完全自己教師型アプローチを提案する。
提案手法は,テンポに関する情報を含む様々な特性を,すでに汎用的な(音楽的な)オーディオ埋め込みがエンコードしているという事実に基づいている。
論文 参考訳(メタデータ) (2024-01-17T00:15:16Z) - Bring Your Own Data! Self-Supervised Evaluation for Large Language
Models [52.15056231665816]
大規模言語モデル(LLM)の自己教師型評価のためのフレームワークを提案する。
閉書知識,毒性,長期文脈依存性を測定するための自己指導型評価戦略を実証する。
自己監督評価と人監督評価との間には強い相関関係が認められた。
論文 参考訳(メタデータ) (2023-06-23T17:59:09Z) - EAMDrift: An interpretable self retrain model for time series [0.0]
EAMDrift(EAMDrift)は、複数の個人予測器から予測を合成し、性能指標に従って予測を重み付けする新しい手法である。
EAMDriftはデータのアウト・オブ・ディストリビューションパターンに自動的に適応し、各瞬間に使用する最も適切なモデルを特定するように設計されている。
本研究は,EAMDriftが個々のベースラインモデルより20%優れ,非解釈可能なアンサンブルモデルに匹敵する精度が得られることを示す。
論文 参考訳(メタデータ) (2023-05-31T13:25:26Z) - Interpretation of Time-Series Deep Models: A Survey [27.582644914283136]
本稿では,バックプロパゲーション,摂動,近似に基づく時系列モデルに対する多種多様なポストホック解釈手法を提案する。
また、人間の理解可能な情報がモデル内で設計される新しい解釈のカテゴリである、本質的に解釈可能なモデルにも焦点をあてたいと考えています。
論文 参考訳(メタデータ) (2023-05-23T23:43:26Z) - TempSAL -- Uncovering Temporal Information for Deep Saliency Prediction [56.22339016797785]
本稿では,逐次時間間隔でサリエンシマップを出力する新たなサリエンシ予測モデルを提案する。
提案手法は,学習した時間マップを組み合わせることで,サリエンシ予測を局所的に調整する。
私たちのコードはGitHubで公開されます。
論文 参考訳(メタデータ) (2023-01-05T22:10:16Z) - Generic Temporal Reasoning with Differential Analysis and Explanation [61.96034987217583]
時間差分解析でギャップを埋めるTODAYという新しいタスクを導入する。
TODAYは、システムがインクリメンタルな変化の効果を正しく理解できるかどうかを評価する。
共同学習においてTODAYの指導スタイルと説明アノテーションが有効であることを示す。
論文 参考訳(メタデータ) (2022-12-20T17:40:03Z) - TACTiS: Transformer-Attentional Copulas for Time Series [76.71406465526454]
時間変化量の推定は、医療や金融などの分野における意思決定の基本的な構成要素である。
本稿では,アテンションベースデコーダを用いて関節分布を推定する多元的手法を提案する。
本研究では,本モデルが実世界の複数のデータセットに対して最先端の予測を生成することを示す。
論文 参考訳(メタデータ) (2022-02-07T21:37:29Z) - Learning with Instance Bundles for Reading Comprehension [61.823444215188296]
質問応答スコアを複数の関連インスタンスで比較する新しい監視手法を提案する。
具体的には、密接に対照的な質問や回答のさまざまな近所でこれらのスコアを正規化します。
2つのデータセット上のインスタンスバンドルによるトレーニングの有効性を実証的に実証する。
論文 参考訳(メタデータ) (2021-04-18T06:17:54Z) - Evaluation of Local Explanation Methods for Multivariate Time Series
Forecasting [0.21094707683348418]
局所的解釈可能性は、モデルが特定の予測を行う理由を決定する上で重要である。
近年、AIの解釈可能性に焦点が当てられているが、時系列予測のための局所的な解釈可能性手法の研究は不足している。
論文 参考訳(メタデータ) (2020-09-18T21:15:28Z) - TSInsight: A local-global attribution framework for interpretability in
time-series data [5.174367472975529]
本稿では,分類器からの勾配と再構成ペナルティに基づいて,その出力に疎性誘導ノルムを付与した自動エンコーダを提案する。
TSInsightは、分類器による予測に重要な機能を保存することを学び、無関係な機能を抑制する。
他のほとんどの属性フレームワークとは対照的に、TSInsightはインスタンスベースの説明とモデルベースの説明の両方を生成することができる。
論文 参考訳(メタデータ) (2020-04-06T19:34:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。