Fugu-MT 論文翻訳(概要): Tempo vs. Pitch: understanding self-supervised tempo estimation

論文の概要: Tempo vs. Pitch: understanding self-supervised tempo estimation

arxiv url: http://arxiv.org/abs/2304.06868v1
Date: Fri, 14 Apr 2023 00:08:08 GMT
ステータス: 翻訳完了
システム内更新日: 2023-04-17 15:02:33.300346
Title: Tempo vs. Pitch: understanding self-supervised tempo estimation
Title（参考訳）: tempo vs. pitch: 自己教師付きテンポ推定を理解する
Authors: Giovana Morais, Matthew E. P. Davies, Marcelo Queiroz, and Magdalena Fuentes
Abstract要約: 自己超越法は、人間が生成したラベルを必要としないプレテキストタスクを解くことで表現を学習する。自己教師型テンポ推定における入力表現とデータ分布の関係について検討する。
参考スコア（独自算出の注目度）: 0.783970968131292
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Self-supervision methods learn representations by solving pretext tasks that do not require human-generated labels, alleviating the need for time-consuming annotations. These methods have been applied in computer vision, natural language processing, environmental sound analysis, and recently in music information retrieval, e.g. for pitch estimation. Particularly in the context of music, there are few insights about the fragility of these models regarding different distributions of data, and how they could be mitigated. In this paper, we explore these questions by dissecting a self-supervised model for pitch estimation adapted for tempo estimation via rigorous experimentation with synthetic data. Specifically, we study the relationship between the input representation and data distribution for self-supervised tempo estimation.
Abstract（参考訳）: 自己スーパービジョンメソッドは、人間が生成したラベルを必要としないプリテキストタスクを解決することで表現を学習し、時間のかかるアノテーションの必要性を軽減する。これらの手法はコンピュータビジョン、自然言語処理、環境音解析、近年ではピッチ推定などの音楽情報検索に応用されている。特に音楽の文脈では、異なるデータの分布に関するこれらのモデルの脆弱性や、それらをどのように緩和するかについての知見はほとんどない。本稿では,合成データを用いた厳密な実験を通じて,テンポ推定に適したピッチ推定のための自己教師付きモデルについて検討する。具体的には,自己教師付きテンポ推定のための入力表現とデータ分布の関係について検討する。

関連論文リスト

Context is Key: A Benchmark for Forecasting with Essential Textual Information [87.3175915185287]
コンテキスト・イズ・キー (Context is Key) (CiK) は、時系列予測ベンチマークであり、様々な種類のテキストコンテキストと数値データをペアリングする。我々は,統計モデル,時系列基礎モデル,LLMに基づく予測モデルなど,さまざまなアプローチを評価する。実験では、文脈情報の導入の重要性を強調し、LLMに基づく予測モデルを用いた場合の驚くべき性能を示すとともに、それらの重要な欠点を明らかにした。
論文参考訳（メタデータ） (2024-10-24T17:56:08Z)
XForecast: Evaluating Natural Language Explanations for Time Series Forecasting [72.57427992446698]
時系列予測は、特に正確な予測に依存するステークホルダーにとって、意思決定を支援する。伝統的に説明可能なAI(XAI)メソッドは、機能や時間的重要性を基盤とするものであり、専門家の知識を必要とすることが多い。時系列データにおける複雑な因果関係のため,予測NLEの評価は困難である。
論文参考訳（メタデータ） (2024-10-18T05:16:39Z)
From Link Prediction to Forecasting: Addressing Challenges in Batch-based Temporal Graph Learning [0.716879432974126]
バッチ指向評価の適合性はデータセットの特性に依存することを示す。連続時間時間グラフの場合、固定サイズのバッチは異なる期間の時間ウィンドウを生成し、不整合な動的リンク予測タスクをもたらす。離散時間時間時間グラフの場合、バッチのシーケンスはデータに存在しない時間的依存関係を付加することができる。
論文参考訳（メタデータ） (2024-06-07T12:45:12Z)
A Survey on Diffusion Models for Time Series and Spatio-Temporal Data [92.1255811066468]
時系列およびS時間データにおける拡散モデルの使用について概観し、それらをモデル、タスクタイプ、データモダリティ、実用的なアプリケーションドメインで分類する。我々は拡散モデルを無条件型と条件付き型に分類し、時系列とS時間データを別々に議論する。本調査は,医療,レコメンデーション,気候,エネルギー,オーディオ,交通など,さまざまな分野の応用を幅広くカバーしている。
論文参考訳（メタデータ） (2024-04-29T17:19:40Z)
Tempo estimation as fully self-supervised binary classification [6.255143207183722]
ラベル付きデータに依存しない完全自己教師型アプローチを提案する。提案手法は,テンポに関する情報を含む様々な特性を,すでに汎用的な(音楽的な)オーディオ埋め込みがエンコードしているという事実に基づいている。
論文参考訳（メタデータ） (2024-01-17T00:15:16Z)
Bring Your Own Data! Self-Supervised Evaluation for Large Language Models [52.15056231665816]
大規模言語モデル(LLM)の自己教師型評価のためのフレームワークを提案する。閉書知識,毒性,長期文脈依存性を測定するための自己指導型評価戦略を実証する。自己監督評価と人監督評価との間には強い相関関係が認められた。
論文参考訳（メタデータ） (2023-06-23T17:59:09Z)
Interpretation of Time-Series Deep Models: A Survey [27.582644914283136]
本稿では,バックプロパゲーション,摂動,近似に基づく時系列モデルに対する多種多様なポストホック解釈手法を提案する。また、人間の理解可能な情報がモデル内で設計される新しい解釈のカテゴリである、本質的に解釈可能なモデルにも焦点をあてたいと考えています。
論文参考訳（メタデータ） (2023-05-23T23:43:26Z)
TempSAL -- Uncovering Temporal Information for Deep Saliency Prediction [64.63645677568384]
本稿では,逐次時間間隔でサリエンシマップを出力する新たなサリエンシ予測モデルを提案する。提案手法は,学習した時間マップを組み合わせることで,サリエンシ予測を局所的に調整する。私たちのコードはGitHubで公開されます。
論文参考訳（メタデータ） (2023-01-05T22:10:16Z)
Generic Temporal Reasoning with Differential Analysis and Explanation [61.96034987217583]
時間差分解析でギャップを埋めるTODAYという新しいタスクを導入する。 TODAYは、システムがインクリメンタルな変化の効果を正しく理解できるかどうかを評価する。共同学習においてTODAYの指導スタイルと説明アノテーションが有効であることを示す。
論文参考訳（メタデータ） (2022-12-20T17:40:03Z)
TACTiS: Transformer-Attentional Copulas for Time Series [76.71406465526454]
時間変化量の推定は、医療や金融などの分野における意思決定の基本的な構成要素である。本稿では,アテンションベースデコーダを用いて関節分布を推定する多元的手法を提案する。本研究では,本モデルが実世界の複数のデータセットに対して最先端の予測を生成することを示す。
論文参考訳（メタデータ） (2022-02-07T21:37:29Z)
Evaluation of Local Explanation Methods for Multivariate Time Series Forecasting [0.21094707683348418]
局所的解釈可能性は、モデルが特定の予測を行う理由を決定する上で重要である。近年、AIの解釈可能性に焦点が当てられているが、時系列予測のための局所的な解釈可能性手法の研究は不足している。
論文参考訳（メタデータ） (2020-09-18T21:15:28Z)
TSInsight: A local-global attribution framework for interpretability in time-series data [5.174367472975529]
本稿では,分類器からの勾配と再構成ペナルティに基づいて,その出力に疎性誘導ノルムを付与した自動エンコーダを提案する。 TSInsightは、分類器による予測に重要な機能を保存することを学び、無関係な機能を抑制する。他のほとんどの属性フレームワークとは対照的に、TSInsightはインスタンスベースの説明とモデルベースの説明の両方を生成することができる。
論文参考訳（メタデータ） (2020-04-06T19:34:25Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。