論文の概要: Learning Sparse Analytic Filters for Piano Transcription
- arxiv url: http://arxiv.org/abs/2108.10382v1
- Date: Mon, 23 Aug 2021 19:41:11 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-25 23:21:27.442924
- Title: Learning Sparse Analytic Filters for Piano Transcription
- Title(参考訳): ピアノ転写のためのスパース解析フィルタの学習
- Authors: Frank Cwitkowitz, Mojtaba Heydari and Zhiyao Duan
- Abstract要約: フィルタバンク学習は、さまざまなオーディオ関連機械学習タスクにおいて、ますます一般的な戦略になりつつある。
本研究では,ピアノの書き起こしのために,フィルタバンク学習モジュールの様々なバリエーションについて検討した。
- 参考スコア(独自算出の注目度): 21.352141245632247
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In recent years, filterbank learning has become an increasingly popular
strategy for various audio-related machine learning tasks. This is partly due
to its ability to discover task-specific audio characteristics which can be
leveraged in downstream processing. It is also a natural extension of the
nearly ubiquitous deep learning methods employed to tackle a diverse array of
audio applications. In this work, several variations of a frontend filterbank
learning module are investigated for piano transcription, a challenging
low-level music information retrieval task. We build upon a standard piano
transcription model, modifying only the feature extraction stage. The
filterbank module is designed such that its complex filters are unconstrained
1D convolutional kernels with long receptive fields. Additional variations
employ the Hilbert transform to render the filters intrinsically analytic and
apply variational dropout to promote filterbank sparsity. Transcription results
are compared across all experiments, and we offer visualization and analysis of
the filterbanks.
- Abstract(参考訳): 近年,様々な音声関連機械学習タスクにおいて,フィルタバンク学習が普及している。
これは、ダウンストリーム処理で活用できるタスク固有のオーディオ特性を発見する能力に起因している。
また、多種多様なオーディオアプリケーションに取り組むために使用されるほぼユビキタスなディープラーニング手法の自然な拡張でもある。
本研究では,低レベル音楽情報検索の課題であるピアノの書き起こしに対して,フロントエンドフィルタバンク学習モジュールのいくつかのバリエーションについて検討する。
我々は、特徴抽出段階のみを変更する標準的なピアノ転写モデルを構築した。
フィルタバンクモジュールは、複雑なフィルタが長い受容場を持つ1次元畳み込みカーネルであるように設計されている。
追加のバリエーションは、フィルタを本質的に解析し、フィルタバンクの間隔を促進するために変分ドロップアウトを適用するためにヒルベルト変換を用いる。
書き起こし結果はすべての実験で比較され,フィルタバンクの可視化と解析を提供する。
関連論文リスト
- Differentiable All-pole Filters for Time-varying Audio Systems [9.089836388818808]
我々は時間変化のある全極フィルタを再表現し、勾配自体をバックプロパゲートする。
この実装は、効率の良い勾配評価のためにポール付きフィルタを含むオーディオシステムに応用することができる。
本研究では、位相器、時間変化減算合成器、圧縮機上で実世界の動的オーディオシステムをモデル化するための訓練効率と表現能力を示す。
論文 参考訳(メタデータ) (2024-04-11T17:55:05Z) - Filter Pruning for Efficient CNNs via Knowledge-driven Differential
Filter Sampler [103.97487121678276]
フィルタプルーニングは同時に計算を加速し、CNNのメモリオーバーヘッドを低減する。
本稿では,MFM(Masked Filter Modeling)フレームワークを用いた知識駆動型微分フィルタサンプリング(KDFS)を提案する。
論文 参考訳(メタデータ) (2023-07-01T02:28:41Z) - Unrolled Compressed Blind-Deconvolution [77.88847247301682]
sparse multi channel blind deconvolution (S-MBD) はレーダー/ソナー/超音波イメージングなどの多くの工学的応用で頻繁に発生する。
そこで本研究では,受信した全信号に対して,はるかに少ない測定値からブラインドリカバリを可能にする圧縮手法を提案する。
論文 参考訳(メタデータ) (2022-09-28T15:16:58Z) - Filter-enhanced MLP is All You Need for Sequential Recommendation [89.0974365344997]
オンラインプラットフォームでは、ログされたユーザの行動データはノイズを含まないことは避けられない。
周波数領域の雑音を減衰させる信号処理から,フィルタアルゴリズムのアイデアを借用する。
逐次レコメンデーションタスクのための学習可能なフィルタを備えたオールMLPモデルである textbfFMLP-Rec を提案する。
論文 参考訳(メタデータ) (2022-02-28T05:49:35Z) - Learning Filterbanks for End-to-End Acoustic Beamforming [8.721077261941234]
モノラル音源分離に関する最近の研究は, 窓が短い完全学習フィルタバンクを用いることで, 性能を向上できることを示した。
一方、従来のビームフォーミング技術では、長い解析ウィンドウで性能が向上する。
この研究では、これらの2つの世界のギャップを埋め、完全なエンドツーエンドのハイブリッド・ニューラルビームフォーミングを探求する。
論文 参考訳(メタデータ) (2021-11-08T16:36:34Z) - Direct design of biquad filter cascades with deep learning by sampling
random polynomials [5.1118282767275005]
本研究では, 何百万ものランダムフィルタで学習したニューラルネットワークを用いて, フィルタ係数空間に対する目標規模の応答から直接写像を学習する。
提案手法は,所望の応答に対するフィルタ係数の高速かつ高精度な推定を可能にする。
修正Yule-Walkerや勾配降下などの既存手法と比較し,IIRNetが平均的に高速かつ高精度であることを示す。
論文 参考訳(メタデータ) (2021-10-07T17:58:08Z) - Learning Versatile Convolution Filters for Efficient Visual Recognition [125.34595948003745]
本稿では,効率的な畳み込みニューラルネットワーク構築のための多目的フィルタを提案する。
本稿では,ネットワークの複雑性に関する理論的解析を行い,効率的な畳み込み手法を提案する。
ベンチマークデータセットとニューラルネットワークの実験結果は、我々の汎用フィルタが元のフィルタと同等の精度を達成できることを実証している。
論文 参考訳(メタデータ) (2021-09-20T06:07:14Z) - Unsharp Mask Guided Filtering [53.14430987860308]
本論文の目的は,フィルタ中の構造伝達の重要性を強調した画像フィルタリングである。
アンシャープマスキングにインスパイアされたガイドフィルタの新しい簡易な定式化を提案する。
我々の定式化は低域フィルタに先立ってフィルタを楽しみ、単一の係数を推定することで明示的な構造伝達を可能にする。
論文 参考訳(メタデータ) (2021-06-02T19:15:34Z) - Training Interpretable Convolutional Neural Networks by Differentiating
Class-specific Filters [64.46270549587004]
畳み込みニューラルネットワーク(CNN)は、様々なタスクでうまく使われている。
CNNは、しばしば「ブラックボックス」と解釈可能性の欠如とみなされる。
本稿では,クラス固有のフィルタを奨励することで,解釈可能なCNNを訓練する新しい手法を提案する。
論文 参考訳(メタデータ) (2020-07-16T09:12:26Z) - Exploring Filterbank Learning for Keyword Spotting [27.319236923928205]
本稿ではキーワードスポッティングのためのフィルタバンク学習について検討する。
パワースペクトル領域におけるフィルタバンク行列学習と、精神音響的に動機付けられたガンマチャープフィルタバンクのパラメータ学習の2つの手法について検討した。
実験結果から,学習したフィルタバンクと手作り音声の特徴との間には,KWSの精度において統計的に有意な差はないことが明らかとなった。
論文 参考訳(メタデータ) (2020-05-30T08:11:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。