論文の概要: On Filter Generalization for Music Bandwidth Extension Using Deep Neural
Networks
- arxiv url: http://arxiv.org/abs/2011.07274v2
- Date: Wed, 6 Jan 2021 08:45:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-25 13:18:41.742325
- Title: On Filter Generalization for Music Bandwidth Extension Using Deep Neural
Networks
- Title(参考訳): ディープニューラルネットワークを用いた音楽帯域拡張のためのフィルタ一般化について
- Authors: Serkan Sulun, Matthew E. P. Davies
- Abstract要約: ディープニューラルネットワークを用いて帯域幅拡張問題を定式化し、帯域幅制限信号がネットワークへの入力として提供される。
本研究の主な貢献は,ネットワークのトレーニングおよびテストにおいて,低域通過フィルタの選択が与える影響である。
本稿では,トレーニング中に複数の低域通過フィルタを利用するデータ拡張戦略を提案する。
- 参考スコア(独自算出の注目度): 0.40611352512781856
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we address a sub-topic of the broad domain of audio
enhancement, namely musical audio bandwidth extension. We formulate the
bandwidth extension problem using deep neural networks, where a band-limited
signal is provided as input to the network, with the goal of reconstructing a
full-bandwidth output. Our main contribution centers on the impact of the
choice of low pass filter when training and subsequently testing the network.
For two different state of the art deep architectures, ResNet and U-Net, we
demonstrate that when the training and testing filters are matched,
improvements in signal-to-noise ratio (SNR) of up to 7dB can be obtained.
However, when these filters differ, the improvement falls considerably and
under some training conditions results in a lower SNR than the band-limited
input. To circumvent this apparent overfitting to filter shape, we propose a
data augmentation strategy which utilizes multiple low pass filters during
training and leads to improved generalization to unseen filtering conditions at
test time.
- Abstract(参考訳): 本稿では,音楽帯域幅拡張(musical audio bandwidth extension)という,幅広い音声強調領域のサブトピックについて述べる。
本稿では,全帯域幅出力の再構成を目標とし,帯域制限信号がネットワークへの入力として提供されるディープニューラルネットワークを用いて帯域拡張問題を定式化する。
本研究の主な貢献は,ネットワークのトレーニングおよびテストにおいて,低域通過フィルタの選択が与える影響である。
ResNetとU-Netの2つの異なる技術状況において、トレーニングとテストのフィルタが一致した場合、最大7dBの信号-雑音比(SNR)の改善が得られることを示す。
しかし、これらのフィルタが異なる場合、改善は著しく低下し、一部の訓練条件下では帯域制限入力よりも低いSNRが得られる。
この明らかなフィルタ形状への過剰フィットを回避するために,訓練中に複数のローパスフィルタを用いたデータ拡張戦略を提案する。
関連論文リスト
- FilterNet: Harnessing Frequency Filters for Time Series Forecasting [34.83702192033196]
FilterNetは、時系列信号の特定の成分を選択的に通過または減衰させることにより、重要な情報的時間パターンを抽出するために、我々の提案した学習可能な周波数フィルタ上に構築されている。
2つのフィルタを備えることで、FilterNetは、時系列文学で広く採用されている線形およびアテンションマッピングを概ねサロゲートすることができる。
論文 参考訳(メタデータ) (2024-11-03T16:20:41Z) - Music Enhancement with Deep Filters: A Technical Report for The ICASSP 2024 Cadenza Challenge [9.148696434829189]
この課題では、DeepfilterNetからディープフィルタを分離し、Spec-UNetベースのネットワークに組み込んで、ハイブリッドなDemucs(hdemucs)ベースのリミックスパイプラインをさらに改善します。
論文 参考訳(メタデータ) (2024-04-17T07:01:29Z) - Filter-enhanced MLP is All You Need for Sequential Recommendation [89.0974365344997]
オンラインプラットフォームでは、ログされたユーザの行動データはノイズを含まないことは避けられない。
周波数領域の雑音を減衰させる信号処理から,フィルタアルゴリズムのアイデアを借用する。
逐次レコメンデーションタスクのための学習可能なフィルタを備えたオールMLPモデルである textbfFMLP-Rec を提案する。
論文 参考訳(メタデータ) (2022-02-28T05:49:35Z) - The Pseudo Projection Operator: Applications of Deep Learning to
Projection Based Filtering in Non-Trivial Frequency Regimes [5.632784019776093]
本稿では,ニューラルネットワークを利用して周波数選択を行うPseudo Projection Operator(PPO)を提案する。
我々は,ロチェスター大学マルチモーダル・ミュージック・パフォーマンス・データセット上で,PPO,PO,DAEのフィルタリング機能を比較した。
ほとんどの実験では、PPOはPOとDAEの両方より優れています。
論文 参考訳(メタデータ) (2021-11-13T16:09:14Z) - A Machine-Learning-Based Direction-of-Origin Filter for the
Identification of Radio Frequency Interference in the Search for
Technosignatures [0.0]
畳み込みニューラルネットワーク(CNN)は、既存のフィルタに対して有望な補完を提供する。
我々は、あるスキャンで検出された信号が別のスキャンに存在するかどうかを判定できるCNNを設計し、訓練した。
このCNNベースのDoOフィルタは、ベースライン2D相関モデルと既存のDoOフィルタの両方を、さまざまなメトリクスで上回る。
論文 参考訳(メタデータ) (2021-07-28T20:22:39Z) - Message Passing in Graph Convolution Networks via Adaptive Filter Banks [81.12823274576274]
我々は BankGCN と呼ばれる新しいグラフ畳み込み演算子を提案する。
グラフ上のマルチチャネル信号をサブスペースに分解し、各サブスペース内の特定の情報を適応フィルタで処理する。
ベンチマークグラフデータセットの集合におけるグラフ分類における優れたパフォーマンスを実現する。
論文 参考訳(メタデータ) (2021-06-18T04:23:34Z) - Graph Neural Networks with Adaptive Frequency Response Filter [55.626174910206046]
適応周波数応答フィルタを用いたグラフニューラルネットワークフレームワークAdaGNNを開発した。
提案手法の有効性を,様々なベンチマークデータセット上で実証的に検証した。
論文 参考訳(メタデータ) (2021-04-26T19:31:21Z) - Dependency Aware Filter Pruning [74.69495455411987]
重要でないフィルタを割ることは、推論コストを軽減するための効率的な方法である。
以前の作業は、その重み基準やそれに対応するバッチノームスケーリング要因に従ってフィルタをプルークする。
所望の空間性を達成するために,空間性誘導正規化を動的に制御する機構を提案する。
論文 参考訳(メタデータ) (2020-05-06T07:41:22Z) - Filter Grafting for Deep Neural Networks: Reason, Method, and
Cultivation [86.91324735966766]
フィルタは現代の畳み込みニューラルネットワーク(CNN)のキーコンポーネントである
本稿では,この目的を達成するためにフィルタグラフト(textbfMethod)を導入する。
我々は,フィルタの情報を測定するための新しい基準と,グラフトされた情報をネットワーク間でバランスをとるための適応重み付け戦略を開発する。
論文 参考訳(メタデータ) (2020-04-26T08:36:26Z) - Filter Grafting for Deep Neural Networks [71.39169475500324]
ディープニューラルネットワーク(DNN)の表現能力向上を目的としたフィルタグラフト
我々は,フィルタの情報を測定するエントロピーベースの基準と,ネットワーク間のグラフト情報のバランスをとるための適応重み付け戦略を開発する。
例えば、グラフトされたMobileNetV2は、CIFAR-100データセットで非グラフトされたMobileNetV2を約7%上回っている。
論文 参考訳(メタデータ) (2020-01-15T03:18:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。