論文の概要: Gradient-based Optimisation of Modulation Effects
- arxiv url: http://arxiv.org/abs/2601.04867v1
- Date: Thu, 08 Jan 2026 12:04:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-09 17:01:53.191919
- Title: Gradient-based Optimisation of Modulation Effects
- Title(参考訳): グラディエントに基づく変調効果の最適化
- Authors: Alistair Carson, Alec Wright, Stefan Bilbao,
- Abstract要約: 本稿では,異なるディジタル信号処理に基づいて,フランガー,コーラス,位相効果をモデル化する枠組みを提案する。
モデルは時間周波数領域でトレーニングされるが、推論時には時間領域で動作し、遅延はゼロである。
アナログ効果ユニットに対して訓練した場合、モデルから出力される音は、参照とは知覚的に区別できない場合もある。
- 参考スコア(独自算出の注目度): 8.97214437002284
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Modulation effects such as phasers, flangers and chorus effects are heavily used in conjunction with the electric guitar. Machine learning based emulation of analog modulation units has been investigated in recent years, but most methods have either been limited to one class of effect or suffer from a high computational cost or latency compared to canonical digital implementations. Here, we build on previous work and present a framework for modelling flanger, chorus and phaser effects based on differentiable digital signal processing. The model is trained in the time-frequency domain, but at inference operates in the time-domain, requiring zero latency. We investigate the challenges associated with gradient-based optimisation of such effects, and show that low-frequency weighting of loss functions avoids convergence to local minima when learning delay times. We show that when trained against analog effects units, sound output from the model is in some cases perceptually indistinguishable from the reference, but challenges still remain for effects with long delay times and feedback.
- Abstract(参考訳): プライヤー、フランガー、コーラスエフェクトなどの変調効果は、エレキギターと組み合わせて多用される。
アナログ変調ユニットの機械学習に基づくエミュレーションは近年研究されているが、ほとんどの手法は1種類の効果に制限されているか、あるいは標準的なデジタル実装と比較して高い計算コストや遅延に悩まされている。
本稿では,従来の研究に基づいて,異なるディジタル信号処理に基づいて,フランガー,コーラス,位相効果をモデル化するためのフレームワークを提案する。
モデルは時間周波数領域でトレーニングされるが、推論時には時間領域で動作し、遅延はゼロである。
このような効果の勾配に基づく最適化にかかわる課題について検討し,低周波の損失関数重み付けが遅延時間学習時の局所最小値への収束を回避していることを示す。
アナログ効果ユニットに対して訓練した場合、モデルから出力される音は、参照と知覚的に区別できない場合もあるが、長い遅延時間やフィードバックを伴う影響については依然として課題が残っている。
関連論文リスト
- Noise Hypernetworks: Amortizing Test-Time Compute in Diffusion Models [57.49136894315871]
テストタイムスケーリングの新しいパラダイムは、推論モデルと生成視覚モデルにおいて驚くべきブレークスルーをもたらした。
本稿では,テスト時間スケーリングの知識をモデルに組み込むことの課題に対する1つの解決策を提案する。
拡散モデルにおいて、初期入力ノイズを変調するノイズハイパーネットワークにより、報酬誘導試験時間雑音の最適化を行う。
論文 参考訳(メタデータ) (2025-08-13T17:33:37Z) - Anti-aliasing of neural distortion effects via model fine tuning [4.751886527142779]
本稿では,教師による微調整手法を用いて,ニューラルモデルにおけるエイリアスを低減する手法を提案する。
本手法は長期記憶ネットワーク(LSTM)と時間畳み込みネットワーク(TCN)のエイリアス化を著しく抑制することを示す。
論文 参考訳(メタデータ) (2025-05-16T15:40:33Z) - Comparative Study of State-based Neural Networks for Virtual Analog Audio Effects Modeling [0.0]
仮想アナログモデリングにおける最近の機械学習の応用について検討する。
我々は、ステートスペースモデルと線形リカレントユニットを、より一般的なLSTMネットワークと比較する。
我々の測定基準は、信号のエネルギーと周波数を正確に再現するモデルの能力を評価することを目的としている。
論文 参考訳(メタデータ) (2024-05-07T08:47:40Z) - Differentiable Grey-box Modelling of Phaser Effects using Frame-based
Spectral Processing [21.053861381437827]
本研究は位相効果をモデル化するデジタル信号処理手法を提案する。
提案モデルでは,周波数領域に時間変化フィルタを実装するために,短いフレームで音声を処理する。
このモデルでは、解釈可能なパラメータと調整可能なパラメータを保持しながら、アナログ参照デバイスをエミュレートするように訓練できることが示される。
論文 参考訳(メタデータ) (2023-06-02T07:53:41Z) - Modelling black-box audio effects with time-varying feature modulation [13.378050193507907]
ファズやダイナミックレンジ圧縮などの音響効果をモデル化する場合,既存のアーキテクチャの幅,深さ,拡張係数のスケーリングは良好な性能を得られないことを示す。
時間的特徴量線形変調を既存の時間的畳み込みバックボーンに統合することを提案する。
提案手法は,時間領域と周波数領域の双方において,ファズ・コンプレッサー実装の長距離依存性をより正確に捉えることができることを示す。
論文 参考訳(メタデータ) (2022-11-01T14:41:57Z) - On Compressing Sequences for Self-Supervised Speech Models [78.62210521316081]
自己教師型学習における時間軸に沿った固定長と可変長のサブサンプリングについて検討した。
可変長サブサンプリングは,低フレームレートで特に良好に動作することがわかった。
音素境界にアクセスできる場合、平均フレームレートが10Hz以下の場合、性能の劣化は見つからない。
論文 参考訳(メタデータ) (2022-10-13T17:10:02Z) - Improving the Performance of Robust Control through Event-Triggered
Learning [74.57758188038375]
LQR問題における不確実性に直面していつ学習するかを決定するイベントトリガー学習アルゴリズムを提案する。
本研究では,ロバストな制御器ベースライン上での性能向上を数値例で示す。
論文 参考訳(メタデータ) (2022-07-28T17:36:37Z) - Real Time Speech Enhancement in the Waveform Domain [99.02180506016721]
本稿では,ラップトップCPU上でリアルタイムに動作する生波形を用いた因果音声強調モデルを提案する。
提案モデルは、スキップ接続を持つエンコーダデコーダアーキテクチャに基づいている。
静止ノイズや非定常ノイズを含む様々な背景ノイズを除去することができる。
論文 参考訳(メタデータ) (2020-06-23T09:19:13Z) - Audio Impairment Recognition Using a Correlation-Based Feature
Representation [85.08880949780894]
本稿では,特徴対の相関に基づく手作り特徴の新しい表現を提案する。
実験段階において,コンパクトな特徴次元と計算速度の向上の観点から,優れた性能を示す。
論文 参考訳(メタデータ) (2020-03-22T13:34:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。