論文の概要: Wavelet Fourier Diffuser: Frequency-Aware Diffusion Model for Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2509.19305v1
- Date: Thu, 04 Sep 2025 08:50:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-28 15:30:14.40185
- Title: Wavelet Fourier Diffuser: Frequency-Aware Diffusion Model for Reinforcement Learning
- Title(参考訳): ウェーブレットフーリエディフューザ:強化学習のための周波数対応拡散モデル
- Authors: Yifu Luo, Yongzhe Chang, Xueqian Wang,
- Abstract要約: 本稿では、離散ウェーブレット変換を統合してトラジェクトリを低周波成分と高周波成分に分解する拡散型RLフレームワークを提案する。
WFDiffuserは、周波数シフトを効果的に軽減し、スムーズで安定した軌道となり、意思決定性能が向上する。
- 参考スコア(独自算出の注目度): 10.270002679268485
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diffusion probability models have shown significant promise in offline reinforcement learning by directly modeling trajectory sequences. However, existing approaches primarily focus on time-domain features while overlooking frequency-domain features, leading to frequency shift and degraded performance according to our observation. In this paper, we investigate the RL problem from a new perspective of the frequency domain. We first observe that time-domain-only approaches inadvertently introduce shifts in the low-frequency components of the frequency domain, which results in trajectory instability and degraded performance. To address this issue, we propose Wavelet Fourier Diffuser (WFDiffuser), a novel diffusion-based RL framework that integrates Discrete Wavelet Transform to decompose trajectories into low- and high-frequency components. To further enhance diffusion modeling for each component, WFDiffuser employs Short-Time Fourier Transform and cross attention mechanisms to extract frequency-domain features and facilitate cross-frequency interaction. Extensive experiment results on the D4RL benchmark demonstrate that WFDiffuser effectively mitigates frequency shift, leading to smoother, more stable trajectories and improved decision-making performance over existing methods.
- Abstract(参考訳): 拡散確率モデルは、軌道列を直接モデル化することでオフライン強化学習において大きな可能性を示してきた。
しかし,既存手法は主に時間領域の特徴に着目し,周波数領域の特徴を見落とし,周波数シフトや性能低下の原因となっている。
本稿では,周波数領域の新しい視点からRL問題を考察する。
まず、時間領域のみのアプローチが周波数領域の低周波成分の変化を必然的に導入し、軌道不安定性と劣化性能をもたらすことを観察する。
本稿では、離散ウェーブレット変換を統合して低周波成分と高周波成分に分解する新しい拡散型RLフレームワークであるWavelet Fourier Diffuser(WFDiffuser)を提案する。
WFDiffuserは各コンポーネントの拡散モデリングをさらに強化するため、ショートタイムフーリエ変換とクロスアテンション機構を用いて周波数領域の特徴を抽出し、周波数間相互作用を容易にする。
D4RLベンチマークの大規模な実験結果から,WFDiffuserは周波数シフトを効果的に軽減し,よりスムーズで安定な軌道となり,既存の手法よりも意思決定性能が向上することが示された。
関連論文リスト
- Frequency-Constrained Learning for Long-Term Forecasting [15.31488551912888]
実世界の時系列は、物理法則、人間のルーチン、季節周期から生じる強い周期構造を示す。
現代の深層予測モデルは、スペクトルバイアスと周波数認識による誘導前兆の欠如により、繰り返し発生するパターンを捉えることができないことが多い。
本稿では,周期性を明示的にモデル化し,長期予測を効果的に行う手法を提案する。
論文 参考訳(メタデータ) (2025-08-02T22:12:15Z) - LSCD: Lomb-Scargle Conditioned Diffusion for Time series Imputation [55.800319453296886]
欠落または不規則なサンプルデータを持つ時系列は、機械学習において永続的な課題である。
我々は,不規則サンプルデータのパワースペクトルの信頼性の高い計算を可能にする,異なるLombiable-Scargle層を導入する。
論文 参考訳(メタデータ) (2025-06-20T14:48:42Z) - Freqformer: Image-Demoiréing Transformer via Efficient Frequency Decomposition [83.40450475728792]
本稿では,Freqformerについて述べる。Freqformerは,ターゲット周波数分離による画像復号化に特化して設計されたトランスフォーマーベースのフレームワークである。
本手法は,モワールパターンを高周波数空間局在化テクスチャと低周波数スケールローバスト色歪みに明確に分割する有効な周波数分解を行う。
様々なデモアのベンチマーク実験により、Freqformerは、コンパクトなモデルサイズで最先端のパフォーマンスを達成することを示した。
論文 参考訳(メタデータ) (2025-05-25T12:23:10Z) - A Fourier Space Perspective on Diffusion Models [6.834230686279937]
拡散モデルは、画像、オーディオ、タンパク質、材料などのデータモダリティに関する最先端の生成モデルである。
フーリエ空間における拡散モデルの前方過程の帰納バイアスについて検討する。
論文 参考訳(メタデータ) (2025-05-16T14:13:02Z) - Frequency-Aware Deepfake Detection: Improving Generalizability through
Frequency Space Learning [81.98675881423131]
この研究は、目に見えないディープフェイク画像を効果的に識別できるユニバーサルディープフェイク検出器を開発するという課題に対処する。
既存の周波数ベースのパラダイムは、偽造検出のためにGANパイプラインのアップサンプリング中に導入された周波数レベルのアーティファクトに依存している。
本稿では、周波数領域学習を中心にしたFreqNetと呼ばれる新しい周波数認識手法を導入し、ディープフェイク検出器の一般化性を高めることを目的とする。
論文 参考訳(メタデータ) (2024-03-12T01:28:00Z) - Time Series Diffusion in the Frequency Domain [54.60573052311487]
周波数領域における時系列表現がスコアベース拡散モデルに有用な帰納バイアスであるか否かを解析する。
重要なニュアンスを持つ周波数領域において、二重拡散過程が生じることを示す。
周波数領域に拡散モデルを実装するために,デノナイジングスコアマッチング手法を適用する方法を示す。
論文 参考訳(メタデータ) (2024-02-08T18:59:05Z) - Transform Once: Efficient Operator Learning in Frequency Domain [69.74509540521397]
本研究では、周波数領域の構造を利用して、空間や時間における長距離相関を効率的に学習するために設計されたディープニューラルネットワークについて検討する。
この研究は、単一変換による周波数領域学習のための青写真を導入している。
論文 参考訳(メタデータ) (2022-11-26T01:56:05Z) - Fast Sampling of Diffusion Models via Operator Learning [74.37531458470086]
我々は,拡散モデルのサンプリング過程を高速化するために,確率フロー微分方程式の効率的な解法であるニューラル演算子を用いる。
シーケンシャルな性質を持つ他の高速サンプリング手法と比較して、並列復号法を最初に提案する。
本稿では,CIFAR-10では3.78、ImageNet-64では7.83の最先端FIDを1モデル評価環境で達成することを示す。
論文 参考訳(メタデータ) (2022-11-24T07:30:27Z) - A Time-domain Generalized Wiener Filter for Multi-channel Speech
Separation [11.970226369922598]
周波数領域ニューラルビームフォーマは、近年のマルチチャネル音声分離モデルの主流手法である。
本稿では、従来の周波数領域ビームフォーマの拡張として、時間領域ワイナー一般化フィルタ(TD-GWF)を提案する。
実験結果から,周波数領域ビームフォーマをTD-GWFに置き換えることで,大幅な性能向上が達成できた。
論文 参考訳(メタデータ) (2021-12-07T07:16:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。