論文の概要: RainDiff: End-to-end Precipitation Nowcasting Via Token-wise Attention Diffusion
- arxiv url: http://arxiv.org/abs/2510.14962v1
- Date: Thu, 16 Oct 2025 17:59:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-17 21:15:14.998286
- Title: RainDiff: End-to-end Precipitation Nowcasting Via Token-wise Attention Diffusion
- Title(参考訳): RainDiff:Token-wise Attention Diffusionによるエンドツーエンドの降雨
- Authors: Thao Nguyen, Jiaqi Ma, Fahad Shahbaz Khan, Souhaib Ben Taieb, Salman Khan,
- Abstract要約: 本稿では,U-Net拡散モデルだけでなく,レーダ時間エンコーダにも統合されたトークンワイドアテンションを提案する。
従来の手法とは異なり,本手法は,画素空間拡散の典型的な高資源コストを発生させることなく,アーキテクチャに注意を集中させる。
実験と評価により,提案手法は複雑な降水予測シナリオにおいて,最先端の手法,ロバストネスの局所的忠実度,一般化,優位性を著しく上回ることを示した。
- 参考スコア(独自算出の注目度): 64.49056527678606
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Precipitation nowcasting, predicting future radar echo sequences from current observations, is a critical yet challenging task due to the inherently chaotic and tightly coupled spatio-temporal dynamics of the atmosphere. While recent advances in diffusion-based models attempt to capture both large-scale motion and fine-grained stochastic variability, they often suffer from scalability issues: latent-space approaches require a separately trained autoencoder, adding complexity and limiting generalization, while pixel-space approaches are computationally intensive and often omit attention mechanisms, reducing their ability to model long-range spatio-temporal dependencies. To address these limitations, we propose a Token-wise Attention integrated into not only the U-Net diffusion model but also the spatio-temporal encoder that dynamically captures multi-scale spatial interactions and temporal evolution. Unlike prior approaches, our method natively integrates attention into the architecture without incurring the high resource cost typical of pixel-space diffusion, thereby eliminating the need for separate latent modules. Our extensive experiments and visual evaluations across diverse datasets demonstrate that the proposed method significantly outperforms state-of-the-art approaches, yielding superior local fidelity, generalization, and robustness in complex precipitation forecasting scenarios.
- Abstract(参考訳): 現在の観測から将来のレーダーエコーシーケンスを予測する降水流は、本質的にカオス的で密結合した大気の時空間ダイナミクスのため、非常に難しい課題である。
遅延空間アプローチでは、個別に訓練されたオートエンコーダを必要とし、複雑さを増し、一般化を制限する一方、ピクセル空間アプローチは計算集約的であり、しばしば注意機構を省略し、長距離時空間依存性をモデル化する能力を減らす。
これらの制約に対処するために,U-Net拡散モデルだけでなく,マルチスケール空間相互作用と時間進化を動的にキャプチャする時空間エンコーダにも統合されたトークンワイドアテンションを提案する。
従来の手法とは異なり,本手法は,画素空間拡散の典型的な高コスト化を伴わずに,アーキテクチャへの注意をネイティブに統合することにより,遅延モジュールを分離する必要がなくなる。
本手法は, 複雑な降水予測シナリオにおいて, 局所的な忠実度, 一般化, 堅牢性を向上し, 最先端の手法を著しく上回ることを示す。
関連論文リスト
- Breaking the Discretization Barrier of Continuous Physics Simulation Learning [16.740327071700268]
本研究では、部分的な観測から連続物理シミュレーションをモデル化する純粋にデータ駆動方式を提案する。
具体的には,空間情報と対応する観測情報を融合して符号化するために,乗法フィルタネットワークを用いる。
我々は、幾何学的グリッドをカスタマイズし、メッセージパッシング機構を使用して、元の空間領域からカスタマイズされたグリッドに特徴をマッピングする。
論文 参考訳(メタデータ) (2025-09-22T16:10:58Z) - ST-GS: Vision-Based 3D Semantic Occupancy Prediction with Spatial-Temporal Gaussian Splatting [21.87807066521776]
3次元占有予測は、視覚中心の自律運転における総合的なシーン理解に不可欠である。
近年, 計算オーバーヘッドを低減しつつ, 3次元意味ガウスモデルを用いて占有率をモデル化する研究が進められている。
本稿では,時空間モデリングと時空間モデリングの両立を図るため,新しい時空間ガウススティング(ST-GS)フレームワークを提案する。
論文 参考訳(メタデータ) (2025-09-20T06:36:30Z) - StateSpaceDiffuser: Bringing Long Context to Diffusion World Models [53.05314852577144]
本稿では、状態空間モデルから機能を統合することで、拡散モデルが長時間コンテキストタスクの実行を可能にするStateSpaceDiffuserを紹介する。
この設計は拡散モデルの高忠実性合成を保ちながら長期記憶を復元する。
実験の結果、StateSpaceDiffuserは強力な拡散のみのベースラインを著しく上回っている。
論文 参考訳(メタデータ) (2025-05-28T11:27:54Z) - Dynamical Diffusion: Learning Temporal Dynamics with Diffusion Models [71.63194926457119]
動的拡散(DyDiff, Dynamical Diffusion)は, 時間的に意識された前と逆のプロセスを含む理論的に健全なフレームワークである。
科学的時間的予測、ビデオ予測、時系列予測に関する実験は、動的拡散が時間的予測タスクのパフォーマンスを一貫して改善することを示した。
論文 参考訳(メタデータ) (2025-03-02T16:10:32Z) - Multi-Agent Path Finding in Continuous Spaces with Projected Diffusion Models [57.45019514036948]
MAPF(Multi-Agent Path Finding)は、ロボット工学における基本的な問題である。
連続空間におけるMAPFの拡散モデルと制約付き最適化を統合する新しい手法を提案する。
論文 参考訳(メタデータ) (2024-12-23T21:27:19Z) - ST-ReP: Learning Predictive Representations Efficiently for Spatial-Temporal Forecasting [7.637123047745445]
自己監督的手法は空間的時間的表現の学習にますます適応している。
現在の値再構成と将来の値予測は、事前学習フレームワークに統合される。
予測能力を高めるために,マルチタイムスケール分析を自己監督的損失に組み込む。
論文 参考訳(メタデータ) (2024-12-19T05:33:55Z) - SFANet: Spatial-Frequency Attention Network for Weather Forecasting [54.470205739015434]
天気予報は様々な分野において重要な役割を担い、意思決定とリスク管理を推進している。
伝統的な手法は、しばしば気象系の複雑な力学を捉えるのに苦労する。
本稿では,これらの課題に対処し,天気予報の精度を高めるための新しい枠組みを提案する。
論文 参考訳(メタデータ) (2024-05-29T08:00:15Z) - Triplet Attention Transformer for Spatiotemporal Predictive Learning [9.059462850026216]
本稿では,フレーム間動的特徴とフレーム内静的特徴の両方を捉えるために,革新的な三重項注意変換器を提案する。
このモデルはトリプレット・アテンション・モジュール(TAM)を組み込んだもので、時間、空間、チャネル次元における自己アテンションのメカニズムを探求することで、従来のリカレント・ユニットを置き換える。
論文 参考訳(メタデータ) (2023-10-28T12:49:33Z) - A Spatial-Temporal Attentive Network with Spatial Continuity for
Trajectory Prediction [74.00750936752418]
空間連続性をもつ空間時間減衰ネットワーク(STAN-SC)という新しいモデルを提案する。
まず、最も有用かつ重要な情報を探るために、空間的時間的注意機構を提示する。
第2に、生成軌道の空間的連続性を維持するために、シーケンスと瞬間状態情報に基づく共同特徴系列を実行する。
論文 参考訳(メタデータ) (2020-03-13T04:35:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。