論文の概要: M3S-Net: Multimodal Feature Fusion Network Based on Multi-scale Data for Ultra-short-term PV Power Forecasting
- arxiv url: http://arxiv.org/abs/2602.19832v1
- Date: Mon, 23 Feb 2026 13:30:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-24 17:42:02.830688
- Title: M3S-Net: Multimodal Feature Fusion Network Based on Multi-scale Data for Ultra-short-term PV Power Forecasting
- Title(参考訳): M3S-Net:極短PV電力予測のためのマルチスケールデータに基づくマルチモーダル特徴融合ネットワーク
- Authors: Penghui Niu, Taotao Cai, Suqi Zhang, Junhua Gu, Ping Zhang, Qiqi Liu, Jianxin Li,
- Abstract要約: 太陽放射の断続性と高周波変動は、高磁束にとって重要な課題である。
既存のアーキテクチャは主に、浅い機能結合とバイナリクラウドセグメンテーションに依存している。
本稿では,超短時間PV電力予測のためのマルチスケールデータに基づく新しいマルチモーダル融合ネットワークであるM3S-Netを提案する。
- 参考スコア(独自算出の注目度): 13.79706446185
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The inherent intermittency and high-frequency variability of solar irradiance, particularly during rapid cloud advection, present significant stability challenges to high-penetration photovoltaic grids. Although multimodal forecasting has emerged as a viable mitigation strategy, existing architectures predominantly rely on shallow feature concatenation and binary cloud segmentation, thereby failing to capture the fine-grained optical features of clouds and the complex spatiotemporal coupling between visual and meteorological modalities. To bridge this gap, this paper proposes M3S-Net, a novel multimodal feature fusion network based on multi-scale data for ultra-short-term PV power forecasting. First, a multi-scale partial channel selection network leverages partial convolutions to explicitly isolate the boundary features of optically thin clouds, effectively transcending the precision limitations of coarse-grained binary masking. Second, a multi-scale sequence to image analysis network employs Fast Fourier Transform (FFT)-based time-frequency representation to disentangle the complex periodicity of meteorological data across varying time horizons. Crucially, the model incorporates a cross-modal Mamba interaction module featuring a novel dynamic C-matrix swapping mechanism. By exchanging state-space parameters between visual and temporal streams, this design conditions the state evolution of one modality on the context of the other, enabling deep structural coupling with linear computational complexity, thus overcoming the limitations of shallow concatenation. Experimental validation on the newly constructed fine-grained PV power dataset demonstrates that M3S-Net achieves a mean absolute error reduction of 6.2% in 10-minute forecasts compared to state-of-the-art baselines. The dataset and source code will be available at https://github.com/she1110/FGPD.
- Abstract(参考訳): 太陽放射の本質的にの断続性と高周波の変動は、特に急激な雲の対流において、高誘電率の光電格子に対して大きな安定性の課題を呈している。
マルチモーダル予測は有効な緩和戦略として現れてきたが、既存のアーキテクチャは主に浅層の特徴結合と二元雲のセグメンテーションに依存しており、雲の微細な光学的特徴と、視覚と気象の複雑な時空間的結合を捉えることができない。
このギャップを埋めるために,超短時間PV電力予測のためのマルチスケールデータに基づく新しいマルチモーダル機能融合ネットワークであるM3S-Netを提案する。
第一に、多スケール部分チャネル選択ネットワークは、部分畳み込みを利用して、光学的に薄い雲の境界特性を明示的に分離し、粗粒二成分マスキングの精度の限界を効果的に超越する。
第2に、Fast Fourier Transform (FFT) ベースの時間周波数表現を用いて、気象データの複雑な周期性を様々な時間的地平線に分散させる。
このモデルには、新しい動的C-行列スワップ機構を備えたクロスモーダルなマンバ相互作用モジュールが組み込まれている。
状態空間パラメータを視覚的ストリームと時間的ストリームの間で交換することにより、この設計条件は一方のモードの状態を他方のコンテキストで変化させ、線形計算複雑性と深い構造的結合を可能にし、浅い結合の限界を克服する。
M3S-Netは10分間の予測で平均6.2%の絶対誤差削減を達成した。
データセットとソースコードはhttps://github.com/she1110/FGPDで入手できる。
関連論文リスト
- DiTS: Multimodal Diffusion Transformers Are Time Series Forecasters [50.43534351968113]
既存の生成時系列モデルは、時系列データの多次元特性にうまく対応していない。
動画生成にテキストガイダンスを組み込んだマルチモーダル拡散変換器に着想を得て,Diffusion Transformer for Time Series (DiTS)を提案する。
論文 参考訳(メタデータ) (2026-02-06T10:48:13Z) - MFC-RFNet: A Multi-scale Guided Rectified Flow Network for Radar Sequence Prediction [7.015114232190396]
レーダエコーシークエンスからの正確な高分解能降水は、災害軽減と経済計画に不可欠である。
鍵となる課題は、複雑なマルチスケール進化のモデル化、変位に起因するフレーム間特徴の不整合、長距離コンテキストの効率的なキャプチャである。
本稿では,MFRF-Net(Multiscale Feature Communication Rectified Flow Network)を提案する。
論文 参考訳(メタデータ) (2026-01-07T06:24:26Z) - USF-Net: A Unified Spatiotemporal Fusion Network for Ground-Based Remote Sensing Cloud Image Sequence Extrapolation [7.868367798549883]
地中リモートセンシングクラウド画像シーケンスの外挿は、太陽光発電システムの開発において重要な研究領域である。
我々は,適応型大カーネル畳み込みと低複雑さアテンション機構を統合した統一Stemporal FusionであるUSF-Netを提案する。
重要なコントリビューションとして、ASI-CISデータセットの導入とリリースも行います。
論文 参考訳(メタデータ) (2025-11-12T06:54:40Z) - Reservoir Computing via Multi-Scale Random Fourier Features for Forecasting Fast-Slow Dynamical Systems [0.0]
本稿では,遅延埋め込みとランダムなフーリエ特徴(RFF)マッピングを組み合わせた新しい貯水池計算フレームワークを提案する。
固定されたカーネル帯域を利用する単一スケールのRFF貯水池と、高速かつ低速な時間依存の両方を表現するために複数の帯域を統合するマルチスケールのRFF貯水池の2つの定式化について検討した。
論文 参考訳(メタデータ) (2025-11-04T08:01:08Z) - MGTS-Net: Exploring Graph-Enhanced Multimodal Fusion for Augmented Time Series Forecasting [1.7077661158850292]
時系列予測のためのマルチモーダルグラフ強化ネットワークMGTS-Netを提案する。
モデルは,(1)マルチモーダル特徴抽出層(MFE),(2)マルチモーダル特徴融合層(MFF),(3)マルチスケール予測層(MSP)の3つのコアコンポーネントから構成される。
論文 参考訳(メタデータ) (2025-10-18T04:47:10Z) - Adaptive Fuzzy Time Series Forecasting via Partially Asymmetric Convolution and Sub-Sliding Window Fusion [0.0]
本稿では,スライディングウィンドウの時間に基づいて,部分的に非対称な設計を施した新しい畳み込みアーキテクチャを提案する。
提案手法は,一般的な時系列データセットのほとんどに対して,最先端の結果を得られる。
論文 参考訳(メタデータ) (2025-07-28T08:58:25Z) - Mutual Information-driven Triple Interaction Network for Efficient Image
Dehazing [54.168567276280505]
画像デハージングのための相互情報駆動型トリプルインタラクションネットワーク(MITNet)を提案する。
振幅誘導ヘイズ除去と呼ばれる第1段階は、ヘイズ除去のためのヘイズ画像の振幅スペクトルを復元することを目的としている。
第2段階は位相誘導構造が洗練され、位相スペクトルの変換と微細化を学ぶことに尽力した。
論文 参考訳(メタデータ) (2023-08-14T08:23:58Z) - Long-term Wind Power Forecasting with Hierarchical Spatial-Temporal
Transformer [112.12271800369741]
風力発電は、再生可能、汚染のないその他の利点により、世界中の注目を集めている。
正確な風力発電予測(WPF)は、電力系統の運用における電力変動を効果的に低減することができる。
既存の手法は主に短期的な予測のために設計されており、効果的な時空間的特徴増強が欠如している。
論文 参考訳(メタデータ) (2023-05-30T04:03:15Z) - FormerTime: Hierarchical Multi-Scale Representations for Multivariate
Time Series Classification [53.55504611255664]
formerTimeは、多変量時系列分類タスクの分類能力を改善する階層的表現モデルである。
1)時系列データから階層的なマルチスケール表現を学習し、(2)トランスフォーマーと畳み込みネットワークの強さを継承し、(3)自己維持メカニズムによって引き起こされる効率の課題に取り組む。
論文 参考訳(メタデータ) (2023-02-20T07:46:14Z) - Towards Long-Term Time-Series Forecasting: Feature, Pattern, and
Distribution [57.71199089609161]
長期的時系列予測(LTTF)は、風力発電計画など、多くのアプリケーションで需要が高まっている。
トランスフォーマーモデルは、高い計算自己認識機構のため、高い予測能力を提供するために採用されている。
LTTFの既存の手法を3つの面で区別する,Conformer という,効率的なTransformer ベースモデルを提案する。
論文 参考訳(メタデータ) (2023-01-05T13:59:29Z) - Gait Recognition in the Wild with Multi-hop Temporal Switch [81.35245014397759]
野生での歩行認識は、より実践的な問題であり、マルチメディアとコンピュータビジョンのコミュニティの注目を集めています。
本稿では,現実のシーンにおける歩行パターンの効果的な時間的モデリングを実現するために,新しいマルチホップ時間スイッチ方式を提案する。
論文 参考訳(メタデータ) (2022-09-01T10:46:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。