論文の概要: Solar-VLM: Multimodal Vision-Language Models for Augmented Solar Power Forecasting
- arxiv url: http://arxiv.org/abs/2604.04145v1
- Date: Sun, 05 Apr 2026 15:14:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-07 15:49:18.946243
- Title: Solar-VLM: Multimodal Vision-Language Models for Augmented Solar Power Forecasting
- Title(参考訳): 太陽VLM:太陽発電予測のためのマルチモーダルビジョンランゲージモデル
- Authors: Hang Fan, Haoran Pei, Runze Liang, Weican Liu, Long Cheng, Wei Wei,
- Abstract要約: 本論文ではマルチモーダルPV電力予測のための大規模言語モデル駆動フレームワークであるSolar-VLMを提案する。
地理的に分散したステーション間の空間的依存関係をキャプチャするために、クロスサイト特徴融合機構を導入する。
中国北部の8ヶ所のPVステーションのデータを用いて,提案手法の有効性を実証した。
- 参考スコア(独自算出の注目度): 8.479205315463522
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Photovoltaic (PV) power forecasting plays a critical role in power system dispatch and market participation. Because PV generation is highly sensitive to weather conditions and cloud motion, accurate forecasting requires effective modeling of complex spatiotemporal dependencies across multiple information sources. Although recent studies have advanced AI-based forecasting methods, most fail to fuse temporal observations, satellite imagery, and textual weather information in a unified framework. This paper proposes Solar-VLM, a large-language-model-driven framework for multimodal PV power forecasting. First, modality-specific encoders are developed to extract complementary features from heterogeneous inputs. The time-series encoder adopts a patch-based design to capture temporal patterns from multivariate observations at each site. The visual encoder, built upon a Qwen-based vision backbone, extracts cloud-cover information from satellite images. The text encoder distills historical weather characteristics from textual descriptions. Second, to capture spatial dependencies across geographically distributed PV stations, a cross-site feature fusion mechanism is introduced. Specifically, a Graph Learner models inter-station correlations through a graph attention network constructed over a K-nearest-neighbor (KNN) graph, while a cross-site attention module further facilitates adaptive information exchange among sites. Finally, experiments conducted on data from eight PV stations in a northern province of China demonstrate the effectiveness of the proposed framework. Our proposed model is publicly available at https://github.com/rhp413/Solar-VLM.
- Abstract(参考訳): 太陽光発電(PV)電力予測は、電力システムディスパッチと市場参加において重要な役割を果たす。
PV生成は気象条件や雲の動きに非常に敏感であるため、正確な予測には複数の情報ソースにまたがる複雑な時空間依存性を効果的にモデル化する必要がある。
近年の研究では、AIに基づく予測手法が進歩しているが、ほとんどの場合、統合されたフレームワークにおいて、時間観測、衛星画像、およびテキスト気象情報を融合することができない。
本論文ではマルチモーダルPV電力予測のための大規模言語モデル駆動フレームワークであるSolar-VLMを提案する。
まず、不均一な入力から相補的な特徴を抽出するために、モダリティ固有のエンコーダを開発した。
時系列エンコーダはパッチベースの設計を採用し、各サイトにおける多変量観測から時間パターンをキャプチャする。
Qwenベースのビジョンバックボーン上に構築されたビジュアルエンコーダは、衛星画像からクラウドカバー情報を抽出する。
テキストエンコーダは、テキスト記述から歴史的気象特性を抽出する。
次に、地理的に分散したPVステーション間の空間的依存関係をキャプチャするために、クロスサイト機能融合機構を導入する。
具体的には、グラフ学習者は、K-nearest-neighbor(KNN)グラフ上に構築されたグラフアテンションネットワークを介して、ステーション間相関をモデル化し、クロスサイトアテンションモジュールは、サイト間の適応情報交換をさらに促進する。
最後に、中国北部の8つのPVステーションのデータを用いて、提案手法の有効性を実証した。
提案モデルはhttps://github.com/rhp413/Solar-VLMで公開されている。
関連論文リスト
- Ultra-short-term solar power forecasting by deep learning and data reconstruction [60.200987006598524]
深層学習に基づく超短周期太陽エネルギー予測とデータ再構成を提案する。
我々は、ターゲット予測期間に対する長期的および短期的依存関係をキャプチャするために、ディープラーニングモデルを用いる。
論文 参考訳(メタデータ) (2025-09-21T14:22:35Z) - Solar Forecasting with Causality: A Graph-Transformer Approach to Spatiotemporal Dependencies [5.291394959125948]
SolarCAST は将来のグローバル水平放射率(GHI)を予測する因果的に情報を得たモデルであり、X サイトと近辺の局 S の歴史的な GHI のみを用いて目標地点で予測する。
様々な地理的条件で時系列やマルチモーダルのベースラインを上回ります。
最上位の予測装置であるSolcastよりも25.9%のエラー削減を実現している。
論文 参考訳(メタデータ) (2025-09-18T22:57:07Z) - S$^2$Transformer: Scalable Structured Transformers for Global Station Weather Forecasting [67.93713728260646]
既存の時系列予測手法は、大規模なグローバルステーション予測を行う際に、空間的相関を無視または一方向的にモデル化することが多い。
これは、予測性能を制限する地球規模の気象システムの観測の根底にある性質と矛盾する。
本稿では,構造的空間的注意を新たに提案する。
空間グラフを一連のサブグラフに分割し、サブグラフ内の注意をインスタンス化し、各サブグラフ内の局所的な空間相関を学習する。
ノードをサブグラフ間のメッセージパッシングのためのサブグラフ表現に集約する。
論文 参考訳(メタデータ) (2025-09-10T05:33:28Z) - Exploring Multimodal AI Reasoning for Meteorological Forecasting from Skew-T Diagrams [4.036372578802888]
VLM(Vision-Language Models)は、他の科学領域でも有望であるが、気象図解釈への応用はほとんど未発見である。
我々は,スキューT図を小型言語モデル (LM) と人間の予測器をエミュレートする小型VLMを用いた軽量AIアシスタントを提案する。
論文 参考訳(メタデータ) (2025-08-17T01:36:31Z) - VideoMolmo: Spatio-Temporal Grounding Meets Pointing [66.19964563104385]
VideoMolmoは、ビデオシーケンスのきめ細かいポインティングに適したモデルだ。
新しい仮面融合はSAM2を双方向の点伝播に用いている。
The generalization of VideoMolmo, we introduced VPoMolS-temporal, a challenge out-of-distribution benchmark across two real-world scenarios。
論文 参考訳(メタデータ) (2025-06-05T17:59:29Z) - FusionSF: Fuse Heterogeneous Modalities in a Vector Quantized Framework
for Robust Solar Power Forecasting [24.57911612111109]
本稿では,過去の電力データ,数値天気予報,衛星画像を統合するための多モード融合フレームワークを提案する。
本フレームワークは,新たに設置した植物に特に有用である,強いゼロショット予測能力を示す。
我々のモデルは頑丈なだけでなく、ゼロショット予測とトレーニングデータに富んだシナリオの両方において精度を高める。
論文 参考訳(メタデータ) (2024-02-08T17:03:10Z) - Towards an end-to-end artificial intelligence driven global weather forecasting system [57.5191940978886]
我々は,地球規模の気象変動に対するAIに基づくデータ同化モデル,すなわちAdasを提案する。
我々は,アダスが地球観測を同化して高品質な分析を行い,長期にわたって安定して運用できることを実証した。
この手法を現実のシナリオに適用するのは,私たちが初めてです。
論文 参考訳(メタデータ) (2023-12-18T09:05:28Z) - Improving day-ahead Solar Irradiance Time Series Forecasting by
Leveraging Spatio-Temporal Context [46.72071291175356]
太陽発電は二酸化炭素の排出量を大幅に削減することで気候変動を緩和する大きな可能性を秘めている。
しかし、太陽光の固有の変動は、電力網に太陽エネルギーをシームレスに統合する上で大きな課題となる。
本稿では,衛星データを用いた時間的文脈の活用を目的としたディープラーニングアーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-06-01T19:54:39Z) - SKIPP'D: a SKy Images and Photovoltaic Power Generation Dataset for
Short-term Solar Forecasting [0.0]
画像ベースのソーラー予測のための標準化されたベンチマークデータセットは、ほとんど公開されていない。
SKIPP'D - SKy Images と Photovoltaic Power Generation データセットを紹介する。
データセットには、品質制御されたダウンサンプルスカイイメージと、ディープラーニングを用いた短期太陽予報のためのPV発電データが含まれている。
論文 参考訳(メタデータ) (2022-07-02T21:52:50Z) - Spatio-temporal graph neural networks for multi-site PV power
forecasting [0.0]
決定論的マルチサイト予測のための2つの新しいグラフニューラルネットワークモデルを提案する。
提案手法は,6時間前の予測地平線に対して,最先端のマルチサイト予測手法より優れていた。
論文 参考訳(メタデータ) (2021-07-29T10:15:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。