論文の概要: Weather-R1: Logically Consistent Reinforcement Fine-Tuning for Multimodal Reasoning in Meteorology
- arxiv url: http://arxiv.org/abs/2601.14044v1
- Date: Tue, 20 Jan 2026 15:00:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-21 22:47:23.370164
- Title: Weather-R1: Logically Consistent Reinforcement Fine-Tuning for Multimodal Reasoning in Meteorology
- Title(参考訳): 気象R1:気象学におけるマルチモーダル推論のための論理的一貫性強化微調整
- Authors: Kaiyu Wu, Pucheng Han, Hualong Zhang, Naigeng Wu, Keze Wang,
- Abstract要約: WeatherQAは気象学の新しいマルチモーダル推論ベンチマークである。
LoCo-RFTは論理一貫性報酬を導入することで自己コントラを解消する。
気象R1は、気象学における論理的忠実性を持つVLMの最初の推論である。
- 参考スコア(独自算出の注目度): 10.189420458278086
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While Vision Language Models (VLMs) show advancing reasoning capabilities, their application in meteorology is constrained by a domain gap and a reasoning faithfulness gap. Specifically, mainstream Reinforcement Fine-Tuning (RFT) can induce Self-Contradictory Reasoning (Self-Contra), where the model's reasoning contradicts its final answer, which is unacceptable in such a high-stakes domain. To address these challenges, we construct WeatherQA, a novel multimodal reasoning benchmark in meteorology. We also propose Logically Consistent Reinforcement Fine-Tuning (LoCo-RFT), which resolves Self-Contra by introducing a logical consistency reward. Furthermore, we introduce Weather-R1, the first reasoning VLM with logical faithfulness in meteorology, to the best of our knowledge. Experiments demonstrate that Weather-R1 improves performance on WeatherQA by 9.8 percentage points over the baseline, outperforming Supervised Fine-Tuning and RFT, and even surpassing the original Qwen2.5-VL-32B. These results highlight the effectiveness of our LoCo-RFT and the superiority of Weather-R1. Our benchmark and code are available at https://github.com/Marcowky/Weather-R1.
- Abstract(参考訳): 視覚言語モデル(VLM)は推論能力の進歩を示すが、気象学におけるそれらの応用は領域ギャップと推論忠実度ギャップによって制約される。
具体的には、主流の強化細調整(RFT)は自己矛盾推論(Self-Contra)を誘導することができる。
これらの課題に対処するため、気象学の新しいマルチモーダル推論ベンチマークであるWeatherQAを構築した。
また,論理的整合性報酬を導入して自己コントラを解消するロジスティック一貫性強化ファインチューニング(LoCo-RFT)を提案する。
さらに,気象学における論理的忠実性のVLMであるWeather-R1を紹介する。
実験の結果、WeatherQAの性能は9.8ポイント向上し、Supervised Fine-TuningとRFTを上回り、Qwen2.5-VL-32Bを抜いた。
これらの結果はLoCo-RFTの有効性とWeather-R1の優位性を強調した。
ベンチマークとコードはhttps://github.com/Marcowky/Weather-R1.comで公開されている。
関連論文リスト
- Omni-Weather: Unified Multimodal Foundation Model for Weather Generation and Understanding [45.208804604251405]
オムニ・ウェザー(Omni-Weather)は、気象の発生と1つのアーキテクチャ内での理解を統一する最初のマルチモーダル基礎モデルである。
大規模な実験は、オムニ=ウェザーが気象の発生と理解の両方において最先端のパフォーマンスを達成することを示している。
本研究は,気象領域における生成的・理解的タスクが相互に増強できることを示唆するものである。
論文 参考訳(メタデータ) (2025-12-25T12:08:09Z) - RoSe: Robust Self-supervised Stereo Matching under Adverse Weather Conditions [58.37558408672509]
本稿では,ロバストな自己監督型環境対応学習と悪天候蒸留という2つの重要なステップからなる,堅牢な自己監督型訓練パラダイムを提案する。
提案手法の有効性と汎用性を実証し,既存の最先端の自己管理手法より優れていることを示す。
論文 参考訳(メタデータ) (2025-09-23T15:41:40Z) - UMDATrack: Unified Multi-Domain Adaptive Tracking Under Adverse Weather Conditions [73.71632291123008]
各種の悪天候条件下での高品質な目標状態予測を行うUMDATrackを提案する。
私たちのコードはhttps://github.com/Z-Z188/UMDATrack.comから入手可能です。
論文 参考訳(メタデータ) (2025-07-01T10:43:57Z) - VideoChat-R1: Enhancing Spatio-Temporal Perception via Reinforcement Fine-Tuning [50.33337482489673]
本稿では,RFT(Reinforcement Fine-temporalning)による映像知覚の向上を目的とする。
我々は,チャット機能を犠牲にすることなく,最先端のリアルタイムタスクを実現する強力なビデオMLLMであるVideoChat-R1を開発した。
ビデオMLLMのタスク強化におけるRTTの可能性について検討した。
論文 参考訳(メタデータ) (2025-04-09T15:09:27Z) - Boosting Adverse Weather Crowd Counting via Multi-queue Contrastive Learning [8.692139673789555]
マルチキューコントラスト学習(MQCL)と呼ばれる2段階の群集カウント手法を提案する。
MQCLは、悪天候下でのカウントエラーを22%削減し、計算負荷の約13%の増加しか導入していない。
論文 参考訳(メタデータ) (2024-08-12T07:13:08Z) - WeatherQA: Can Multimodal Language Models Reason about Severe Weather? [45.43764278625153]
干し草、竜巻、雷雨などの激しい対流的な気象イベントは、しばしば急速に起こるが、大きな被害を招き、毎年何十億ドルもの費用がかかる。
このことは、気象学者や住民のリスクの高い地域での適切な準備のために、前もって厳しい天候の脅威を予知することの重要性を強調している。
我々は、気象パラメータの複雑な組み合わせを推論し、現実のシナリオで厳しい天候を予測するために、機械用に設計された最初のマルチモーダルデータセットであるWeatherQAを紹介する。
論文 参考訳(メタデータ) (2024-06-17T05:23:18Z) - Lightning-Fast Convective Outlooks: Predicting Severe Convective Environments with Global AI-based Weather Models [0.08271752505511926]
激しい対流嵐は最も危険な気象現象であり、正確な予測は影響を緩和する。
最近リリースされたAIベースの天気モデルスイートは、中距離の予測を数秒で生成する。
本稿では,再解析とECMWFの運用数値天気予報モデルISSに対して,対流パラメータを対象とした3つのAIモデルの予測能力を評価する。
論文 参考訳(メタデータ) (2024-06-13T07:46:03Z) - Residual Corrective Diffusion Modeling for Km-scale Atmospheric Downscaling [58.456404022536425]
気象・気候からの物理的危険予知技術の現状には、粗い解像度のグローバルな入力によって駆動される高価なkmスケールの数値シミュレーションが必要である。
ここでは、コスト効率のよい機械学習代替手段として、このようなグローバルな入力をkmスケールにダウンスケールするために、生成拡散アーキテクチャを探索する。
このモデルは、台湾上空の地域気象モデルから2kmのデータを予測するために訓練され、世界25kmの再解析に基づいている。
論文 参考訳(メタデータ) (2023-09-24T19:57:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。