論文の概要: Climate Knowledge in Large Language Models
- arxiv url: http://arxiv.org/abs/2510.08043v1
- Date: Thu, 09 Oct 2025 10:25:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-10 17:54:15.008641
- Title: Climate Knowledge in Large Language Models
- Title(参考訳): 大規模言語モデルにおける気候知識
- Authors: Ivan Kuznetsov, Jacopo Grassi, Dmitrii Pantiukhin, Boris Shapkin, Thomas Jung, Nikolay Koldunov,
- Abstract要約: 本研究では,大規模言語モデルが外部検索なしで気候正常を想起する能力について検討した。
我々は,1deg解像度のランドポイントでクエリのグローバルグリッドを構築し,座標と位置記述子を提供し,ERA5の再解析に対する応答を検証する。
その結果, LLM は非自明な気候構造を符号化し, 3-6 degC のルート平均二乗誤差と$pm$1 degC のバイアスを観測した。
地理的コンテキストを含むとエラーが平均で27%減少し、より大きなモデルは位置記述子に最も敏感であることがわかった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models (LLMs) are increasingly deployed for climate-related applications, where understanding internal climatological knowledge is crucial for reliability and misinformation risk assessment. Despite growing adoption, the capacity of LLMs to recall climate normals from parametric knowledge remains largely uncharacterized. We investigate the capacity of contemporary LLMs to recall climate normals without external retrieval, focusing on a prototypical query: mean July 2-m air temperature 1991-2020 at specified locations. We construct a global grid of queries at 1{\deg} resolution land points, providing coordinates and location descriptors, and validate responses against ERA5 reanalysis. Results show that LLMs encode non-trivial climate structure, capturing latitudinal and topographic patterns, with root-mean-square errors of 3-6 {\deg}C and biases of $\pm$1 {\deg}C. However, spatially coherent errors remain, particularly in mountains and high latitudes. Performance degrades sharply above 1500 m, where RMSE reaches 5-13 {\deg}C compared to 2-4 {\deg}C at lower elevations. We find that including geographic context (country, city, region) reduces errors by 27% on average, with larger models being most sensitive to location descriptors. While models capture the global mean magnitude of observed warming between 1950-1974 and 2000-2024, they fail to reproduce spatial patterns of temperature change, which directly relate to assessing climate change. This limitation highlights that while LLMs may capture present-day climate distributions, they struggle to represent the regional and local expression of long-term shifts in temperature essential for understanding climate dynamics. Our evaluation framework provides a reproducible benchmark for quantifying parametric climate knowledge in LLMs and complements existing climate communication assessments.
- Abstract(参考訳): 大規模言語モデル (LLMs) は、気候関連アプリケーションにおいて、信頼性と誤情報リスク評価において、内部の気候学的な知識を理解することが不可欠である。
普及しているにもかかわらず、気候の正常をパラメトリックな知識から思い出すLLMの能力は、ほとんど役に立たないままである。
本研究では, 大気温度1991-2020年7月2日の平均気温1991-2020を指標として, 外部からの検索を行なわずに, 気候正常を想起する現代のLLMの能力について検討した。
我々は, 1{\deg} 解像度のランドポイントでクエリのグローバルグリッドを構築し, 座標と位置記述子を提供し, ERA5 の再解析に対する応答を検証する。
その結果, LLM は非自明な気候構造を符号化し, 3-6 {\deg}C のルート平均二乗誤差と$\pm$1 {\deg}C のバイアスを観測した。
しかし、特に山や高緯度では、空間的に一貫性のある誤差が残っている。
RMSE は 2-4 {\deg}C よりも低い高度で 5-13 {\deg}C に達する。
地理的コンテキスト(国、都市、地域)を含むと、エラーが平均で27%減少し、より大きなモデルが位置記述子に最も敏感であることがわかった。
モデルは1950-1974年から2000-2024年の間に観測された温暖化の世界的な平均等級を捉えたが、気温変化の空間的パターンを再現することはできなかった。
この制限は、LLMが現在の気候分布を捉えている一方で、気候力学を理解するのに不可欠な気候の長期的変化の地域的および地域的変化を表現するのに苦労していることを強調している。
我々の評価フレームワークは、LLMにおけるパラメトリック気候知識を定量化するための再現可能なベンチマークを提供し、既存の気候コミュニケーションアセスメントを補完する。
関連論文リスト
- ClimateBench-M: A Multi-Modal Climate Data Benchmark with a Simple Generative Method [61.76389719956301]
我々は、ERA5の時系列気候データ、NOAAの極度の気象イベントデータ、NASAの衛星画像データを調整するマルチモーダル気候ベンチマークであるClimateBench-Mに貢献する。
また,各データモダリティの下では,天気予報,雷雨警報,作物の分断作業において,競争性能を向上できる簡易かつ強力な生成手法を提案する。
論文 参考訳(メタデータ) (2025-04-10T02:22:23Z) - MambaDS: Near-Surface Meteorological Field Downscaling with Topography Constrained Selective State Space Modeling [68.69647625472464]
気象予測において重要な課題であるダウンスケーリングは、ターゲット領域に対する高解像度気象状態の再構築を可能にする。
以前のダウンスケーリング手法には気象学のための調整された設計が欠けており、構造的な限界に遭遇した。
本稿では,多変数相関と地形情報の利用性を高める新しいモデルであるMambaDSを提案する。
論文 参考訳(メタデータ) (2024-08-20T13:45:49Z) - ClimateIQA: A New Dataset and Benchmark to Advance Vision-Language Models in Meteorology Anomalies Analysis [32.940471253248965]
Sparse Position and Outline Tracking (SPOT) は、視覚データにおける不規則な形状の領域を処理するために設計された新しいアルゴリズムである。
SPOTは、空間座標を抽出して不規則な形状の領域を特定し、局所化し、不規則な形状の構造化表現を可能にする。
SPOT上に構築したClimateIQAは,新しい気象学的視覚的質問応答データセットである。
ClimateIQAは、空間的手がかり、地理的メタデータ、分析データを組み込むことでVLMトレーニングを強化し、極端な気象特性の解釈と記述におけるモデルの精度を向上させる。
論文 参考訳(メタデータ) (2024-06-14T08:46:44Z) - Distortions in Judged Spatial Relations in Large Language Models [45.875801135769585]
GPT-4は55%の精度で優れた性能を示し、GPT-3.5は47%、Llama-2は45%であった。
モデルは、ほとんどの場合において最も近い基数方向を同定し、その連想学習機構を反映した。
論文 参考訳(メタデータ) (2024-01-08T20:08:04Z) - ClimateX: Do LLMs Accurately Assess Human Expert Confidence in Climate
Statements? [0.0]
気候ステートメントにおけるエキスパート信頼度(Expert Confidence in Climate Statements, ClimateX)データセットは,8094気候ステートメントからなる,新規でキュレートされた専門家ラベル付きデータセットである。
このデータセットを用いて,近年のLarge Language Models (LLMs) は,気候関連文における人間の専門家の信頼度を分類できることを示す。
全体として、モデルは、低信頼と中自信のステートメントに一貫性があり、重要な自信を示します。
論文 参考訳(メタデータ) (2023-11-28T10:26:57Z) - Transferring climate change physical knowledge [13.529445977186635]
本研究では,地球系モデルによりシミュレーションされた地球温度マップから得られた知識を最適に活用し,マージするために機械学習が利用できることを示す。
我々は最先端のアプローチに関して50%以上の不確実性削減に達している。
論文 参考訳(メタデータ) (2023-09-26T09:24:53Z) - Multi-variable Hard Physical Constraints for Climate Model Downscaling [17.402215838651557]
地球温暖化モデル(GCM)は、気候変動の進化をシミュレートし、気候変動の影響を評価する主要なツールである。
彼らはしばしば、局所的な現象を再現する際の精度を制限する粗い空間分解能で操作する。
本研究は, この問題の範囲を調査し, 温度適用を通じて多変量制約を導入したフレームワークの基礎を定めている。
論文 参考訳(メタデータ) (2023-08-02T11:42:02Z) - Multi-scale Digital Twin: Developing a fast and physics-informed
surrogate model for groundwater contamination with uncertain climate models [53.44486283038738]
気候変動は地下水汚染の長期的な土壌管理問題を悪化させる。
U-Net強化フーリエニューラル汚染(PDENO)を用いた物理インフォームド機械学習サロゲートモデルを開発した。
並行して、気候データと組み合わされた畳み込みオートエンコーダを開発し、アメリカ合衆国全体の気候領域の類似性の次元を減少させる。
論文 参考訳(メタデータ) (2022-11-20T06:46:35Z) - Spatiotemporal modeling of European paleoclimate using doubly sparse
Gaussian processes [61.31361524229248]
計算負担を軽減するため,近年の大規模分散時間GPを構築した。
我々は,古気候の確率モデルを構築するために,この2倍のスパースGPをうまく利用した。
論文 参考訳(メタデータ) (2022-11-15T14:15:04Z) - Dynamical Landscape and Multistability of a Climate Model [64.467612647225]
2つの気候モデルのうちの1つで第3の中間安定状態が見つかる。
我々のアプローチを組み合わせることで、海洋熱輸送とエントロピー生産の負のフィードバックが地球の気候の地形をどのように大きく変えるかを特定することができる。
論文 参考訳(メタデータ) (2020-10-20T15:31:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。