論文の概要: Querying Climate Knowledge: Semantic Retrieval for Scientific Discovery
- arxiv url: http://arxiv.org/abs/2509.10087v1
- Date: Fri, 12 Sep 2025 09:28:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-15 16:03:08.031883
- Title: Querying Climate Knowledge: Semantic Retrieval for Scientific Discovery
- Title(参考訳): 気候の知識を問う:科学的発見のためのセマンティック検索
- Authors: Mustapha Adamu, Qi Zhang, Huitong Pan, Longin Jan Latecki, Eduard C. Dragut,
- Abstract要約: 本稿では、気候の出版物とより広範な科学的テキストから構築されたドメイン固有知識グラフ(KG)を紹介する。
キーワードベースの検索とは異なり、我々のKGは構造化されたセマンティックなクエリをサポートし、研究者が正確な接続を見つけるのに役立つ。
- 参考スコア(独自算出の注目度): 18.553569226042374
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The growing complexity and volume of climate science literature make it increasingly difficult for researchers to find relevant information across models, datasets, regions, and variables. This paper introduces a domain-specific Knowledge Graph (KG) built from climate publications and broader scientific texts, aimed at improving how climate knowledge is accessed and used. Unlike keyword based search, our KG supports structured, semantic queries that help researchers discover precise connections such as which models have been validated in specific regions or which datasets are commonly used with certain teleconnection patterns. We demonstrate how the KG answers such questions using Cypher queries, and outline its integration with large language models in RAG systems to improve transparency and reliability in climate-related question answering. This work moves beyond KG construction to show its real world value for climate researchers, model developers, and others who rely on accurate, contextual scientific information.
- Abstract(参考訳): 気候科学文学の複雑さと量の増加により、研究者はモデル、データセット、領域、変数にまたがる関連情報を見つけるのがますます難しくなっている。
本稿では,気候情報へのアクセスと利用の方法を改善することを目的とした,気候出版物とより広範な科学的テキストから構築されたドメイン固有知識グラフ(KG)を紹介する。
キーワードベースの検索とは異なり、我々のKGは構造化されたセマンティッククエリをサポートし、研究者が特定の領域でどのモデルが検証されたか、あるいは特定の遠隔接続パターンで一般的に使われているデータセットがどれかといった正確な接続を見つけるのに役立ちます。
我々は、KGがCypherクエリを使ってこのような質問にどのように答えるかを示し、気候関連質問応答における透明性と信頼性を改善するために、RAGシステムにおける大規模言語モデルとの統合の概要を示す。
この研究は、KGの構築を超えて、気候研究者、モデル開発者、そして正確な文脈的な科学的情報に依存している人々にとって、現実的な価値を示す。
関連論文リスト
- A Survey of Scientific Large Language Models: From Data Foundations to Agent Frontiers [221.34650992288505]
科学大規模言語モデル(Sci-LLMs)は、科学研究において、知識の表現、統合、適用の方法を変えつつある。
この調査は、モデルとその基盤となるデータ基板の共進化として、Sci-LLMの開発を再考する。
我々は、科学的データの統一された分類法と、科学的知識の階層的なモデルを定式化する。
論文 参考訳(メタデータ) (2025-08-28T18:30:52Z) - ScIRGen: Synthesize Realistic and Large-Scale RAG Dataset for Scientific Research [15.983924435685553]
我々は科学的なQAと検索のためのデータセット生成フレームワークであるScrirGenを開発した。
私たちはこれを使って、現実的なクエリ、データセット、論文を備えた大規模科学的検索強化世代(RAG)データセットを作成します。
論文 参考訳(メタデータ) (2025-06-09T11:47:13Z) - ClimateBench-M: A Multi-Modal Climate Data Benchmark with a Simple Generative Method [61.76389719956301]
我々は、ERA5の時系列気候データ、NOAAの極度の気象イベントデータ、NASAの衛星画像データを調整するマルチモーダル気候ベンチマークであるClimateBench-Mに貢献する。
また,各データモダリティの下では,天気予報,雷雨警報,作物の分断作業において,競争性能を向上できる簡易かつ強力な生成手法を提案する。
論文 参考訳(メタデータ) (2025-04-10T02:22:23Z) - ClimaQA: An Automated Evaluation Framework for Climate Question Answering Models [38.05357439484919]
気候学者による大学院教科書から質問応答ペアを生成する適応学習フレームワークであるClimaGenを開発した。
気候科学のための大規模で総合的な総合的なQAデータセットであるClimaQA-Silverとともに、専門家による注釈付きベンチマークデータセットであるClimaQA-Goldを提示する。
論文 参考訳(メタデータ) (2024-10-22T05:12:19Z) - Causal Representation Learning in Temporal Data via Single-Parent Decoding [66.34294989334728]
科学的研究はしばしば、システム内の高レベル変数の根底にある因果構造を理解しようとする。
科学者は通常、地理的に分布した温度測定などの低レベルの測定を収集する。
そこで本研究では,単一親の復号化による因果発見法を提案し,その上で下位の潜伏者と因果グラフを同時に学習する。
論文 参考訳(メタデータ) (2024-10-09T15:57:50Z) - ClimDetect: A Benchmark Dataset for Climate Change Detection and Attribution [6.919867656801517]
ClimDetectは、目標の気候変動指標変数と組み合わせた1日当たりの1.17万の気候スナップショットからなる標準化データセットである。
このデータセットは、CMIP6気候モデルシミュレーションと実世界の観測アシミュレートされた再分析データセットの両方から算出される。
私たちはまた、気候変動検出タスクのためにこれまで試みられていない新しいアプローチである、気候変動データへのビジョントランスフォーマー(ViT)の適用についても検討しています。
論文 参考訳(メタデータ) (2024-08-28T17:58:53Z) - Federated Prompt Learning for Weather Foundation Models on Devices [37.88417074427373]
天気予報のためのデバイス上のインテリジェンスでは、ローカルなディープラーニングモデルを使用して、集中型クラウドコンピューティングなしで気象パターンを分析する。
本稿では,FedPoD(Federated Prompt Learning for Weather Foundation Models on Devices)を提案する。
FedPoDは、通信効率を維持しながら、高度にカスタマイズされたモデルを得ることができる。
論文 参考訳(メタデータ) (2023-05-23T16:59:20Z) - Towards Answering Climate Questionnaires from Unstructured Climate
Reports [26.036105166376284]
活動家や政策立案者は、巨大で急速に成長する非構造的気候レポートを構造化形式に処理するためにNLPツールを必要としている。
2つの大規模気候調査データセットを導入し、既存の構造を用いて自己教師型モデルを訓練する。
次に、これらのモデルを用いて、人間のパイロット実験において、構造化されていない気候文書からのテキストと半構造化されたアンケートとの整合を支援する。
論文 参考訳(メタデータ) (2023-01-11T00:22:56Z) - Modeling Information Change in Science Communication with Semantically
Matched Paraphrases [50.67030449927206]
SPICEDは、情報変化の度合いに注釈を付けた科学的な発見の最初のパラフレーズデータセットである。
SPICEDには、ニュース記事、ソーシャルメディアの議論、オリジナル論文の全文から抽出された6000の科学的発見ペアが含まれている。
SPICEDで訓練されたモデルは、実世界の科学的主張の事実チェックのための証拠検索において下流のパフォーマンスを改善する。
論文 参考訳(メタデータ) (2022-10-24T07:44:38Z) - CLIMATE-FEVER: A Dataset for Verification of Real-World Climate Claims [4.574830585715129]
気候変動関連クレームを検証するための新しいデータセットであるCLIMATE-FEVERを紹介する。
人工的に設計されたクレームの最大のデータセットであるFEVER [1]の方法論を,インターネットから収集した実生活クレームに適用する。
我々は、textscfeverフレームワーク内での現実世界の気候関連クレームをモデル化する、驚くべき、微妙な複雑さについて論じる。
論文 参考訳(メタデータ) (2020-12-01T16:32:54Z) - Analyzing Sustainability Reports Using Natural Language Processing [68.8204255655161]
近年、企業は環境への影響を緩和し、気候変動の状況に適応することを目指している。
これは、環境・社会・ガバナンス(ESG)の傘下にある様々な種類の気候リスクと暴露を網羅する、ますます徹底した報告を通じて報告されている。
本稿では,本稿で開発したツールと方法論について紹介する。
論文 参考訳(メタデータ) (2020-11-03T21:22:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。