論文の概要: ClimaBench: A Benchmark Dataset For Climate Change Text Understanding in
English
- arxiv url: http://arxiv.org/abs/2301.04253v1
- Date: Wed, 11 Jan 2023 00:22:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-12 14:03:27.990046
- Title: ClimaBench: A Benchmark Dataset For Climate Change Text Understanding in
English
- Title(参考訳): ClimaBench:英語による気候変動テキスト理解のためのベンチマークデータセット
- Authors: Tanmay Laud, Daniel Spokoyny, Tom Corringham, Taylor Berg-Kirkpatrick
- Abstract要約: 気候変動(CC)は、現実世界の緊急性にもかかわらず、NLPにおいて限られた注目を集めている。
モデル性能を評価するために,既存の異種データセットのベンチマークコレクションであるClimate Change Benchmark(ClimaBench)を紹介する。
我々は,公開環境情報から収集した大規模ラベル付きテキスト分類と質問応答データセットを2種類リリースする。
- 参考スコア(独自算出の注目度): 26.036105166376284
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The topic of Climate Change (CC) has received limited attention in NLP
despite its real world urgency. Activists and policy-makers need NLP tools in
order to effectively process the vast and rapidly growing textual data produced
on CC. Their utility, however, primarily depends on whether the current
state-of-the-art models can generalize across various tasks in the CC domain.
In order to address this gap, we introduce Climate Change Benchmark
(ClimaBench), a benchmark collection of existing disparate datasets for
evaluating model performance across a diverse set of CC NLU tasks
systematically. Further, we enhance the benchmark by releasing two large-scale
labelled text classification and question-answering datasets curated from
publicly available environmental disclosures. Lastly, we provide an analysis of
several generic and CC-oriented models answering whether fine-tuning on domain
text offers any improvements across these tasks. We hope this work provides a
standard assessment tool for research on CC text data.
- Abstract(参考訳): 気候変動(CC)の話題は、現実の緊急性にもかかわらず、NLPにおいて限定的に注目されている。
アクティビストや政策立案者は、CCで生成する膨大な、急速に成長するテキストデータを効果的に処理するために、NLPツールが必要である。
しかし、それらの実用性は、主に現在の最先端モデルがCCドメイン内の様々なタスクにまたがって一般化できるかどうかに依存する。
このギャップに対処するために、CC NLUタスクのさまざまなセットにわたるモデルパフォーマンスを評価するために、既存の異なるデータセットのベンチマークコレクションであるClimate Change Benchmark(ClimaBench)を紹介します。
さらに,公開環境情報から得られた大規模ラベル付きテキスト分類と質問応答データセットを2つリリースすることで,ベンチマークを強化する。
最後に、ドメインテキストの微調整がこれらのタスク全体に改善をもたらすかどうかを答える、いくつかのジェネリックおよびcc指向モデルの分析を提供する。
本研究は,CCテキストデータ研究のための標準評価ツールとして期待されている。
関連論文リスト
- ClimaQA: An Automated Evaluation Framework for Climate Foundation Models [38.05357439484919]
気候学者と大学院の教科書から質問応答ペアを生成する自動化フレームワークであるClimaGenを開発した。
気候科学のための大規模で総合的な総合的なQAデータセットであるClimaQA-Silverとともに、専門家による注釈付きベンチマークデータセットであるClimaQA-Goldを提示する。
論文 参考訳(メタデータ) (2024-10-22T05:12:19Z) - ClimateGPT: Towards AI Synthesizing Interdisciplinary Research on
Climate Change [21.827936253363603]
本稿では,気候変動に関する学際的な研究を合成するドメイン固有大規模言語モデルのモデルファミリーであるClimateGPTを紹介する。
科学指向の300Bトークンデータセットを用いて,スクラッチから2つの7Bモデルをトレーニングした。
気候GPT-7B、13B、70Bは、Llama2から4.2Bトークンのドメイン固有のデータセットで継続的に事前訓練される。
論文 参考訳(メタデータ) (2024-01-17T23:29:46Z) - Comparing Data-Driven and Mechanistic Models for Predicting Phenology in
Deciduous Broadleaf Forests [47.285748922842444]
我々は、気象時系列から表現指標を予測するために、ディープニューラルネットワークを訓練する。
このアプローチは従来のプロセスベースのモデルよりも優れています。
論文 参考訳(メタデータ) (2024-01-08T15:29:23Z) - Climate Change from Large Language Models [7.190384101545232]
気候変動は重大な問題を引き起こし、広範囲の理解と低炭素のライフスタイルの認識を必要としている。
大規模言語モデル(LLM)はこの危機に対処するための強力なツールを提供する。
本稿では,気候危機知識を評価するための自動評価フレームワークを提案する。
論文 参考訳(メタデータ) (2023-12-19T09:26:46Z) - Arabic Mini-ClimateGPT : A Climate Change and Sustainability Tailored
Arabic LLM [77.17254959695218]
ChatGPTやBardのような大規模言語モデル(LLM)は、優れた会話能力を示し、幅広いNLPタスクに優れています。
我々は,オープンソースのLLM上に構築され,アラビア語データセットClima500-Instructの対話型命令チューニングに特化して微調整された軽量のアラビア語ミニクリメートGPTを提案する。
本モデルは,ChatGPTによる評価において,88.3%の症例において,ベースラインLLMを上回った。
論文 参考訳(メタデータ) (2023-12-14T22:04:07Z) - Fine-tuning ClimateBert transformer with ClimaText for the disclosure
analysis of climate-related financial risks [0.0]
本稿では,テキストコーパスの気候変動検出に最先端のNLP技術を適用した。
転送学習を用いて、BERTとClimateBertの2つのトランスフォーマーモデルを微調整する。
論文 参考訳(メタデータ) (2023-03-21T07:25:36Z) - ClimaX: A foundation model for weather and climate [51.208269971019504]
ClimaXは気象と気候科学のディープラーニングモデルである。
気候データセットの自己教師型学習目標で事前トレーニングすることができる。
気候や気候の様々な問題に対処するために、微調整が可能である。
論文 参考訳(メタデータ) (2023-01-24T23:19:01Z) - Spatiotemporal modeling of European paleoclimate using doubly sparse
Gaussian processes [61.31361524229248]
計算負担を軽減するため,近年の大規模分散時間GPを構築した。
我々は,古気候の確率モデルを構築するために,この2倍のスパースGPをうまく利用した。
論文 参考訳(メタデータ) (2022-11-15T14:15:04Z) - CLIMATE-FEVER: A Dataset for Verification of Real-World Climate Claims [4.574830585715129]
気候変動関連クレームを検証するための新しいデータセットであるCLIMATE-FEVERを紹介する。
人工的に設計されたクレームの最大のデータセットであるFEVER [1]の方法論を,インターネットから収集した実生活クレームに適用する。
我々は、textscfeverフレームワーク内での現実世界の気候関連クレームをモデル化する、驚くべき、微妙な複雑さについて論じる。
論文 参考訳(メタデータ) (2020-12-01T16:32:54Z) - Analyzing Sustainability Reports Using Natural Language Processing [68.8204255655161]
近年、企業は環境への影響を緩和し、気候変動の状況に適応することを目指している。
これは、環境・社会・ガバナンス(ESG)の傘下にある様々な種類の気候リスクと暴露を網羅する、ますます徹底した報告を通じて報告されている。
本稿では,本稿で開発したツールと方法論について紹介する。
論文 参考訳(メタデータ) (2020-11-03T21:22:42Z) - Dynamical Landscape and Multistability of a Climate Model [64.467612647225]
2つの気候モデルのうちの1つで第3の中間安定状態が見つかる。
我々のアプローチを組み合わせることで、海洋熱輸送とエントロピー生産の負のフィードバックが地球の気候の地形をどのように大きく変えるかを特定することができる。
論文 参考訳(メタデータ) (2020-10-20T15:31:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。