論文の概要: ClimateCheck 2026: Scientific Fact-Checking and Disinformation Narrative Classification of Climate-related Claims
- arxiv url: http://arxiv.org/abs/2603.26449v1
- Date: Fri, 27 Mar 2026 14:18:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-30 21:49:48.536134
- Title: ClimateCheck 2026: Scientific Fact-Checking and Disinformation Narrative Classification of Climate-related Claims
- Title(参考訳): ClimateCheck 2026:Science Fact-Checking and Disinformation Narrative Classification of climate-related Claims
- Authors: Raia Abu Ahmad, Max Upravitelev, Aida Usmanova, Veronika Solopova, Georg Rehm,
- Abstract要約: ClimateCheck 2026は、この課題に対処する共有タスクの2回目のイテレーションである。
2026年1月から2月にかけてコダベンチのプラットフォームで開催され、20人の登録参加者と8人のリーダーボードが参加した。
不完全なアノテーションの下での検索品質評価に自動化されたフレームワークを適用し、従来のメトリクスのランク付けシステムにおける体系的バイアスを明らかにする。
- 参考スコア(独自算出の注目度): 5.045988365888371
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automatically verifying climate-related claims against scientific literature is a challenging task, complicated by the specialised nature of scholarly evidence and the diversity of rhetorical strategies underlying climate disinformation. ClimateCheck 2026 is the second iteration of a shared task addressing this challenge, expanding on the 2025 edition with tripled training data and a new disinformation narrative classification task. Running from January to February 2026 on the CodaBench platform, the competition attracted 20 registered participants and 8 leaderboard submissions, with systems combining dense retrieval pipelines, cross-encoder ensembles, and large language models with structured hierarchical reasoning. In addition to standard evaluation metrics (Recall@K and Binary Preference), we adapt an automated framework to assess retrieval quality under incomplete annotations, exposing systematic biases in how conventional metrics rank systems. A cross-task analysis further reveals that not all climate disinformation is equally verifiable, potentially implicating how future fact-checking systems should be designed.
- Abstract(参考訳): 科学文献に対する気候関連の主張を自動検証することは難しい課題であり、学術的証拠の専門性や、気候情報の根底にある修辞的戦略の多様性によって複雑である。
ClimateCheck 2026は、この課題に対処する共有タスクの第2イテレーションであり、3倍のトレーニングデータと新しい偽情報物語分類タスクを備えた2025エディションに拡張されている。
2026年1月から2月にかけてCodaBenchプラットフォーム上で実施され、20人の登録参加者と8人のリーダーボードが参加した。
標準評価指標(Recall@K と Binary Preference)に加えて,不完全なアノテーションの下での検索品質評価のための自動フレームワークを適用し,従来のメトリクスランキングシステムにおける体系的バイアスを明らかにする。
クロスタスク分析により、すべての気候の偽情報が等しく検証可能であるわけではなく、将来のファクトチェックシステムがどのように設計されるべきかが示唆される。
関連論文リスト
- RPC-Bench: A Fine-grained Benchmark for Research Paper Comprehension [65.81339691942757]
RPC-Bench(RPC-Bench)は、高品質なコンピュータサイエンス論文のレビュー・リビューの交換から構築された大規模質問応答ベンチマークである。
我々は、科学研究の流れに沿ったきめ細かい分類を設計し、モデルがなぜ、何、どのように学術的な文脈で質問するかを理解し、答える能力を評価する。
論文 参考訳(メタデータ) (2026-01-14T11:37:00Z) - CAIRNS: Balancing Readability and Scientific Accuracy in Climate Adaptation Question Answering [10.31170458584116]
改良された可読性と通知源(CAIRNS)を用いた気候適応型質問応答について述べる。
CAIRNSは、Webから複雑なエビデンスソースから、専門家が信頼できる予備回答を得ることを可能にするフレームワークである。
構造化されたScholarGuideプロンプトを通じて読みやすさと引用信頼性を高め、堅牢な評価を実現する。
論文 参考訳(メタデータ) (2025-12-01T22:44:43Z) - Climate-Eval: A Comprehensive Benchmark for NLP Tasks Related to Climate Change [2.8680187920555635]
Climate-Evalは、既存のデータセットと、新たに開発されたニュース分類データセットを集約する。
この結果、13のデータセットに基づいた25のタスクのベンチマークが、気候談話の重要な側面をカバーしている。
論文 参考訳(メタデータ) (2025-05-24T11:45:46Z) - ClimateBench-M: A Multi-Modal Climate Data Benchmark with a Simple Generative Method [61.76389719956301]
我々は、ERA5の時系列気候データ、NOAAの極度の気象イベントデータ、NASAの衛星画像データを調整するマルチモーダル気候ベンチマークであるClimateBench-Mに貢献する。
また,各データモダリティの下では,天気予報,雷雨警報,作物の分断作業において,競争性能を向上できる簡易かつ強力な生成手法を提案する。
論文 参考訳(メタデータ) (2025-04-10T02:22:23Z) - ICDAR 2023 Competition on Hierarchical Text Detection and Recognition [60.68100769639923]
このコンペティションは、テキストの検出と認識を共同で行うディープラーニングモデルとシステムの研究を促進することを目的としている。
提案するコンペティション組織の詳細について,タスク,データセット,評価,スケジュールなどを紹介する。
大会期間中(2023年1月2日から2023年4月1日まで)、20チーム以上から少なくとも50人が提案された2つのタスクで応募された。
論文 参考訳(メタデータ) (2023-05-16T18:56:12Z) - Towards Answering Climate Questionnaires from Unstructured Climate
Reports [26.036105166376284]
活動家や政策立案者は、巨大で急速に成長する非構造的気候レポートを構造化形式に処理するためにNLPツールを必要としている。
2つの大規模気候調査データセットを導入し、既存の構造を用いて自己教師型モデルを訓練する。
次に、これらのモデルを用いて、人間のパイロット実験において、構造化されていない気候文書からのテキストと半構造化されたアンケートとの整合を支援する。
論文 参考訳(メタデータ) (2023-01-11T00:22:56Z) - Distant finetuning with discourse relations for stance classification [55.131676584455306]
そこで本研究では,定位分類のモデルとして,原文から銀ラベルでデータを抽出し,微調整する手法を提案する。
また,様々な段階において微調整に用いるデータのノイズレベルが減少する3段階のトレーニングフレームワークを提案する。
NLPCC 2021共有タスクArgumentative Text Understanding for AI Debaterでは,26の競合チームの中で1位にランクインした。
論文 参考訳(メタデータ) (2022-04-27T04:24:35Z) - A Clarifying Question Selection System from NTES_ALONG in Convai3
Challenge [8.656503175492375]
本稿では,検索指向会話型AI (SCAI) EMNLPワークショップにおけるClariQチャレンジへのNetEase Game AI Labチームの参加について述べる。
この課題は、解明された質問を理解し、生成できる完全な会話情報検索システムを求めるものである。
本稿では,回答理解,質問のリコール,質問ランキングの明確化からなる質問選択システムを提案する。
論文 参考訳(メタデータ) (2020-10-27T11:22:53Z) - Semantic Workflows and Machine Learning for the Assessment of Carbon
Storage by Urban Trees [3.7326934284216877]
本研究は、気候変動に関する政府間パネル(IPCC)のガイドラインに従って、アフリカの地域における炭素貯蔵量を推定する。
我々の知る限りでは、気候変動に関する政府間パネル(IPCC)のガイドラインに従い、アフリカ各地の炭素貯蔵量を推定する最初の研究である。
論文 参考訳(メタデータ) (2020-09-22T01:30:29Z) - Overview of the TREC 2019 Fair Ranking Track [65.15263872493799]
TREC Fair Ranking トラックの目標は、異なるコンテンツプロバイダに対する公正性の観点から、検索システムを評価するベンチマークを開発することであった。
本稿では,タスク定義やデータ記述,アノテーションプロセスなどを含むトラックの概要について述べる。
論文 参考訳(メタデータ) (2020-03-25T21:34:58Z) - Recognizing Families In the Wild: White Paper for the 4th Edition Data
Challenge [91.55319616114943]
本稿では,Recognizing Families In the Wild(RFIW)評価における支援課題(親族検証,三対象検証,行方不明児の検索・検索)を要約する。
本研究の目的は、2020年のRFIWチャレンジと、将来的な方向性の予測について述べることである。
論文 参考訳(メタデータ) (2020-02-15T02:22:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。