論文の概要: ContextClaim: A Context-Driven Paradigm for Verifiable Claim Detection
- arxiv url: http://arxiv.org/abs/2603.30025v1
- Date: Tue, 31 Mar 2026 17:20:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-01 15:25:03.949167
- Title: ContextClaim: A Context-Driven Paradigm for Verifiable Claim Detection
- Title(参考訳): ContextClaim: 検証可能なクレーム検出のためのコンテキスト駆動パラダイム
- Authors: Yufeng Li, Rrubaa Panchendrarajan, Arkaitz Zubiaga,
- Abstract要約: 検証可能なクレーム検出は、クレームが、原則として外部の証拠に対して評価できる事実的なステートメントを表現できるかどうかを問う。
本研究では,コンテキスト駆動クレーム検出(Context-Driven Claim Detection,ContextClaim)を提案する。
我々は、さまざまなトピックとテキストジャンルをカバーする2つのデータセット、2022年のTwitterデータセット、PoliClaimの政治討論データセットについてContextClaimを評価した。
- 参考スコア(独自算出の注目度): 17.165016272480262
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Verifiable claim detection asks whether a claim expresses a factual statement that can, in principle, be assessed against external evidence. As an early filtering stage in automated fact-checking, it plays an important role in reducing the burden on downstream verification components. However, existing approaches to claim detection, whether based on check-worthiness or verifiability, rely solely on the claim text itself. This is a notable limitation for verifiable claim detection in particular, where determining whether a claim is checkable may benefit from knowing what entities and events it refers to and whether relevant information exists to support verification. Inspired by the established role of evidence retrieval in later-stage claim verification, we propose Context-Driven Claim Detection (ContextClaim), a paradigm that advances retrieval to the detection stage. ContextClaim extracts entity mentions from the input claim, retrieves relevant information from Wikipedia as a structured knowledge source, and employs large language models to produce concise contextual summaries for downstream classification. We evaluate ContextClaim on two datasets covering different topics and text genres, the CheckThat! 2022 COVID-19 Twitter dataset and the PoliClaim political debate dataset, across encoder-only and decoder-only models under fine-tuning, zero-shot, and few-shot settings. Results show that context augmentation can improve verifiable claim detection, although its effectiveness varies across domains, model architectures, and learning settings. Through component analysis, human evaluation, and error analysis, we further examine when and why the retrieved context contributes to more reliable verifiability judgments.
- Abstract(参考訳): 検証可能なクレーム検出は、クレームが、原則として外部の証拠に対して評価できる事実的なステートメントを表現できるかどうかを問う。
自動ファクトチェックの早期フィルタリング段階として、下流の検証コンポーネントの負担を軽減する上で重要な役割を果たす。
しかし、既存のクレーム検出のアプローチは、チェックのしやすさや検証可能性に基づいても、クレームテキスト自体に依存している。
これは、特に検証可能なクレーム検出において顕著な制限であり、クレームがチェック可能かどうかを決定することは、そのクレームがどのエンティティやイベントを参照しているか、関連する情報が検証をサポートするために存在するかどうかを知ることの恩恵を受ける可能性がある。
後段のクレーム検証におけるエビデンス検索の確立した役割に着想を得て,検出段階に探索を前進させるパラダイムであるコンテキスト駆動クレーム検出(Context-Driven Claim Detection,ContextClaim)を提案する。
ContextClaimは入力クレームからエンティティの参照を抽出し、構造化知識ソースとしてWikipediaから関連情報を検索し、ダウンストリーム分類のための簡潔なコンテキスト要約を生成するために大きな言語モデルを使用する。
さまざまなトピックやテキストジャンルをカバーする2つのデータセット上でContextClaimを評価します。
2022 COVID-19 TwitterデータセットとPooliClaim政治討論データセットは、微調整、ゼロショット、少数ショット設定の下で、エンコーダのみおよびデコーダのみのモデルを対象としている。
その結果、コンテキスト拡張は検証可能なクレーム検出を改善するが、有効性はドメイン、モデルアーキテクチャ、学習設定によって異なることがわかった。
コンポーネント分析,人的評価,エラー解析を通じて,検索した文脈がより信頼性の高い妥当性判断に寄与する時期と理由を更に検討する。
関連論文リスト
- Retrieve-Refine-Calibrate: A Framework for Complex Claim Fact-Checking [32.6738019397553]
大規模言語モデル(LLM)に基づくRetrieve-Refine-Calibrate(RRC)フレームワークを提案する。
特に、このフレームワークは、まずクレームに記載されたエンティティを特定し、それらに関連する証拠を検索する。
そして、無関係な情報を減らすためのクレームに基づいて、回収された証拠を精査する。
最後に、信頼性の低い予測を再評価することで検証プロセスを校正する。
論文 参考訳(メタデータ) (2026-01-23T08:48:52Z) - A Benchmark for Open-Domain Numerical Fact-Checking Enhanced by Claim Decomposition [7.910984819642885]
QuanTemp++は、自然の数値的クレーム、オープンドメインコーパスからなるデータセットであり、各クレームに関する関連する証拠がある。
キークレーム分解パラダイムの検索性能を特徴付ける。
論文 参考訳(メタデータ) (2025-10-24T22:37:13Z) - DnDScore: Decontextualization and Decomposition for Factuality Verification in Long-Form Text Generation [48.134780006638984]
分解と非文脈化は独立に研究されているが、完全なシステムにおける相互作用は研究されていない。
我々は、異なる分解、非文脈化、検証戦略の評価を行い、戦略の選択が結果の事実性スコアに重要であることを確認する。
DnDScoreは文脈情報の文脈におけるサブ文の検証を行う非コンテクスト化対応検証手法である。
論文 参考訳(メタデータ) (2024-12-17T18:54:01Z) - Contrastive Learning to Improve Retrieval for Real-world Fact Checking [84.57583869042791]
ファクト・チェッキング・リランカ(Contrastive Fact-Checking Reranker, CFR)を提案する。
我々はAVeriTeCデータセットを活用し、証拠文書からの人間による回答とクレームのサブクエストを注釈付けする。
データセットの精度は6%向上した。
論文 参考訳(メタデータ) (2024-10-07T00:09:50Z) - AFaCTA: Assisting the Annotation of Factual Claim Detection with Reliable LLM Annotators [38.523194864405326]
AFaCTAは、事実主張のアノテーションを支援する新しいフレームワークである。
AFaCTAは、3つの事前定義された推論経路に沿って、アノテーションの信頼度を一貫性で調整する。
PoliClaimは、さまざまな政治的トピックにまたがる包括的なクレーム検出データセットである。
論文 参考訳(メタデータ) (2024-02-16T20:59:57Z) - Give Me More Details: Improving Fact-Checking with Latent Retrieval [58.706972228039604]
証拠は、自動化された事実チェックにおいて重要な役割を果たす。
既存のファクトチェックシステムは、エビデンス文が与えられたと仮定するか、検索エンジンが返した検索スニペットを使用する。
資料から得られた全文を証拠として組み込んで,2つの豊富なデータセットを導入することを提案する。
論文 参考訳(メタデータ) (2023-05-25T15:01:19Z) - AmbiFC: Fact-Checking Ambiguous Claims with Evidence [57.7091560922174]
実世界の情報ニーズから10kクレームを抽出したファクトチェックデータセットであるAmbiFCを提示する。
アンビFCの証拠に対する主張を比較する際に,曖昧さから生じる不一致を分析した。
我々は,このあいまいさをソフトラベルで予測するモデルを開発した。
論文 参考訳(メタデータ) (2021-04-01T17:40:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。