Fugu-MT 論文翻訳(概要): Document-level Claim Extraction and Decontextualisation for Fact-Checking

論文の概要: Document-level Claim Extraction and Decontextualisation for Fact-Checking

arxiv url: http://arxiv.org/abs/2406.03239v1
Date: Wed, 5 Jun 2024 13:16:46 GMT
ステータス: 翻訳完了
システム内更新日: 2024-06-06 18:20:44.061075
Title: Document-level Claim Extraction and Decontextualisation for Fact-Checking
Title（参考訳）: Fact-Checkingのための文書レベルのクレーム抽出と非コンテクスト化
Authors: Zhenyun Deng, Michael Schlichtkrul, Andreas Vlachos,
Abstract要約: ファクトチェックのための文書レベルのクレーム抽出手法を提案する。文書から中心文を識別するために,まずクレーム抽出を抽出要約として再放送する。次に、文の非コンテクスト化を通じて、原文から必要なコンテキストを含むように書き直します。
参考スコア（独自算出の注目度）: 8.482162967104333
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Selecting which claims to check is a time-consuming task for human fact-checkers, especially from documents consisting of multiple sentences and containing multiple claims. However, existing claim extraction approaches focus more on identifying and extracting claims from individual sentences, e.g., identifying whether a sentence contains a claim or the exact boundaries of the claim within a sentence. In this paper, we propose a method for document-level claim extraction for fact-checking, which aims to extract check-worthy claims from documents and decontextualise them so that they can be understood out of context. Specifically, we first recast claim extraction as extractive summarization in order to identify central sentences from documents, then rewrite them to include necessary context from the originating document through sentence decontextualisation. Evaluation with both automatic metrics and a fact-checking professional shows that our method is able to extract check-worthy claims from documents more accurately than previous work, while also improving evidence retrieval.
Abstract（参考訳）: チェックするクレームを選択することは、人間のファクトチェッカーにとって、特に複数の文と複数のクレームを含む文書から、時間を要するタスクである。しかし、既存のクレーム抽出アプローチは、個々の文からクレームを特定して抽出すること、例えば、ある文がクレームを含むか、またはその文内のクレームの正確な境界を識別することに焦点を当てている。本稿では,事実確認のための文書レベルのクレーム抽出手法を提案する。具体的には、文書から中心文を識別するために、まずクレーム抽出を抽出要約として再キャストし、文書から必要コンテキストを含むように書き換える。自動測定とファクトチェックの両専門家による評価は,本手法が従来よりも精度の高い文書からチェック価値のあるクレームを抽出できるとともに,証拠検索の改善を図っていることを示している。

関連論文リスト

Examining the Metrics for Document-Level Claim Extraction in Czech and Slovak [0.0]
文書レベルのクレーム抽出は、ファクトチェックの分野で依然としてオープンな課題である。クレーム集合間の最適なアライメントと評価手法を同定する手法について検討する。チェコ語とスロバキア語のニュース記事ドメインによるコメントから抽出した,新たに収集したデータセット検索実験を行った。
論文参考訳（メタデータ） (2025-11-18T15:09:09Z)
Query Decomposition for RAG: Balancing Exploration-Exploitation [83.79639293409802]
RAGシステムは複雑なユーザ要求に対処し、それらをサブクエリに分解し、それぞれに関連する可能性のあるドキュメントを取得し、それを集約して回答を生成する。クエリの分解とドキュメントの検索をエクスプロレーション探索設定で定式化し、一度に1つのドキュメントを検索すると、与えられたサブクエリの有用性についての信念が構築される。我々の主な発見は、ランク情報と人的判断を用いた文書関連性の推定により、文書レベルの精度が35%向上し、α-nDCGが15%向上し、長文生成の下流タスクの性能が向上するということである。
論文参考訳（メタデータ） (2025-10-21T13:37:11Z)
PRISM: Fine-Grained Paper-to-Paper Retrieval with Multi-Aspect-Aware Query Optimization [61.783280234747394]
PRISMは文書から文書への検索手法であり、クエリと候補文書の両方に対して、複数のきめ細かい表現を導入している。 SciFullBenchは、クエリと候補の両方のフルペーパーの完全かつセグメンテーションされたコンテキストが利用できる新しいベンチマークである。実験の結果、PRISMは既存の検索基準よりも平均4.3%性能が向上した。
論文参考訳（メタデータ） (2025-07-14T08:41:53Z)
Towards Effective Extraction and Evaluation of Factual Claims [1.8262547855491458]
LLM(Large Language Models)が生成する長文コンテンツを事実チェックするための一般的な戦略は、独立して検証可能な単純なクレームを抽出することである。本稿では,ファクトチェックの文脈におけるクレーム抽出と,このフレームワークを適用するための自動化された,スケーラブルで,かつレプリケート可能な手法を提案する。また, LLMに基づくクレーム抽出手法であるCrimifyを導入し, 評価フレームワークにおける既存手法よりも優れていることを示す。
論文参考訳（メタデータ） (2025-02-15T16:58:05Z)
Unified Multi-Modal Interleaved Document Representation for Information Retrieval [57.65409208879344]
我々は、異なるモダリティでインターリーブされた文書を均等に埋め込み、より包括的でニュアンスのある文書表現を生成する。具体的には、テキスト、画像、テーブルの処理と統合を統一されたフォーマットと表現に統合する、近年のビジョン言語モデルの能力を活用して、これを実現する。
論文参考訳（メタデータ） (2024-10-03T17:49:09Z)
Contextual Document Embeddings [77.22328616983417]
本稿では,コンテキスト化された文書埋め込みのための2つの補完手法を提案する。第一に、文書近傍を明示的にバッチ内コンテキスト損失に組み込む別のコントラスト学習目標である。第二に、隣接する文書情報をエンコードされた表現に明示的にエンコードする新しいコンテキストアーキテクチャ。
論文参考訳（メタデータ） (2024-10-03T14:33:34Z)
Give Me More Details: Improving Fact-Checking with Latent Retrieval [58.706972228039604]
証拠は、自動化された事実チェックにおいて重要な役割を果たす。既存のファクトチェックシステムは、エビデンス文が与えられたと仮定するか、検索エンジンが返した検索スニペットを使用する。資料から得られた全文を証拠として組み込んで,2つの豊富なデータセットを導入することを提案する。
論文参考訳（メタデータ） (2023-05-25T15:01:19Z)
Complex Claim Verification with Evidence Retrieved in the Wild [73.19998942259073]
Webから生の証拠を取り出すことによって,実世界のクレームをチェックするための,最初の完全自動化パイプラインを提示する。私たちのパイプラインには,クレーム分解,生文書検索,きめ細かい証拠検索,クレーム中心の要約,正確性判定という5つのコンポーネントが含まれています。
論文参考訳（メタデータ） (2023-05-19T17:49:19Z)
GERE: Generative Evidence Retrieval for Fact Verification [57.78768817972026]
本稿では,ジェネレーション方式で証拠を検索する最初のシステムであるGEREを提案する。 FEVERデータセットの実験結果は、GEREが最先端のベースラインよりも大幅に改善されていることを示している。
論文参考訳（メタデータ） (2022-04-12T03:49:35Z)
Assessing Effectiveness of Using Internal Signals for Check-Worthy Claim Identification in Unlabeled Data for Automated Fact-Checking [6.193231258199234]
本稿では,偽ニュース記事からチェック価値のあるクレーム文を特定する手法について検討する。我々は2つの内部監督信号(見出しと抽象的な要約)を利用して文をランク付けする。見出しは、ファクトチェックのWebサイトがクレームを記述する方法とよく似ているが、要約ベースのパイプラインは、エンドツーエンドのファクトチェックシステムにとって最も有望である。
論文参考訳（メタデータ） (2021-11-02T16:17:20Z)
Assisting the Human Fact-Checkers: Detecting All Previously Fact-Checked Claims in a Document [27.076320857009655]
入力文書が与えられた場合、以前に事実確認されたクレームによって検証可能なクレームを含むすべての文を検出することを目的としている。出力は文書文の再ランクリストであり、検証可能なものは可能な限り高くランク付けされる。本分析は,テキストの類似性やスタンスをモデル化することの重要性を実証すると同時に,検索した事実チェックされたクレームの正確性も考慮する。
論文参考訳（メタデータ） (2021-09-14T13:46:52Z)
Graph-based Retrieval for Claim Verification over Cross-Document Evidence [0.6853165736531939]
グラフに基づくアプローチは、断片化された証拠を特定するのに役立つと推測する。我々はこの仮説を、コーパス全体にわたって、上述したエンティティによってテキスト部分を相互接続する大きなグラフを構築して検証した。実験により,グラフ構造を活用することは,クレームに関連する通路のごく一部を特定する上で有益であることが確認された。
論文参考訳（メタデータ） (2021-09-13T14:54:26Z)
Generating Fact Checking Summaries for Web Claims [8.980876474818153]
本稿では,テキスト文書の形での証拠に基づくテキストクレームの正当性を確立するために,ニューラルアテンションに基づくアプローチを提案する。政治・医療・環境問題に関するデータセットに対するアプローチの有効性を示す。
論文参考訳（メタデータ） (2020-10-16T18:10:47Z)
Multilevel Text Alignment with Cross-Document Attention [59.76351805607481]
既存のアライメントメソッドは、1つの事前定義されたレベルで動作します。本稿では,文書を文書間注目要素で表現するための階層的アテンションエンコーダを予め確立した新しい学習手法を提案する。
論文参考訳（メタデータ） (2020-10-03T02:52:28Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。