論文の概要: Article Reranking by Memory-Enhanced Key Sentence Matching for Detecting
Previously Fact-Checked Claims
- arxiv url: http://arxiv.org/abs/2112.10322v1
- Date: Mon, 20 Dec 2021 03:32:28 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-22 01:53:37.294902
- Title: Article Reranking by Memory-Enhanced Key Sentence Matching for Detecting
Previously Fact-Checked Claims
- Title(参考訳): メモリ強化キーセンテンスマッチングによる前Fact-Checked Claimの検出
- Authors: Qiang Sheng, Juan Cao, Xueyao Zhang, Xirong Li, Lei Zhong
- Abstract要約: Falseは、以前に事実確認されたという主張は、まだソーシャルメディアに広まる可能性がある。
本稿では,イベント(語彙および意味)とパターン情報から選択したキー文を用いて,FCアーティクルのランク付けを行う新しいリランカMTMを提案する。
2つの実世界のデータセットの実験では、MTMが既存の手法より優れていることが示されている。
- 参考スコア(独自算出の注目度): 13.002018511641742
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: False claims that have been previously fact-checked can still spread on
social media. To mitigate their continual spread, detecting previously
fact-checked claims is indispensable. Given a claim, existing works focus on
providing evidence for detection by reranking candidate fact-checking articles
(FC-articles) retrieved by BM25. However, these performances may be limited
because they ignore the following characteristics of FC-articles: (1) claims
are often quoted to describe the checked events, providing lexical information
besides semantics; (2) sentence templates to introduce or debunk claims are
common across articles, providing pattern information. Models that ignore the
two aspects only leverage semantic relevance and may be misled by sentences
that describe similar but irrelevant events. In this paper, we propose a novel
reranker, MTM (Memory-enhanced Transformers for Matching) to rank FC-articles
using key sentences selected with event (lexical and semantic) and pattern
information. For event information, we propose a ROUGE-guided Transformer which
is finetuned with regression of ROUGE. For pattern information, we generate
pattern vectors for matching with sentences. By fusing event and pattern
information, we select key sentences to represent an article and then predict
if the article fact-checks the given claim using the claim, key sentences, and
patterns. Experiments on two real-world datasets show that MTM outperforms
existing methods. Human evaluation proves that MTM can capture key sentences
for explanations. The code and the dataset are at
https://github.com/ICTMCG/MTM.
- Abstract(参考訳): 事実確認済みの虚偽の主張は、今でもソーシャルメディアに広まる可能性がある。
継続的な拡散を緩和するには、事前の事実確認クレームの検出が不可欠である。
既存の研究は、BM25が取得した候補事実チェック記事(FC-articles)を再評価することで、検出の証拠を提供することに重点を置いている。
しかし、これらの性能は、FC-アーティクルの次の特徴を無視しているため、制限される可能性がある:(1)クレームは、チェックイベントを記述するためにしばしば引用され、セマンティクス以外の語彙情報を提供する。
2つの側面を無視するモデルは意味的関連性のみを利用し、類似しているが無関係な事象を記述する文によって誤解されることがある。
本稿では、イベント(語彙と意味)とパターン情報から選択したキー文を用いて、FCアーティクルをランク付けする新しいリランカ MTM (Memory-enhanced Transformer for Matching) を提案する。
イベント情報に対しては,ROUGEの回帰を微調整したROUGE誘導変換器を提案する。
パターン情報に対して,文と一致するパターンベクトルを生成する。
イベント情報とパターン情報を融合することにより、記事を表すキー文を選択し、その記事がクレーム、キー文、パターンを用いてクレームを事実チェックするかどうかを予測する。
2つの実世界のデータセットの実験では、MTMが既存の手法より優れていることが示されている。
人間の評価は、MTMが説明のために重要な文をキャプチャできることを証明する。
コードとデータセットはhttps://github.com/ICTMCG/MTMにある。
関連論文リスト
- Contrastive Learning to Improve Retrieval for Real-world Fact Checking [84.57583869042791]
ファクト・チェッキング・リランカ(Contrastive Fact-Checking Reranker, CFR)を提案する。
我々はAVeriTeCデータセットを活用し、証拠文書からの人間による回答とクレームのサブクエストを注釈付けする。
データセットの精度は6%向上した。
論文 参考訳(メタデータ) (2024-10-07T00:09:50Z) - Detecting, Explaining, and Mitigating Memorization in Diffusion Models [49.438362005962375]
そこで本研究では,テキスト条件予測の大きさを検査することで,暗黙のプロンプトを検出する方法を提案する。
提案手法はサンプリングアルゴリズムを中断することなくシームレスに統合し,第1世代でも高い精度を実現する。
検出戦略に基づいて,個々の単語やトークンの記憶への寄与を示す説明可能なアプローチを提示する。
論文 参考訳(メタデータ) (2024-07-31T16:13:29Z) - Fact Checking Beyond Training Set [64.88575826304024]
本稿では,レトリバーリーダが,あるドメインのラベル付きデータに基づいてトレーニングし,別のドメインで使用する場合,性能劣化に悩まされることを示す。
本稿では,レトリバー成分を分散シフトに対して頑健にするための逆アルゴリズムを提案する。
次に、これらのデータセットから8つの事実チェックシナリオを構築し、モデルと強力なベースラインモデルのセットを比較します。
論文 参考訳(メタデータ) (2024-03-27T15:15:14Z) - WiCE: Real-World Entailment for Claims in Wikipedia [63.234352061821625]
We propose WiCE, a new fine-fine textual entailment dataset built on natural claim and evidence pairs from Wikipedia。
標準クレームレベルのエンターメントに加えて、WiCEはクレームのサブ文単位に対するエンターメント判断を提供する。
我々のデータセットの真のクレームは、既存のモデルで対処できない検証と検索の問題に挑戦することを含んでいる。
論文 参考訳(メタデータ) (2023-03-02T17:45:32Z) - CoCo: Coherence-Enhanced Machine-Generated Text Detection Under Data
Limitation With Contrastive Learning [14.637303913878435]
低リソースシナリオ下でMGTを検出するために,コヒーレンスに基づくコントラスト学習モデルCoCoを提案する。
言語的特徴を活用するために,グラフ形式でコヒーレンス情報をテキスト表現にエンコードする。
2つの公開データセットと2つの自己構築データセットの実験結果は、我々のアプローチが最先端の手法を大幅に上回っていることを証明している。
論文 参考訳(メタデータ) (2022-12-20T15:26:19Z) - Harnessing Abstractive Summarization for Fact-Checked Claim Detection [8.49182897482236]
ソーシャルメディアプラットフォームは、反社会的要素の新たな戦場となり、誤った情報が選択の武器となっている。
この解決策は、ファクトチェックのライフサイクルを部分的に自動化し、高い認知を必要とするタスクに人間の時間を節約することにある、と私たちは信じています。
本稿では,抽象的な要約を用いたクェリを効率的に検出し,クェリを生成するワークフローを提案する。
論文 参考訳(メタデータ) (2022-09-10T07:32:36Z) - GERE: Generative Evidence Retrieval for Fact Verification [57.78768817972026]
本稿では,ジェネレーション方式で証拠を検索する最初のシステムであるGEREを提案する。
FEVERデータセットの実験結果は、GEREが最先端のベースラインよりも大幅に改善されていることを示している。
論文 参考訳(メタデータ) (2022-04-12T03:49:35Z) - Mining Fine-grained Semantics via Graph Neural Networks for
Evidence-based Fake News Detection [20.282527436527765]
本稿では,グラフベースのsEmantic sTructureマイニングフレームワークを提案する。
我々は、クレームとエビデンスをグラフ構造化データとしてモデル化し、長距離セマンティック依存関係をキャプチャします。
文脈意味情報を得た後、グラフ構造学習を行うことにより、情報冗長性を低減する。
論文 参考訳(メタデータ) (2022-01-18T11:28:36Z) - Assessing Effectiveness of Using Internal Signals for Check-Worthy Claim
Identification in Unlabeled Data for Automated Fact-Checking [6.193231258199234]
本稿では,偽ニュース記事からチェック価値のあるクレーム文を特定する手法について検討する。
我々は2つの内部監督信号(見出しと抽象的な要約)を利用して文をランク付けする。
見出しは、ファクトチェックのWebサイトがクレームを記述する方法とよく似ているが、要約ベースのパイプラインは、エンドツーエンドのファクトチェックシステムにとって最も有望である。
論文 参考訳(メタデータ) (2021-11-02T16:17:20Z) - Counterfactual Interventions Reveal the Causal Effect of Relative Clause
Representations on Agreement Prediction [61.4913233397155]
BERTが言語戦略を用いて合意予測中にRCスパンに関する情報を使用することを示す。
また,特定のRCサブタイプに対して生成された反事実表現が,他のRCサブタイプを含む文の数値予測に影響を及ぼし,RC境界に関する情報がBERTの表現に抽象的に符号化されたことを示唆した。
論文 参考訳(メタデータ) (2021-05-14T17:11:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。