論文の概要: FacTeR-Check: Semi-automated fact-checking through Semantic Similarity
and Natural Language Inference
- arxiv url: http://arxiv.org/abs/2110.14532v1
- Date: Wed, 27 Oct 2021 15:44:54 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-28 14:29:31.468364
- Title: FacTeR-Check: Semi-automated fact-checking through Semantic Similarity
and Natural Language Inference
- Title(参考訳): FacTeR-Check:意味的類似性と自然言語推論による半自動事実チェック
- Authors: Alejandro Mart\'in and Javier Huertas-Tato and \'Alvaro
Huertas-Garc\'ia and Guillermo Villar-Rodr\'iguez and David Camacho
- Abstract要約: FacTeR-Checkは、ファクトチェックされた情報の検索、未確認のクレームの検証、ソーシャルメディア上での危険な情報の追跡を可能にする。
このアーキテクチャは、NLI19-SPと呼ばれる新しいデータセットを使って検証されている。
この結果から,各ベンチマークにおける最先端性能と,61種類のホアックスの時間経過に伴う進化の有用な解析結果が得られた。
- 参考スコア(独自算出の注目度): 61.068947982746224
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Our society produces and shares overwhelming amounts of information through
the Online Social Networks (OSNs). Within this environment, misinformation and
disinformation have proliferated, becoming a public safety concern on every
country. Allowing the public and professionals to efficiently find reliable
evidence about the factual veracity of a claim is crucial to mitigate this
harmful spread. To this end, we propose FacTeR-Check, a multilingual
architecture for semi-automated fact-checking that can be used for either the
general public but also useful for fact-checking organisations. FacTeR-Check
enables retrieving fact-checked information, unchecked claims verification and
tracking dangerous information over social media. This architectures involves
several modules developed to evaluate semantic similarity, to calculate natural
language inference and to retrieve information from Online Social Networks. The
union of all these modules builds a semi-automated fact-checking tool able of
verifying new claims, to extract related evidence, and to track the evolution
of a hoax on a OSN. While individual modules are validated on related
benchmarks (mainly MSTS and SICK), the complete architecture is validated using
a new dataset called NLI19-SP that is publicly released with COVID-19 related
hoaxes and tweets from Spanish social media. Our results show state-of-the-art
performance on the individual benchmarks, as well as producing useful analysis
of the evolution over time of 61 different hoaxes.
- Abstract(参考訳): 我々の社会は、オンラインソーシャルネットワーク(OSN)を通じて、圧倒的な量の情報を生産し、共有しています。
この環境の中で、誤情報や誤情報が広まり、各国の公安問題となっている。
公的および専門家がクレームの事実の有効性に関する信頼できる証拠を効率的に見つけられるようにすることは、この有害な拡散を緩和するために不可欠である。
この目的のためにFacTeR-Checkを提案する。FacTeR-Checkは、半自動化された事実チェックのための多言語アーキテクチャで、一般向けにも利用できるが、事実チェックの組織にも有用である。
facter-checkは、事実チェックされた情報、未チェックのクレーム検証、ソーシャルメディア上の危険な情報追跡を可能にする。
このアーキテクチャは、意味的類似性を評価し、自然言語推論を計算し、オンラインソーシャルネットワークから情報を取得するために開発されたいくつかのモジュールを含んでいる。
これらのモジュールの結合は、新しいクレームを検証し、関連する証拠を抽出し、OSN上のホックスの進化を追跡することができる半自動事実チェックツールを構築する。
個々のモジュールは関連するベンチマーク(主にMSTSとSICK)で検証されるが、完全なアーキテクチャはNLI19-SPと呼ばれる新しいデータセットを使用して検証される。
この結果から,各ベンチマークにおける最先端性能と,61種類のホアックスの時間経過に伴う進化の有用な解析結果が得られた。
関連論文リスト
- How to Train Your Fact Verifier: Knowledge Transfer with Multimodal Open Models [95.44559524735308]
大規模言語またはマルチモーダルモデルに基づく検証は、偽コンテンツや有害コンテンツの拡散を緩和するためのオンラインポリシングメカニズムをスケールアップするために提案されている。
我々は,知識伝達の初期研究を通じて,継続的な更新を行うことなく基礎モデルの性能向上の限界をテストする。
最近の2つのマルチモーダルなファクトチェックベンチマークであるMochegとFakedditの結果は、知識伝達戦略がファクドディットのパフォーマンスを最先端よりも1.7%向上し、Mochegのパフォーマンスを2.9%向上させることができることを示唆している。
論文 参考訳(メタデータ) (2024-06-29T08:39:07Z) - Automated Claim Matching with Large Language Models: Empowering
Fact-Checkers in the Fight Against Misinformation [11.323961700172175]
FACT-GPTは、大規模言語モデルを用いたファクトチェックのクレームマッチングフェーズを自動化するために設計されたフレームワークである。
このフレームワークは、ファクトチェッカーによって以前否定された主張を支持したり、否定したりする新しいソーシャルメディアコンテンツを識別する。
FACT-GPTを公衆衛生に関連するソーシャルメディアコンテンツのデータセットとして評価した。
論文 参考訳(メタデータ) (2023-10-13T16:21:07Z) - FactLLaMA: Optimizing Instruction-Following Language Models with
External Knowledge for Automated Fact-Checking [10.046323978189847]
本稿では,命令追従言語モデルと外部エビデンス検索を併用して,ファクトチェック性能を向上させることを提案する。
我々のアプローチは、与えられた入力クレームに関する適切な証拠を検索するために検索エンジンを活用することである。
そして、この証拠を用いて、LLaMAと呼ばれるオープンソースの言語モデルを作成し、入力クレームの正確性をより正確に予測できるようにする。
論文 参考訳(メタデータ) (2023-09-01T04:14:39Z) - ManiTweet: A New Benchmark for Identifying Manipulation of News on Social Media [74.93847489218008]
ソーシャルメディア上でのニュースの操作を識別し,ソーシャルメディア投稿の操作を検出し,操作された情報や挿入された情報を特定することを目的とした,新しいタスクを提案する。
この課題を研究するために,データ収集スキーマを提案し,3.6K対のツイートとそれに対応する記事からなるManiTweetと呼ばれるデータセットをキュレートした。
我々の分析では、このタスクは非常に難しいことを示し、大きな言語モデル(LLM)は不満足なパフォーマンスをもたらす。
論文 参考訳(メタデータ) (2023-05-23T16:40:07Z) - CHEF: A Pilot Chinese Dataset for Evidence-Based Fact-Checking [55.75590135151682]
CHEFは、10万件の現実世界のクレームに関する最初のChenese EvidenceベースのFact-checkingデータセットである。
このデータセットは、政治から公衆衛生まで、複数のドメインをカバーし、インターネットから取得した注釈付きの証拠を提供する。
論文 参考訳(メタデータ) (2022-06-06T09:11:03Z) - Applying Automatic Text Summarization for Fake News Detection [4.2177790395417745]
フェイクニュースの配信は新しいものではなく、急速に増加している問題だ。
本稿ではトランスフォーマーに基づく言語モデルのパワーを組み合わせた問題に対するアプローチを提案する。
我々のフレームワークであるCMTR-BERTは、複数のテキスト表現を組み合わせることで、コンテキスト情報の取り込みを可能にする。
論文 参考訳(メタデータ) (2022-04-04T21:00:55Z) - Synthetic Disinformation Attacks on Automated Fact Verification Systems [53.011635547834025]
本研究では,2つのシミュレーション環境において,自動ファクトチェッカーの合成正反対証拠に対する感度について検討する。
これらのシステムでは,これらの攻撃に対して大幅な性能低下がみられた。
偽情報の発生源としての現代のNLGシステムの脅威の増大について論じる。
論文 参考訳(メタデータ) (2022-02-18T19:01:01Z) - CsFEVER and CTKFacts: Czech Datasets for Fact Verification [0.0]
自動ファクトチェック機械学習モデルのトレーニングを目的としたチェコのデータセットを2つ提示する。
最初のデータセットは、約112kのクレームを持つCsFEVERで、有名なウィキペディアベースのFEVERデータセットのチェコ語バージョンを自動生成する。
3,097件からなる2番目のデータセットCTKFactsは、約200万件のチェコのニュースエージェンシーの報道のコーパス上に構築されている。
論文 参考訳(メタデータ) (2022-01-26T18:48:42Z) - InfoBERT: Improving Robustness of Language Models from An Information
Theoretic Perspective [84.78604733927887]
BERTのような大規模言語モデルは、幅広いNLPタスクで最先端のパフォーマンスを実現している。
近年の研究では、このようなBERTベースのモデルが、テキストの敵対的攻撃の脅威に直面していることが示されている。
本稿では,事前学習した言語モデルの堅牢な微調整のための新しい学習フレームワークであるInfoBERTを提案する。
論文 参考訳(メタデータ) (2020-10-05T20:49:26Z) - Sentimental LIAR: Extended Corpus and Deep Learning Models for Fake
Claim Classification [11.650381752104296]
本稿では,ソーシャルメディア上での誤文クレームの自動検出のための新しい深層学習手法を提案する。
まず,感傷的LIARを紹介する。このLIARデータセットは,クレームの感情分析と感情分析に基づく特徴を加えることで,短いクレームのLIARデータセットを拡張する。
この結果から,センチメンタルLIARでトレーニングしたアーキテクチャでは70%の精度が得られ,従来報告したLIARベンチマークよりも30%向上したことがわかった。
論文 参考訳(メタデータ) (2020-09-01T02:48:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。