論文の概要: Scalable Fact-checking with Human-in-the-Loop
- arxiv url: http://arxiv.org/abs/2109.10992v1
- Date: Wed, 22 Sep 2021 19:19:59 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-24 15:06:32.820769
- Title: Scalable Fact-checking with Human-in-the-Loop
- Title(参考訳): Human-in-the-Loopによるスケーラブルなファクトチェック
- Authors: Jing Yang, Didier Vega-Oliveros, Tais Seibt and Anderson Rocha
- Abstract要約: ファクトチェックを加速するために、同様のメッセージをグループ化し、それらを集約されたクレームにまとめることで、このギャップを埋める。
その結果,大規模かつ冗長なメッセージから代表的クレームを整理し,選択することで,ファクトチェックプロセスを高速化する可能性が示された。
- 参考スコア(独自算出の注目度): 17.1138216746642
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Researchers have been investigating automated solutions for fact-checking in
a variety of fronts. However, current approaches often overlook the fact that
the amount of information released every day is escalating, and a large amount
of them overlap. Intending to accelerate fact-checking, we bridge this gap by
grouping similar messages and summarizing them into aggregated claims.
Specifically, we first clean a set of social media posts (e.g., tweets) and
build a graph of all posts based on their semantics; Then, we perform two
clustering methods to group the messages for further claim summarization. We
evaluate the summaries both quantitatively with ROUGE scores and qualitatively
with human evaluation. We also generate a graph of summaries to verify that
there is no significant overlap among them. The results reduced 28,818 original
messages to 700 summary claims, showing the potential to speed up the
fact-checking process by organizing and selecting representative claims from
massive disorganized and redundant messages.
- Abstract(参考訳): 研究者はさまざまな分野でファクトチェックの自動化ソリューションを調査している。
しかし、現在のアプローチでは、毎日放出される情報量が増大し、それらが重なり合うという事実をしばしば見落としている。
ファクトチェックを加速するために、同様のメッセージをグループ化し、それらを集約されたクレームにまとめることで、このギャップを埋める。
具体的には、まずソーシャルメディア投稿の集合(例えば、つぶやき)をきれいにし、セマンティクスに基づいて全投稿のグラフを構築する。
ROUGEスコアと人間の評価を定量的に,質的に評価した。
また、それらの間に大きな重複がないことを確認するための要約グラフも作成します。
その結果、オリジナルのメッセージ28,818件を700件まで減らし、大規模な非組織的メッセージと冗長なメッセージから代表的クレームを編成し、選択することで事実確認プロセスを高速化する可能性を示した。
関連論文リスト
- Incremental Extractive Opinion Summarization Using Cover Trees [81.59625423421355]
オンラインマーケットプレースでは、ユーザレビューは時間とともに蓄積され、意見要約を定期的に更新する必要がある。
本研究では,漸進的な環境下での抽出的意見要約の課題について検討する。
本稿では,CentroidRankの要約をインクリメンタルな設定で正確に計算するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-01-16T02:00:17Z) - From Chaos to Clarity: Claim Normalization to Empower Fact-Checking [57.024192702939736]
Claim Normalization(別名 ClaimNorm)は、複雑でノイズの多いソーシャルメディア投稿を、より単純で分かりやすい形式に分解することを目的としている。
本稿では,チェーン・オブ・ソートとクレーム・チェック・バシネス推定を利用した先駆的アプローチであるCACNを提案する。
実験により, CACNは様々な評価尺度において, いくつかの基準値を上回る性能を示した。
論文 参考訳(メタデータ) (2023-10-22T16:07:06Z) - USB: A Unified Summarization Benchmark Across Tasks and Domains [68.82726887802856]
ウィキペディア由来のベンチマークを導入し、クラウドソースアノテーションの豊富なセットを補完し、8ドルの相互関連タスクをサポートする。
このベンチマークで様々な手法を比較し、複数のタスクにおいて、中程度の大きさの微調整されたモデルが、より大きな数発の言語モデルよりも一貫して優れていることを発見した。
論文 参考訳(メタデータ) (2023-05-23T17:39:54Z) - Harnessing Abstractive Summarization for Fact-Checked Claim Detection [8.49182897482236]
ソーシャルメディアプラットフォームは、反社会的要素の新たな戦場となり、誤った情報が選択の武器となっている。
この解決策は、ファクトチェックのライフサイクルを部分的に自動化し、高い認知を必要とするタスクに人間の時間を節約することにある、と私たちは信じています。
本稿では,抽象的な要約を用いたクェリを効率的に検出し,クェリを生成するワークフローを提案する。
論文 参考訳(メタデータ) (2022-09-10T07:32:36Z) - Improved Topic modeling in Twitter through Community Pooling [0.0]
Twitterの投稿は短いが、他のテキストよりも一貫性が低いことが多い。
著者が同じコミュニティに属しているツイートをグループ化する,トピックモデリングのための新しいプール方式を提案する。
その結果、我々のコミュニティポーリング手法は、2つの異種データセットの指標の大部分において、他の手法よりも優れていた。
論文 参考訳(メタデータ) (2021-12-20T17:05:32Z) - AnswerSumm: A Manually-Curated Dataset and Pipeline for Answer
Summarization [73.91543616777064]
Stack OverflowやYahoo!のようなコミュニティ質問回答(CQA)フォーラムには、幅広いコミュニティベースの質問に対する回答の豊富なリソースが含まれている。
回答の要約の1つのゴールは、回答の視点の範囲を反映した要約を作成することである。
本研究は,専門言語学者による解答要約のための4,631個のCQAスレッドからなる新しいデータセットを導入する。
論文 参考訳(メタデータ) (2021-11-11T21:48:02Z) - Author Clustering and Topic Estimation for Short Texts [69.54017251622211]
同じ文書中の単語間の強い依存をモデル化することにより、遅延ディリクレ割当を拡張できる新しいモデルを提案する。
同時にユーザをクラスタ化し、ホック後のクラスタ推定の必要性を排除しています。
我々の手法は、短文で生じる問題に対する従来のアプローチよりも、-または----------- で機能する。
論文 参考訳(メタデータ) (2021-06-15T20:55:55Z) - Word Embedding-based Text Processing for Comprehensive Summarization and
Distinct Information Extraction [1.552282932199974]
オンラインレビューの分析に特化して設計された2つの自動テキスト処理フレームワークを提案する。
最初のフレームワークは、本質的な文章を抽出してレビューデータセットを要約することである。
第2のフレームワークは、複数の異なる質問に対する回答を抽出するように訓練された質問回答ニューラルネットワークモデルに基づいている。
論文 参考訳(メタデータ) (2020-04-21T02:43:31Z) - Generating Fact Checking Explanations [52.879658637466605]
まだ欠けているパズルの重要なピースは、プロセスの最も精巧な部分を自動化する方法を理解することです。
本稿では、これらの説明を利用可能なクレームコンテキストに基づいて自動生成する方法について、最初の研究を行う。
この結果から,個別に学習するのではなく,両目標を同時に最適化することで,事実確認システムの性能が向上することが示唆された。
論文 参考訳(メタデータ) (2020-04-13T05:23:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。