論文の概要: Extracting a Knowledge Base of COVID-19 Events from Social Media
- arxiv url: http://arxiv.org/abs/2006.02567v4
- Date: Fri, 9 Sep 2022 07:21:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-25 18:22:04.907813
- Title: Extracting a Knowledge Base of COVID-19 Events from Social Media
- Title(参考訳): ソーシャルメディアからCOVID-19イベントの知識ベースを抽出する
- Authors: Shi Zong, Ashutosh Baheti, Wei Xu, Alan Ritter
- Abstract要約: 本稿では,5件のCOVID-19イベントの公開報告を含む1万件のツイートを手動で注釈付けしたコーパスを提示する。
イベントタイプ毎にスロット充填質問を設計し,イベントの位置,最近の旅行,近接接触など,合計31のきめ細かいスロットを注釈付けした。
当社のコーパスは細調整のBERT分類器をサポートして,報告された事象を自動的に抽出し,新たな疾患の拡散を追跡できることを示す。
- 参考スコア(独自算出の注目度): 20.582661513917845
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we present a manually annotated corpus of 10,000 tweets
containing public reports of five COVID-19 events, including positive and
negative tests, deaths, denied access to testing, claimed cures and
preventions. We designed slot-filling questions for each event type and
annotated a total of 31 fine-grained slots, such as the location of events,
recent travel, and close contacts. We show that our corpus can support
fine-tuning BERT-based classifiers to automatically extract publicly reported
events and help track the spread of a new disease. We also demonstrate that, by
aggregating events extracted from millions of tweets, we achieve surprisingly
high precision when answering complex queries, such as "Which organizations
have employees that tested positive in Philadelphia?" We will release our
corpus (with user-information removed), automatic extraction models, and the
corresponding knowledge base to the research community.
- Abstract(参考訳): 本稿では、新型コロナウイルスの陽性および陰性の検査、死亡、検査の拒否、治療の主張、予防を含む5つの事象に関する公開報告を含む1万ツイートの注釈付きコーパスを手作業で提示する。
各イベントタイプごとにスロット満タンの質問を設計,イベントの場所,最近の旅行,親密な接触など,計31の細かなスロットに注釈を付した。
当社のコーパスは細調整のBERT分類器をサポートして,報告された事象を自動的に抽出し,新たな疾患の拡散を追跡できることを示す。
また、何百万ものツイートから抽出されたイベントを集約することで、"フィラデルフィアで肯定的な従業員がいるか?"といった複雑な質問に答える際、驚くほど高い精度を達成できることも示しています。
我々は,コーパス(ユーザ情報を取り除いた),自動抽出モデル,およびそれに対応する知識ベースを研究コミュニティに公開する。
関連論文リスト
- Poisoning Retrieval Corpora by Injecting Adversarial Passages [79.14287273842878]
本稿では,悪意のあるユーザが少数の逆行を発生させるような,高密度検索システムに対する新たな攻撃を提案する。
これらの逆行路を大規模な検索コーパスに挿入すると、この攻撃はこれらのシステムを騙すのに非常に効果的であることを示す。
また、教師なしと教師なしの両方の最先端の高密度レトリバーをベンチマークし、比較する。
論文 参考訳(メタデータ) (2023-10-29T21:13:31Z) - ManiTweet: A New Benchmark for Identifying Manipulation of News on Social Media [74.93847489218008]
ソーシャルメディア上でのニュースの操作を識別し,ソーシャルメディア投稿の操作を検出し,操作された情報や挿入された情報を特定することを目的とした,新しいタスクを提案する。
この課題を研究するために,データ収集スキーマを提案し,3.6K対のツイートとそれに対応する記事からなるManiTweetと呼ばれるデータセットをキュレートした。
我々の分析では、このタスクは非常に難しいことを示し、大きな言語モデル(LLM)は不満足なパフォーマンスをもたらす。
論文 参考訳(メタデータ) (2023-05-23T16:40:07Z) - COVID-19 event extraction from Twitter via extractive question answering
with continuous prompts [4.447838938807983]
我々は,言語モデルにおける連続的プロンプトの最近の進歩を利用して,イベント抽出の問題を抽出的質問応答として用いた。
我々のアブレーション調査は、連続的なプロンプトが最終的なパフォーマンスに大きな影響を与えていることを示している。
論文 参考訳(メタデータ) (2023-03-19T13:47:56Z) - CoVERT: A Corpus of Fact-checked Biomedical COVID-19 Tweets [10.536415845097661]
CoVERTは事実確認されたツイートのコーパスで、バイオメディシンと新型コロナウイルス関連の情報(ミス)に焦点を当てている。
我々は、新しいクラウドソーシング手法を用いて、すべてのツイートにファクトチェックラベルを付加し、クラウドワーカーがオンラインで検索する証拠を支持する。
得られたエビデンス抽出をファクトチェックパイプラインの一部として使用し、実世界のエビデンスの方が、事前訓練された言語モデルで間接的に利用できる知識よりも有用であることを確認した。
論文 参考訳(メタデータ) (2022-04-26T09:05:03Z) - Automated Evidence Collection for Fake News Detection [11.324403127916877]
本稿では,現在行われている偽ニュース検出手法を改良した新しい手法を提案する。
提案手法は,Web記事からエビデンスを抽出し,エビデンスとして扱うための適切なテキストを選択する。
我々の実験は、機械学習とディープラーニングに基づく手法の両方を用いて、我々のアプローチを広範囲に評価するのに役立つ。
論文 参考訳(メタデータ) (2021-12-13T09:38:41Z) - FacTeR-Check: Semi-automated fact-checking through Semantic Similarity
and Natural Language Inference [61.068947982746224]
FacTeR-Checkは、ファクトチェックされた情報の検索、未確認のクレームの検証、ソーシャルメディア上での危険な情報の追跡を可能にする。
このアーキテクチャは、NLI19-SPと呼ばれる新しいデータセットを使って検証されている。
この結果から,各ベンチマークにおける最先端性能と,61種類のホアックスの時間経過に伴う進化の有用な解析結果が得られた。
論文 参考訳(メタデータ) (2021-10-27T15:44:54Z) - Attacking Open-domain Question Answering by Injecting Misinformation [116.25434773461465]
質問応答モデル(QA)に対する誤報のリスクについて,オープンドメインQAモデルの誤報文書に対する感度について検討した。
実験により、QAモデルは誤情報による少量の証拠汚染に対して脆弱であることが示されている。
質問応答と誤情報検出を統合した誤情報認識型QAシステムの構築の必要性について論じる。
論文 参考訳(メタデータ) (2021-10-15T01:55:18Z) - Claim Detection in Biomedical Twitter Posts [11.335643770130238]
生体医学に関する誤った情報は特に危険である。
我々は、この研究ギャップを埋め、暗黙的かつ明示的なバイオメディカルクレームのために1200ツイートのコーパスに注釈を付けることを目指している。
クレームを含むツイートを自動的に検出するベースラインモデルを開発。
論文 参考訳(メタデータ) (2021-04-23T14:45:31Z) - Leveraging Event Specific and Chunk Span features to Extract COVID
Events from tweets [0.0]
We describe our system entry for WNUT 2020 Shared Task-3。
このタスクは、TwitterからさまざまなCOVID-19関連イベントの抽出を自動化することを目的としていた。
このシステムは、アンサンブルや追加のデータセットを使用せずに、F1の0.6598でリーダーボードで1位にランクインします。
論文 参考訳(メタデータ) (2020-12-18T04:49:32Z) - Generating Fact Checking Briefs [97.82546239639964]
本研究では, 事実確認の精度と効率を高めるために, 事実確認を行う前に, クレームに関する情報を提供することにより, 事実確認の精度と効率を高める方法について検討する。
我々は,クレームに条件付き質問セットを生成し,証拠を検索し,回答を生成するモデルQABrieferを開発した。
本研究では,特にQABriefsにおけるブリーフィングによる事実チェックによって,クラウドワーカーの精度が10%向上すると同時に,時間もわずかに低下することを示す。
論文 参考訳(メタデータ) (2020-11-10T23:02:47Z) - Keystroke Biometrics in Response to Fake News Propagation in a Global
Pandemic [77.79066811371978]
本研究では,キーストロークバイオメトリックスを用いたコンテンツ匿名化手法の提案と解析を行う。
フェイクニュースは、特に主要なイベントにおいて、世論を操作する強力なツールとなっている。
論文 参考訳(メタデータ) (2020-05-15T17:56:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。