論文の概要: CoVERT: A Corpus of Fact-checked Biomedical COVID-19 Tweets
- arxiv url: http://arxiv.org/abs/2204.12164v1
- Date: Tue, 26 Apr 2022 09:05:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-27 19:46:16.788020
- Title: CoVERT: A Corpus of Fact-checked Biomedical COVID-19 Tweets
- Title(参考訳): CoVERT: バイオメディカルなCOVID-19のツイートをチェック
- Authors: Isabelle Mohr and Amelie W\"uhrl and Roman Klinger
- Abstract要約: CoVERTは事実確認されたツイートのコーパスで、バイオメディシンと新型コロナウイルス関連の情報(ミス)に焦点を当てている。
我々は、新しいクラウドソーシング手法を用いて、すべてのツイートにファクトチェックラベルを付加し、クラウドワーカーがオンラインで検索する証拠を支持する。
得られたエビデンス抽出をファクトチェックパイプラインの一部として使用し、実世界のエビデンスの方が、事前訓練された言語モデルで間接的に利用できる知識よりも有用であることを確認した。
- 参考スコア(独自算出の注目度): 10.536415845097661
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Over the course of the COVID-19 pandemic, large volumes of biomedical
information concerning this new disease have been published on social media.
Some of this information can pose a real danger to people's health,
particularly when false information is shared, for instance recommendations on
how to treat diseases without professional medical advice. Therefore, automatic
fact-checking resources and systems developed specifically for the medical
domain are crucial. While existing fact-checking resources cover
COVID-19-related information in news or quantify the amount of misinformation
in tweets, there is no dataset providing fact-checked COVID-19-related Twitter
posts with detailed annotations for biomedical entities, relations and relevant
evidence. We contribute CoVERT, a fact-checked corpus of tweets with a focus on
the domain of biomedicine and COVID-19-related (mis)information. The corpus
consists of 300 tweets, each annotated with medical named entities and
relations. We employ a novel crowdsourcing methodology to annotate all tweets
with fact-checking labels and supporting evidence, which crowdworkers search
for online. This methodology results in moderate inter-annotator agreement.
Furthermore, we use the retrieved evidence extracts as part of a fact-checking
pipeline, finding that the real-world evidence is more useful than the
knowledge indirectly available in pretrained language models.
- Abstract(参考訳): 新型コロナウイルス(covid-19)パンデミックの期間中、この病気に関する大量のバイオメディカル情報がソーシャルメディアで公開されている。
これらの情報のいくつかは、特に偽情報を共有する場合、特に専門的な医療アドバイスなしで病気を治療する方法を推奨する場合、人々の健康に深刻な危険をもたらす可能性がある。
そのため,医療分野に特化したファクトチェック・リソースやシステムの開発が重要である。
既存の事実チェックリソースは、ニュースの新型コロナウイルス関連情報をカバーしたり、ツイート中の誤情報の量を定量化したりするが、事実チェックされたcovid-19関連twitter投稿に、生物医学的実体、関係性、関連する証拠に関する詳細な注釈を含むデータセットはない。
私たちは、バイオメディシンとcovid-19関連情報(mis)の領域に焦点を当てた、事実チェックされたツイートコーパスであるcovertに貢献します。
コーパスは300のツイートで構成され、それぞれに医学名と関係性を示す。
我々は、新しいクラウドソーシング手法を用いて、すべてのツイートにファクトチェックラベルを付加し、クラウドワーカーがオンラインで検索する証拠を支持する。
この手法は中程度のアノテーション間の合意をもたらす。
さらに,得られたエビデンス抽出をファクトチェックパイプラインの一部として使用し,実世界のエビデンスの方が,事前学習された言語モデルで直接利用できる知識よりも有用であることを確認した。
関連論文リスト
- AMIR: Automated MisInformation Rebuttal -- A COVID-19 Vaccination Datasets based Recommendation System [0.05461938536945722]
本研究は,ソーシャルメディアから得られる既存の情報を活用して,大規模な誤報の自動報知を容易にする方法について検討した。
FaCov(ファクトチェック記事)と誤解を招く(ソーシャルメディアTwitter)という、新型コロナウイルスワクチンに関する2つの公開データセットを活用している。
論文 参考訳(メタデータ) (2023-10-29T13:07:33Z) - METS-CoV: A Dataset of Medical Entity and Targeted Sentiment on COVID-19
Related Tweets [13.35986397208115]
本稿では、医療機関と新型コロナウイルス関連ツイートのターゲット感情を含むデータセットであるMETS-CoVをリリースする。
私たちの知る限りでは、METS-CoVは、新型コロナウイルス関連ツイートの医療機関とそれに対応する感情を収集する最初のデータセットです。
論文 参考訳(メタデータ) (2022-09-28T01:55:14Z) - EBOCA: Evidences for BiOmedical Concepts Association Ontology [55.41644538483948]
本論文は,生物医学領域の概念とそれらの関連性を記述するオントロジーであるEBOCAと,それらの関連性を支持するエビデンスを提案する。
DISNETのサブセットから得られるテストデータとテキストからの自動アソシエーション抽出が変換され、実際のシナリオで使用できる知識グラフが作成されるようになった。
論文 参考訳(メタデータ) (2022-08-01T18:47:03Z) - "COVID-19 was a FIFA conspiracy #curropt": An Investigation into the
Viral Spread of COVID-19 Misinformation [60.268682953952506]
我々は、自然言語処理モデルを用いて、誤報がCOVID-19パンデミックの進行にどのような影響を及ぼしたかを推定する。
我々は、広範囲に害をもたらす可能性のあるソーシャルメディアポストと戦うための戦略を提供する。
論文 参考訳(メタデータ) (2022-06-12T19:41:01Z) - Monant Medical Misinformation Dataset: Mapping Articles to Fact-Checked
Claims [0.6927055673104934]
317kの医療ニュース記事/ブログと3.5kのファクトチェッククレームの特徴豊富なデータセットを公開しています。
また、手動で533件、クレームと記事のマッピングを51万件以上自動的にラベル付けしている。
このデータセットは、誤情報特徴化研究やソース間の誤情報拡散の研究など、医療的誤情報に関連する多くのタスクを可能にする。
論文 参考訳(メタデータ) (2022-04-26T13:18:27Z) - When Accuracy Meets Privacy: Two-Stage Federated Transfer Learning
Framework in Classification of Medical Images on Limited Data: A COVID-19
Case Study [77.34726150561087]
新型コロナウイルスのパンデミックが急速に広がり、世界の医療資源が不足している。
CNNは医療画像の解析に広く利用され、検証されている。
論文 参考訳(メタデータ) (2022-03-24T02:09:41Z) - Cross-lingual COVID-19 Fake News Detection [54.125563009333995]
低リソース言語(中国語)における新型コロナウイルスの誤報を検出するための最初の試みは、高リソース言語(英語)における事実チェックされたニュースのみを用いて行われる。
そこで我々は、クロスランガルなニュースボディテキストを共同でエンコードし、ニュースコンテンツをキャプチャするCrossFakeというディープラーニングフレームワークを提案する。
実験結果から,クロスランガル環境下でのCrossFakeの有効性が示された。
論文 参考訳(メタデータ) (2021-10-13T04:44:02Z) - Domain-Specific Pretraining for Vertical Search: Case Study on
Biomedical Literature [67.4680600632232]
自己教師型学習は、アノテーションのボトルネックを克服するための有望な方向として現れました。
本稿では,ドメイン固有の事前学習に基づく垂直探索手法を提案する。
我々のシステムはPubMed上で何千万もの記事にスケールでき、Microsoft Biomedical Searchとしてデプロイされている。
論文 参考訳(メタデータ) (2021-06-25T01:02:55Z) - Claim Detection in Biomedical Twitter Posts [11.335643770130238]
生体医学に関する誤った情報は特に危険である。
我々は、この研究ギャップを埋め、暗黙的かつ明示的なバイオメディカルクレームのために1200ツイートのコーパスに注釈を付けることを目指している。
クレームを含むツイートを自動的に検出するベースラインモデルを開発。
論文 参考訳(メタデータ) (2021-04-23T14:45:31Z) - Misinformation Has High Perplexity [55.47422012881148]
疑似クレームを教師なしの方法でデバンクするために, 難易度を活用することを提案する。
まず,これらの主張に類似した文に基づいて,科学的およびニュースソースから信頼性のある証拠を抽出する。
第2に,抽出したエビデンスを言語モデルにプライマリし,難易度スコアに基づいて与えられたクレームの正当性を評価する。
論文 参考訳(メタデータ) (2020-06-08T15:13:44Z) - An Exploratory Study of COVID-19 Misinformation on Twitter [5.070542698701158]
新型コロナウイルス(COVID-19)パンデミックの間、ソーシャルメディアは誤報の本拠地となっている。
新型コロナウイルスの話題に関して,Twitter上での誤報の伝播,著者,内容に関する探索的研究を行った。
論文 参考訳(メタデータ) (2020-05-12T12:07:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。