論文の概要: Claim Detection in Biomedical Twitter Posts
- arxiv url: http://arxiv.org/abs/2104.11639v1
- Date: Fri, 23 Apr 2021 14:45:31 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-26 14:23:18.134370
- Title: Claim Detection in Biomedical Twitter Posts
- Title(参考訳): バイオメディカルtwitter投稿におけるクレーム検出
- Authors: Amelie W\"uhrl and Roman Klinger
- Abstract要約: 生体医学に関する誤った情報は特に危険である。
我々は、この研究ギャップを埋め、暗黙的かつ明示的なバイオメディカルクレームのために1200ツイートのコーパスに注釈を付けることを目指している。
クレームを含むツイートを自動的に検出するベースラインモデルを開発。
- 参考スコア(独自算出の注目度): 11.335643770130238
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Social media contains unfiltered and unique information, which is potentially
of great value, but, in the case of misinformation, can also do great harm.
With regards to biomedical topics, false information can be particularly
dangerous. Methods of automatic fact-checking and fake news detection address
this problem, but have not been applied to the biomedical domain in social
media yet. We aim to fill this research gap and annotate a corpus of 1200
tweets for implicit and explicit biomedical claims (the latter also with span
annotations for the claim phrase). With this corpus, which we sample to be
related to COVID-19, measles, cystic fibrosis, and depression, we develop
baseline models which detect tweets that contain a claim automatically. Our
analyses reveal that biomedical tweets are densely populated with claims (45 %
in a corpus sampled to contain 1200 tweets focused on the domains mentioned
above). Baseline classification experiments with embedding-based classifiers
and BERT-based transfer learning demonstrate that the detection is challenging,
however, shows acceptable performance for the identification of explicit
expressions of claims. Implicit claim tweets are more challenging to detect.
- Abstract(参考訳): ソーシャルメディアには、フィルターされていないユニークな情報が含まれており、これは大きな価値をもたらす可能性があるが、誤った情報の場合、大きな害を及ぼすこともある。
生物医学的な話題では、誤った情報は特に危険である。
ファクトチェックと偽ニュース検出の方法はこの問題に対処するが、まだソーシャルメディアのバイオメディカル領域には適用されていない。
我々はこの研究ギャップを埋め、暗黙的かつ明示的なバイオメディカルクレーム(後者はクレームフレーズのスパンアノテーションも含む)のために1200ツイートのコーパスに注釈を付けることを目指している。
このコーパスは、新型コロナウイルス、麻疹、嚢胞性線維症、うつ病に関連するものとして、クレームを含むツイートを自動的に検出するベースラインモデルを開発した。
分析の結果,生物医学的つぶやきにはクレームが密集していることが判明した(上述のドメインに焦点を当てた1200のつぶやきを含むコーパスの45パーセント)。
埋め込み型分類器とBERTを用いた転送学習を用いたベースライン分類実験は, 検出が困難であることを示すが, クレームの明示的表現の識別には許容できる性能を示した。
暗黙のクレームツイートは検出が難しい。
関連論文リスト
- Missci: Reconstructing Fallacies in Misrepresented Science [84.32990746227385]
ソーシャルネットワーク上の健康関連の誤報は、意思決定の貧弱さと現実世界の危険につながる可能性がある。
ミスシは、誤った推論のための新しい議論理論モデルである。
大規模言語モデルの批判的推論能力をテストするためのデータセットとしてMissciを提案する。
論文 参考訳(メタデータ) (2024-06-05T12:11:10Z) - What Makes Medical Claims (Un)Verifiable? Analyzing Entity and Relation
Properties for Fact Verification [8.086400003948143]
BEAR-Factコーパス(BEAR-Fact corpus)は、科学的事実検証のための最初のコーパスである。
クレームテキストから純粋に証拠検索の成功を確実に推定できることを示す。
データセットはhttp://www.ims.uni-stuttgart.de/data/bioclaimで公開されている。
論文 参考訳(メタデータ) (2024-02-02T12:27:58Z) - Verifying the Robustness of Automatic Credibility Assessment [50.55687778699995]
入力テキストにおける意味保存的変化がモデルを誤解させる可能性があることを示す。
また、誤情報検出タスクにおける被害者モデルと攻撃方法の両方をテストするベンチマークであるBODEGAについても紹介する。
我々の実験結果によると、現代の大規模言語モデルは、以前のより小さなソリューションよりも攻撃に対して脆弱であることが多い。
論文 参考訳(メタデータ) (2023-03-14T16:11:47Z) - EBOCA: Evidences for BiOmedical Concepts Association Ontology [55.41644538483948]
本論文は,生物医学領域の概念とそれらの関連性を記述するオントロジーであるEBOCAと,それらの関連性を支持するエビデンスを提案する。
DISNETのサブセットから得られるテストデータとテキストからの自動アソシエーション抽出が変換され、実際のシナリオで使用できる知識グラフが作成されるようになった。
論文 参考訳(メタデータ) (2022-08-01T18:47:03Z) - Monant Medical Misinformation Dataset: Mapping Articles to Fact-Checked
Claims [0.6927055673104934]
317kの医療ニュース記事/ブログと3.5kのファクトチェッククレームの特徴豊富なデータセットを公開しています。
また、手動で533件、クレームと記事のマッピングを51万件以上自動的にラベル付けしている。
このデータセットは、誤情報特徴化研究やソース間の誤情報拡散の研究など、医療的誤情報に関連する多くのタスクを可能にする。
論文 参考訳(メタデータ) (2022-04-26T13:18:27Z) - CoVERT: A Corpus of Fact-checked Biomedical COVID-19 Tweets [10.536415845097661]
CoVERTは事実確認されたツイートのコーパスで、バイオメディシンと新型コロナウイルス関連の情報(ミス)に焦点を当てている。
我々は、新しいクラウドソーシング手法を用いて、すべてのツイートにファクトチェックラベルを付加し、クラウドワーカーがオンラインで検索する証拠を支持する。
得られたエビデンス抽出をファクトチェックパイプラインの一部として使用し、実世界のエビデンスの方が、事前訓練された言語モデルで間接的に利用できる知識よりも有用であることを確認した。
論文 参考訳(メタデータ) (2022-04-26T09:05:03Z) - Twitter-COMMs: Detecting Climate, COVID, and Military Multimodal
Misinformation [83.2079454464572]
本稿では,DARPAセマンティック・フォレスティクス(SemaFor)プログラムにおける画像テキスト不整合検出へのアプローチについて述べる。
Twitter-COMMsは大規模マルチモーダルデータセットで、884万のツイートが気候変動、新型コロナウイルス、軍用車両のトピックに関連する。
我々は、最先端のCLIPモデルに基づいて、自動生成されたランダムとハードのネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガ
論文 参考訳(メタデータ) (2021-12-16T03:37:20Z) - Domain-Specific Pretraining for Vertical Search: Case Study on
Biomedical Literature [67.4680600632232]
自己教師型学習は、アノテーションのボトルネックを克服するための有望な方向として現れました。
本稿では,ドメイン固有の事前学習に基づく垂直探索手法を提案する。
我々のシステムはPubMed上で何千万もの記事にスケールでき、Microsoft Biomedical Searchとしてデプロイされている。
論文 参考訳(メタデータ) (2021-06-25T01:02:55Z) - TIB's Visual Analytics Group at MediaEval '20: Detecting Fake News on
Corona Virus and 5G Conspiracy [9.66022279280394]
ソーシャルメディア上のフェイクニュースは、一般大衆の本当のニュースの話題に悪影響を及ぼすため、研究の話題となっている。
MediaEval 2020のFakeNewsタスクは、誤情報を含むツイートを自動的に検出するチャレンジを作成することで、この問題に対処する。
BERT埋め込みと浅いニューラルネットワークを用いて、テキストのみを用いてツイートを分類する簡単なアプローチを提案する。
論文 参考訳(メタデータ) (2021-01-10T11:52:17Z) - ArCOV19-Rumors: Arabic COVID-19 Twitter Dataset for Misinformation
Detection [6.688963029270579]
ArCOV19-Rumorsは、1月27日から2020年4月末までのクレームを含むツイートからなる誤情報検出のためのアラビア語のTwitterデータセットである。
本誌は138件の確認済みのクレームを、主に人気ファクトチェックサイトから収集し、それらのクレームに関連する9.4万件のツイートを特定した。
ツイートは、パンデミックで直面した主要な問題の一つである誤情報検出の研究を支援するために、正確さで手動で注釈付けされた。
論文 参考訳(メタデータ) (2020-10-17T11:21:40Z) - Misinformation Has High Perplexity [55.47422012881148]
疑似クレームを教師なしの方法でデバンクするために, 難易度を活用することを提案する。
まず,これらの主張に類似した文に基づいて,科学的およびニュースソースから信頼性のある証拠を抽出する。
第2に,抽出したエビデンスを言語モデルにプライマリし,難易度スコアに基づいて与えられたクレームの正当性を評価する。
論文 参考訳(メタデータ) (2020-06-08T15:13:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。