論文の概要: Characterizing drug mentions in COVID-19 Twitter Chatter
- arxiv url: http://arxiv.org/abs/2007.10276v2
- Date: Fri, 9 Oct 2020 15:35:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-08 14:26:14.195413
- Title: Characterizing drug mentions in COVID-19 Twitter Chatter
- Title(参考訳): 新型コロナウイルス「Twitter Chatter」の薬物言及の特徴
- Authors: Ramya Tekumalla, Juan M. Banda
- Abstract要約: そこでわれわれは、新型コロナウイルス(COVID-19)のツイート4億2400万件のTwitterデータセットを発掘し、薬物の言及に関する話題を特定した。
一見単純なタスクのように見えるが、Twitterにおける言語使用の非公式な性質のため、このタスクを支援するために、従来の自動メソッドと並行して機械学習の必要性を実証する。
ソーシャルメディアデータを扱う際には,処理前ステップとして必要なタスクをミススペル処理することで,約15%の追加データを復元することが可能です。
- 参考スコア(独自算出の注目度): 1.2400116527089997
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Since the classification of COVID-19 as a global pandemic, there have been
many attempts to treat and contain the virus. Although there is no specific
antiviral treatment recommended for COVID-19, there are several drugs that can
potentially help with symptoms. In this work, we mined a large twitter dataset
of 424 million tweets of COVID-19 chatter to identify discourse around drug
mentions. While seemingly a straightforward task, due to the informal nature of
language use in Twitter, we demonstrate the need of machine learning alongside
traditional automated methods to aid in this task. By applying these
complementary methods, we are able to recover almost 15% additional data,
making misspelling handling a needed task as a pre-processing step when dealing
with social media data.
- Abstract(参考訳): 新型コロナウイルスの世界的なパンデミックとして分類されて以来、ウイルスを治療し封じ込めようとする試みが数多く行われている。
新型コロナウイルスに推奨される特定の抗ウイルス剤はないが、症状を治療できる薬剤はいくつかある。
この研究で、私たちは4億2400万ツイートのcovid-19チャットの大規模なtwitterデータセットを発掘し、薬物の言及に関する談話を特定しました。
一見単純なタスクのように見えるが、Twitterでの言語使用の非公式な性質のため、このタスクを支援するために従来の自動メソッドとともに機械学習の必要性を実証する。
これらの補完手法を適用することで、ソーシャルメディアデータを扱う際に必要となるタスクのミススペル処理を前処理ステップとして、約15%の追加データを復元することができる。
関連論文リスト
- Twitter-COMMs: Detecting Climate, COVID, and Military Multimodal
Misinformation [83.2079454464572]
本稿では,DARPAセマンティック・フォレスティクス(SemaFor)プログラムにおける画像テキスト不整合検出へのアプローチについて述べる。
Twitter-COMMsは大規模マルチモーダルデータセットで、884万のツイートが気候変動、新型コロナウイルス、軍用車両のトピックに関連する。
我々は、最先端のCLIPモデルに基づいて、自動生成されたランダムとハードのネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガ
論文 参考訳(メタデータ) (2021-12-16T03:37:20Z) - Variance of Twitter Embeddings and Temporal Trends of COVID-19 cases [0.9449650062296824]
本稿では,ソーシャルメディア,特にTwitterを活用すれば,新型コロナウイルス関連シナリオを予測する方法を提案する。
単語埋め込みを用いてツイートの意味を捉えることで、重要な次元(SD)を識別する。
本手法は, リードタイムが15日, R2スコアが0.80, 0.62の症例の増加を予測した。
論文 参考訳(メタデータ) (2021-09-30T18:03:10Z) - Unsupervised Text Mining of COVID-19 Records [0.0]
Twitterは、研究者が新型コロナウイルス(COVID-19)に反応して公衆衛生を測定するのに役立つ強力なツールだ。
本稿は、CORD-19と命名された新型コロナウイルスに関する既存の医療データセットを前処理し、教師付き分類タスクのためのデータセットを注釈付けした。
論文 参考訳(メタデータ) (2021-09-08T05:57:22Z) - Project Achoo: A Practical Model and Application for COVID-19 Detection
from Recordings of Breath, Voice, and Cough [55.45063681652457]
コンシューマー端末で録音した音声を用いて、新型コロナウイルスを迅速にトリアージする機械学習手法を提案する。
この手法は,信号処理手法と微調整深層学習ネットワークを組み合わせることで,信号の識別,コークス検出,分類を行う手法を提供する。
我々はまた、症状チェッカーと音声、息、うず信号を使って新型コロナウイルスの感染を検知するモバイルアプリケーションを開発し、展開した。
論文 参考訳(メタデータ) (2021-07-12T08:07:56Z) - Putting words into the system's mouth: A targeted attack on neural
machine translation using monolingual data poisoning [50.67997309717586]
本稿では、悪意のある敵が、バックトランスレーションを用いて訓練されたシステムのトレーニングセットに、モノリンガルテキストの少量の有毒サンプルを挿入する中毒攻撃を提案する。
このサンプルは、パドリング誤報のような特定の標的となる翻訳行動を引き起こすように設計されている。
有毒な例を作るための2つの方法を示し、トレーニングセットの0.02%にしか満たない少数の事例しか、攻撃を成功させるには不十分であることを示した。
論文 参考訳(メタデータ) (2021-07-12T08:07:09Z) - Leveraging Event Specific and Chunk Span features to Extract COVID
Events from tweets [0.0]
We describe our system entry for WNUT 2020 Shared Task-3。
このタスクは、TwitterからさまざまなCOVID-19関連イベントの抽出を自動化することを目的としていた。
このシステムは、アンサンブルや追加のデータセットを使用せずに、F1の0.6598でリーダーボードで1位にランクインします。
論文 参考訳(メタデータ) (2020-12-18T04:49:32Z) - NIT COVID-19 at WNUT-2020 Task 2: Deep Learning Model RoBERTa for
Identify Informative COVID-19 English Tweets [0.0]
本稿では,WNUT-2020 Task2 において,NIT_COVID-19 チームによって提出された WNUT-2020 Task2 における COVID-19 英語のつぶやきを識別するためのモデルを提案する。
共用タスクWNUT 2020 Task2のモデルによる性能はF1スコアの89.14%である。
論文 参考訳(メタデータ) (2020-11-11T05:20:39Z) - A Stance Data Set on Polarized Conversations on Twitter about the
Efficacy of Hydroxychloroquine as a Treatment for COVID-19 [0.0]
COVID-CQは、新型コロナウイルス(COVID-19)パンデミックの状況において、Twitterユーザーのスタンスを示す最初のデータセットである。
このデータセットをGitHub経由で研究コミュニティに提供しました。
論文 参考訳(メタデータ) (2020-08-19T21:58:58Z) - TICO-19: the Translation Initiative for Covid-19 [112.5601530395345]
COvid-19の翻訳イニシアチブ(TICO-19)は、テストおよび開発データを、35の異なる言語でAIおよびMT研究者に提供した。
同じデータが表現されているすべての言語に変換されるため、テストや開発は、セット内の任意の言語のペアリングに対して行うことができる。
論文 参考訳(メタデータ) (2020-07-03T16:26:17Z) - Cross-lingual Transfer Learning for COVID-19 Outbreak Alignment [90.12602012910465]
われわれは、Twitterを通じてイタリアの新型コロナウイルス感染症(COVID-19)の早期流行を訓練し、他のいくつかの国に移る。
実験の結果,クロスカントリー予測において最大0.85のスピアマン相関が得られた。
論文 参考訳(メタデータ) (2020-06-05T02:04:25Z) - On the Generation of Medical Dialogues for COVID-19 [60.63485429268256]
新型コロナウイルス関連の症状を患ったり、危険因子に晒されたりする人は、医師に相談する必要がある。
医療専門家が不足しているため、多くの人がオンライン相談を受けることができない。
本研究の目的は、新型コロナウイルス関連の相談を提供する医療対話システムの構築である。
論文 参考訳(メタデータ) (2020-05-11T21:23:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。