論文の概要: tmn at #SMM4H 2023: Comparing Text Preprocessing Techniques for
Detecting Tweets Self-reporting a COVID-19 Diagnosis
- arxiv url: http://arxiv.org/abs/2311.00732v1
- Date: Wed, 1 Nov 2023 07:41:23 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-03 16:04:26.480831
- Title: tmn at #SMM4H 2023: Comparing Text Preprocessing Techniques for
Detecting Tweets Self-reporting a COVID-19 Diagnosis
- Title(参考訳): tmn at #smm4h 2023: ウイルス診断を自己報告するツイートを検出するためのテキスト前処理技術の比較
- Authors: Anna Glazkova
- Abstract要約: 本稿では,SMM4H 2023におけるタスク1のために開発されたシステムについて述べる。
このタスクの目的は、新型コロナウイルス(COVID-19)の診断を自己報告するツイートと、そうでないツイートを自動的に区別することだ。
- 参考スコア(独自算出の注目度): 1.8492669447784602
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The paper describes a system developed for Task 1 at SMM4H 2023. The goal of
the task is to automatically distinguish tweets that self-report a COVID-19
diagnosis (for example, a positive test, clinical diagnosis, or
hospitalization) from those that do not. We investigate the use of different
techniques for preprocessing tweets using four transformer-based models. The
ensemble of fine-tuned language models obtained an F1-score of 84.5%, which is
4.1% higher than the average value.
- Abstract(参考訳): 本稿では,SMM4H 2023におけるタスク1のために開発されたシステムについて述べる。
このタスクの目的は、新型コロナウイルス(covid-19)の診断を自己報告するツイート(ポジティブテスト、臨床診断、入院など)を、そうでないツイートと自動的に区別することだ。
4つのトランスフォーマーモデルを用いて,ツイートの前処理における異なる手法の利用について検討した。
微調整された言語モデルのアンサンブルは、平均値よりも4.1%高い84.5%のF1スコアを得た。
関連論文リスト
- LT4SG@SMM4H24: Tweets Classification for Digital Epidemiology of Childhood Health Outcomes Using Pre-Trained Language Models [1.0312118123538199]
本稿では,子どもの医学的障害を報告した英語ツイートのバイナリ分類について,SMM4H24共有タスク5に対するアプローチを提案する。
テストデータに対するF1スコアの0.938を達成し,ベンチマークを1.18%上回った。
論文 参考訳(メタデータ) (2024-06-11T22:48:18Z) - ThangDLU at #SMM4H 2024: Encoder-decoder models for classifying text data on social disorders in children and adolescents [49.00494558898933]
本稿では,#SMM4H (Social Media Mining for Health) 2024 Workshopのタスク3とタスク5への参加について述べる。
タスク3は、屋外環境が社会不安の症状に与える影響を議論するツイートを中心にした多クラス分類タスクである。
タスク5は、子供の医学的障害を報告しているツイートに焦点を当てたバイナリ分類タスクを含む。
BART-baseやT5-smallのような事前訓練されたエンコーダデコーダモデルからの転送学習を適用し、与えられたツイートの集合のラベルを同定した。
論文 参考訳(メタデータ) (2024-04-30T17:06:20Z) - Shayona@SMM4H23: COVID-19 Self diagnosis classification using BERT and
LightGBM models [1.5566524830295307]
本稿では,Team Shayona による SMMH4-23 のタスク 1 と 4 の共有に対するアプローチと結果について述べる。
私たちのチームは、すべての参加者の中で、Task-1のf1スコア0.94を達成しました。
論文 参考訳(メタデータ) (2024-01-04T09:13:18Z) - Text Augmentations with R-drop for Classification of Tweets Self
Reporting Covid-19 [28.91836510067532]
本稿では,ソーシャル・メディア・マイニング・フォー・ヘルス2023共有タスクのためのモデルを提案する。
我々のアプローチは、多種多様なテキスト拡張を取り入れた分類モデルである。
テストセットのF1スコアは0.877である。
論文 参考訳(メタデータ) (2023-11-06T14:18:16Z) - A Transformer-based representation-learning model with unified
processing of multimodal input for clinical diagnostics [63.106382317917344]
本稿では,マルチモーダル入力を統一的に処理する臨床診断支援として,トランスフォーマーを用いた表現学習モデルについて報告する。
統一モデルは, 肺疾患の同定において, 画像のみのモデル, 非統一型マルチモーダル診断モデルより優れていた。
論文 参考訳(メタデータ) (2023-06-01T16:23:47Z) - Exploiting prompt learning with pre-trained language models for
Alzheimer's Disease detection [70.86672569101536]
アルツハイマー病(AD)の早期診断は予防ケアの促進とさらなる進行の遅らせに不可欠である。
本稿では,AD分類誤差をトレーニング対象関数として一貫して用いたPLMの高速微調整法について検討する。
論文 参考訳(メタデータ) (2022-10-29T09:18:41Z) - Developing a multi-variate prediction model for the detection of
COVID-19 from Crowd-sourced Respiratory Voice Data [0.0]
この研究の新規性は、音声記録から新型コロナウイルス患者を識別するためのディープラーニングモデルの開発である。
私たちは、新型コロナウイルスのサウンドアプリを使った4352人の参加者からクラウドソースされた、853のオーディオサンプルからなるケンブリッジ大学のデータセットを使用しました。
音声データに基づいて,陽性症例を検出する深層学習分類モデルを開発した。
論文 参考訳(メタデータ) (2022-09-08T11:46:37Z) - Exploring linguistic feature and model combination for speech
recognition based automatic AD detection [61.91708957996086]
音声ベースの自動ADスクリーニングシステムは、他の臨床スクリーニング技術に代わる非侵襲的でスケーラブルな代替手段を提供する。
専門的なデータの収集は、そのようなシステムを開発する際に、モデル選択と特徴学習の両方に不確実性をもたらす。
本稿では,BERT と Roberta の事前学習したテキストエンコーダのドメイン微調整の堅牢性向上のための特徴とモデルの組み合わせ手法について検討する。
論文 参考訳(メタデータ) (2022-06-28T05:09:01Z) - Twitter-COMMs: Detecting Climate, COVID, and Military Multimodal
Misinformation [83.2079454464572]
本稿では,DARPAセマンティック・フォレスティクス(SemaFor)プログラムにおける画像テキスト不整合検出へのアプローチについて述べる。
Twitter-COMMsは大規模マルチモーダルデータセットで、884万のツイートが気候変動、新型コロナウイルス、軍用車両のトピックに関連する。
我々は、最先端のCLIPモデルに基づいて、自動生成されたランダムとハードのネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガ
論文 参考訳(メタデータ) (2021-12-16T03:37:20Z) - Checkovid: A COVID-19 misinformation detection system on Twitter using
network and content mining perspectives [9.69596041242667]
新型コロナウイルス(COVID-19)パンデミックの間、ソーシャルメディアプラットフォームは社会的孤立と隔離のためにコミュニケーションするのに理想的だった。
この問題に対処するため、Twitterに2つのCOVID-19関連誤情報データセットを提示する。
機械学習アルゴリズムとNLP技術に基づくネットワークベースおよびコンテンツベースプロセスからなる誤情報検出システムを提案する。
論文 参考訳(メタデータ) (2021-07-20T20:58:23Z) - End-2-End COVID-19 Detection from Breath & Cough Audio [68.41471917650571]
クラウドソースのオーディオサンプルからエンドツーエンドのディープラーニングを使用してCOVID-19を診断する最初の試みを実証します。
本研究では, 人工深層ニューラルネットワークを用いて, 人工呼吸器から新型コロナを診断する新しいモデル戦略を提案する。
論文 参考訳(メタデータ) (2021-01-07T01:13:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。