論文の概要: Leveraging Event Specific and Chunk Span features to Extract COVID
Events from tweets
- arxiv url: http://arxiv.org/abs/2012.10052v1
- Date: Fri, 18 Dec 2020 04:49:32 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-01 18:08:41.924817
- Title: Leveraging Event Specific and Chunk Span features to Extract COVID
Events from tweets
- Title(参考訳): ツイートから新型コロナウイルスイベントを抽出するイベント特化機能とチャンクスパン機能を活用する
- Authors: Ayush Kaushal and Tejas Vaidhya
- Abstract要約: We describe our system entry for WNUT 2020 Shared Task-3。
このタスクは、TwitterからさまざまなCOVID-19関連イベントの抽出を自動化することを目的としていた。
このシステムは、アンサンブルや追加のデータセットを使用せずに、F1の0.6598でリーダーボードで1位にランクインします。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Twitter has acted as an important source of information during disasters and
pandemic, especially during the times of COVID-19. In this paper, we describe
our system entry for WNUT 2020 Shared Task-3. The task was aimed at automating
the extraction of a variety of COVID-19 related events from Twitter, such as
individuals who recently contracted the virus, someone with symptoms who were
denied testing and believed remedies against the infection. The system consists
of separate multi-task models for slot-filling subtasks and
sentence-classification subtasks while leveraging the useful sentence-level
information for the corresponding event. The system uses COVID-Twitter-Bert
with attention-weighted pooling of candidate slot-chunk features to capture the
useful information chunks. The system ranks 1st at the leader-board with F1 of
0.6598, without using any ensembles or additional datasets. The code and
trained models are available at this https URL.
- Abstract(参考訳): Twitterは災害やパンデミック、特に新型コロナウイルス(COVID-19)の時代に重要な情報ソースとして機能してきた。
本稿では,WNUT 2020 Shared Task-3のシステムエントリについて述べる。
このタスクは、twitterからさまざまな新型コロナウイルス関連のイベントを自動的に抽出することを目的としていた。例えば、最近ウイルスに感染した個人、検査を拒否され、感染に対する治療を信じている症状のある人などだ。
システムは、スロットフィルングサブタスクと文分類サブタスクのための別々のマルチタスクモデルからなり、対応するイベントに有用な文レベルの情報を活用する。
このシステムは、COVID-Twitter-Bertと注目度の高いスロットチャンク機能を使って、有用な情報チャンクをキャプチャする。
F1は0.6598であり、アンサンブルや追加のデータセットは使用していない。
コードとトレーニングされたモデルは、このhttps URLで入手できる。
関連論文リスト
- Grounding Partially-Defined Events in Multimodal Data [61.0063273919745]
部分定義イベントに対するマルチモーダル定式化を導入し、これらのイベントの抽出を3段階スパン検索タスクとしてキャストする。
このタスクのベンチマークであるMultiVENT-Gを提案し,22.8Kのラベル付きイベント中心エンティティを含む,14.5時間の高密度アノテーション付き現在のイベントビデオと1,168のテキストドキュメントからなる。
結果は、イベント理解の抽象的な課題を示し、イベント中心のビデオ言語システムにおける約束を実証する。
論文 参考訳(メタデータ) (2024-10-07T17:59:48Z) - ThangDLU at #SMM4H 2024: Encoder-decoder models for classifying text data on social disorders in children and adolescents [49.00494558898933]
本稿では,#SMM4H (Social Media Mining for Health) 2024 Workshopのタスク3とタスク5への参加について述べる。
タスク3は、屋外環境が社会不安の症状に与える影響を議論するツイートを中心にした多クラス分類タスクである。
タスク5は、子供の医学的障害を報告しているツイートに焦点を当てたバイナリ分類タスクを含む。
BART-baseやT5-smallのような事前訓練されたエンコーダデコーダモデルからの転送学習を適用し、与えられたツイートの集合のラベルを同定した。
論文 参考訳(メタデータ) (2024-04-30T17:06:20Z) - CrisisMatch: Semi-Supervised Few-Shot Learning for Fine-Grained Disaster
Tweet Classification [51.58605842457186]
半教師付き, 少数ショットの学習環境下で, 微粒な災害ツイート分類モデルを提案する。
私たちのモデルであるCrisisMatchは、ラベルなしデータと大量のラベルなしデータを用いて、ツイートを関心の細かいクラスに効果的に分類する。
論文 参考訳(メタデータ) (2023-10-23T07:01:09Z) - On the Exploitability of Instruction Tuning [103.8077787502381]
そこで本研究では,モデルの動作を変えるための命令チューニングを,相手がどのように活用できるかを検討する。
自動データ中毒パイプラインである textitAutoPoison を提案する。
結果から、AutoPoisonは、少数のデータだけを中毒することで、敵がモデルの振る舞いを変えることを可能にする。
論文 参考訳(メタデータ) (2023-06-28T17:54:04Z) - Task Compass: Scaling Multi-task Pre-training with Task Prefix [122.49242976184617]
既存の研究では、大規模教師付きタスクによるマルチタスク学習がタスク間の負の効果に悩まされていることが示されている。
タスク間の関係を探索するために,タスクプレフィックスガイド付きマルチタスク事前学習フレームワークを提案する。
我々のモデルは、幅広いタスクの強力な基盤バックボーンとして機能するだけでなく、タスク関係を分析するための探索ツールとしても実現可能である。
論文 参考訳(メタデータ) (2022-10-12T15:02:04Z) - Unifying Event Detection and Captioning as Sequence Generation via
Pre-Training [53.613265415703815]
本稿では,イベント検出とキャプションのタスク間関連性を高めるための,事前学習と微調整の統合フレームワークを提案する。
我々のモデルは最先端の手法よりも優れており、大規模ビデオテキストデータによる事前学習ではさらに向上できる。
論文 参考訳(メタデータ) (2022-07-18T14:18:13Z) - DiPD: Disruptive event Prediction Dataset from Twitter [0.0]
暴動や抗議活動は、もし制御不能になったとしても、ある国で憎悪を引き起こす可能性がある。
このデータセットは、過去または進行中のイベントのつぶやきを収集する。
94855件の記録と168706件の記録がある。
論文 参考訳(メタデータ) (2021-11-25T13:16:21Z) - NIT COVID-19 at WNUT-2020 Task 2: Deep Learning Model RoBERTa for
Identify Informative COVID-19 English Tweets [0.0]
本稿では,WNUT-2020 Task2 において,NIT_COVID-19 チームによって提出された WNUT-2020 Task2 における COVID-19 英語のつぶやきを識別するためのモデルを提案する。
共用タスクWNUT 2020 Task2のモデルによる性能はF1スコアの89.14%である。
論文 参考訳(メタデータ) (2020-11-11T05:20:39Z) - TEST_POSITIVE at W-NUT 2020 Shared Task-3: Joint Event Multi-task
Learning for Slot Filling in Noisy Text [26.270447944466557]
本稿では,Twitter から COVID-19 イベントを抽出する統合イベントマルチタスク学習 (JOELIN) モデルを提案する。
統一されたグローバルラーニングフレームワークを通じて、異なるイベントにわたるトレーニングデータを全て利用して、言語モデルを学習し、微調整する。
我々は,その予測をさらにフィルタリングするために,名前付きエンティティ認識(NER)を用いた型認識後処理手法を実装した。
論文 参考訳(メタデータ) (2020-09-29T19:08:45Z) - Characterizing drug mentions in COVID-19 Twitter Chatter [1.2400116527089997]
そこでわれわれは、新型コロナウイルス(COVID-19)のツイート4億2400万件のTwitterデータセットを発掘し、薬物の言及に関する話題を特定した。
一見単純なタスクのように見えるが、Twitterにおける言語使用の非公式な性質のため、このタスクを支援するために、従来の自動メソッドと並行して機械学習の必要性を実証する。
ソーシャルメディアデータを扱う際には,処理前ステップとして必要なタスクをミススペル処理することで,約15%の追加データを復元することが可能です。
論文 参考訳(メタデータ) (2020-07-20T16:56:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。