論文の概要: Leveraging Event Specific and Chunk Span features to Extract COVID
Events from tweets
- arxiv url: http://arxiv.org/abs/2012.10052v1
- Date: Fri, 18 Dec 2020 04:49:32 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-01 18:08:41.924817
- Title: Leveraging Event Specific and Chunk Span features to Extract COVID
Events from tweets
- Title(参考訳): ツイートから新型コロナウイルスイベントを抽出するイベント特化機能とチャンクスパン機能を活用する
- Authors: Ayush Kaushal and Tejas Vaidhya
- Abstract要約: We describe our system entry for WNUT 2020 Shared Task-3。
このタスクは、TwitterからさまざまなCOVID-19関連イベントの抽出を自動化することを目的としていた。
このシステムは、アンサンブルや追加のデータセットを使用せずに、F1の0.6598でリーダーボードで1位にランクインします。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Twitter has acted as an important source of information during disasters and
pandemic, especially during the times of COVID-19. In this paper, we describe
our system entry for WNUT 2020 Shared Task-3. The task was aimed at automating
the extraction of a variety of COVID-19 related events from Twitter, such as
individuals who recently contracted the virus, someone with symptoms who were
denied testing and believed remedies against the infection. The system consists
of separate multi-task models for slot-filling subtasks and
sentence-classification subtasks while leveraging the useful sentence-level
information for the corresponding event. The system uses COVID-Twitter-Bert
with attention-weighted pooling of candidate slot-chunk features to capture the
useful information chunks. The system ranks 1st at the leader-board with F1 of
0.6598, without using any ensembles or additional datasets. The code and
trained models are available at this https URL.
- Abstract(参考訳): Twitterは災害やパンデミック、特に新型コロナウイルス(COVID-19)の時代に重要な情報ソースとして機能してきた。
本稿では,WNUT 2020 Shared Task-3のシステムエントリについて述べる。
このタスクは、twitterからさまざまな新型コロナウイルス関連のイベントを自動的に抽出することを目的としていた。例えば、最近ウイルスに感染した個人、検査を拒否され、感染に対する治療を信じている症状のある人などだ。
システムは、スロットフィルングサブタスクと文分類サブタスクのための別々のマルチタスクモデルからなり、対応するイベントに有用な文レベルの情報を活用する。
このシステムは、COVID-Twitter-Bertと注目度の高いスロットチャンク機能を使って、有用な情報チャンクをキャプチャする。
F1は0.6598であり、アンサンブルや追加のデータセットは使用していない。
コードとトレーニングされたモデルは、このhttps URLで入手できる。
関連論文リスト
- Task-Customized Self-Supervised Pre-training with Scalable Dynamic
Routing [76.78772372631623]
セルフ教師付き事前トレーニングの一般的な実践は、できるだけ多くのデータを使用することである。
しかし、特定のダウンストリームタスクでは、事前トレーニングで無関係なデータを含むと、ダウンストリームのパフォーマンスが低下する可能性がある。
異なるタスクのための事前トレーニングで、異なるダウンストリームタスクにカスタマイズされたデータセットを使用することは、重荷であり、実現不可能である。
論文 参考訳(メタデータ) (2022-05-26T10:49:43Z) - Causal Scene BERT: Improving object detection by searching for
challenging groups of data [125.40669814080047]
コンピュータビジョンアプリケーションは、物体検出のようなタスクのためにニューラルネットワークでパラメータ化された学習ベースの知覚モジュールに依存している。
これらのモジュールは、トレーニングプロセスに固有のバイアスのため、予想される誤差が低いが、データの非定型的なグループに対して高い誤差を持つことが多い。
本研究の主な貢献は,シミュレートされたシーンに対して因果的介入を行うことにより,前向きにそのようなグループを発見する擬似オートマチック手法である。
論文 参考訳(メタデータ) (2022-02-08T05:14:16Z) - DiPD: Disruptive event Prediction Dataset from Twitter [0.0]
暴動や抗議活動は、もし制御不能になったとしても、ある国で憎悪を引き起こす可能性がある。
このデータセットは、過去または進行中のイベントのつぶやきを収集する。
94855件の記録と168706件の記録がある。
論文 参考訳(メタデータ) (2021-11-25T13:16:21Z) - BigSSL: Exploring the Frontier of Large-Scale Semi-Supervised Learning
for Automatic Speech Recognition [126.5605160882849]
事前学習,自己学習,モデルサイズのスケールアップの組み合わせによって,データの効率が大幅に向上することがわかった。
本稿では,大規模な下流タスクに対して,事前学習モデルと自己学習モデルを使用することによって得られる普遍的なメリットについて報告する。
論文 参考訳(メタデータ) (2021-09-27T17:59:19Z) - Synerise at RecSys 2021: Twitter user engagement prediction with a fast
neural model [0.745554610293091]
私たちはTwitterが主催したACM RecSys 2021 Challengeに,第2位のソリューションを提示します。
この課題は、ツイートの集合に対するユーザーのエンゲージメントを予測することであり、10億のデータポイントからなる非常に大きなデータセットを提供する。
単一のツィートエンゲージメント予測の平均推測時間は、64GBメモリを持つ単一のCPUコア上で6msに制限される。
論文 参考訳(メタデータ) (2021-09-23T13:51:09Z) - Zero-Shot Information Extraction as a Unified Text-to-Triple Translation [56.01830747416606]
我々は、テキストから3つの翻訳フレームワークに一連の情報抽出タスクを投入した。
タスク固有の入力テキストと出力トリプルの変換としてタスクを形式化する。
本稿では,オープン情報抽出におけるゼロショット性能について検討する。
論文 参考訳(メタデータ) (2021-09-23T06:54:19Z) - Traffic Event Detection as a Slot Filling Problem [18.61490760235035]
ベルギーとブリュッセルの2つの(構築された)交通関連データセットを公開することにより、Twitterストリームからきめ細かいトラフィック情報を抽出する新たな問題を紹介した。
本稿では,2つのサブタスクを別々に,あるいは共同で処理するいくつかの手法を提案するとともに,交通事象検出問題に対する提案手法の有効性を評価する。
論文 参考訳(メタデータ) (2021-09-13T15:02:40Z) - Generative Conversational Networks [67.13144697969501]
本稿では,対話エージェントが独自のラベル付き学習データを生成することを学習する,生成会話ネットワーク(Generative Conversational Networks)というフレームワークを提案する。
そこで本研究では,シードデータから学習したベースラインモデルに対して,意図検出が平均35%,スロットタグが平均21%向上したことを示す。
論文 参考訳(メタデータ) (2021-06-15T23:19:37Z) - Fine-Tuning Transformers for Identifying Self-Reporting Potential Cases
and Symptoms of COVID-19 in Tweets [5.425235965110337]
私たちは、2021年のソーシャルメディアマイニング for Health Applications(SMM4H)共有タスクのタスク5および6に対する当社のストレートフォワードアプローチについて説明します。
私たちのシステムは、各タスクの微調整Distill-BERT、および最初に他のタスクのモデルを微調整に基づいています。
論文 参考訳(メタデータ) (2021-04-12T14:31:51Z) - Identifying and Categorizing Offensive Language in Social Media [0.0]
本研究は,SemEval 2019 Task 6: OffensEval用に構築された分類システムについて述べる。
私たちは、最良の結果を得るために、機械学習とディープラーニングモデルとデータ前処理とサンプリングテクニックをトレーニングしました。
論文 参考訳(メタデータ) (2021-04-10T22:53:43Z) - RMS-Net: Regression and Masking for Soccer Event Spotting [52.742046866220484]
イベントラベルとその時間的オフセットを同時に予測できる,軽量でモジュール化されたアクションスポッティングネットワークを開発した。
SoccerNetデータセットでテストし、標準機能を使用して、完全な提案は3平均mAPポイントで現在の状態を超えます。
論文 参考訳(メタデータ) (2021-02-15T16:04:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。