論文の概要: CrisisMatch: Semi-Supervised Few-Shot Learning for Fine-Grained Disaster
Tweet Classification
- arxiv url: http://arxiv.org/abs/2310.14627v1
- Date: Mon, 23 Oct 2023 07:01:09 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-24 22:00:47.957560
- Title: CrisisMatch: Semi-Supervised Few-Shot Learning for Fine-Grained Disaster
Tweet Classification
- Title(参考訳): CrisisMatch: 微粒な災害ツイート分類のための半教師付きFew-Shotラーニング
- Authors: Henry Peng Zou, Yue Zhou, Cornelia Caragea, and Doina Caragea
- Abstract要約: 半教師付き, 少数ショットの学習環境下で, 微粒な災害ツイート分類モデルを提案する。
私たちのモデルであるCrisisMatchは、ラベルなしデータと大量のラベルなしデータを用いて、ツイートを関心の細かいクラスに効果的に分類する。
- 参考スコア(独自算出の注目度): 51.58605842457186
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The shared real-time information about natural disasters on social media
platforms like Twitter and Facebook plays a critical role in informing
volunteers, emergency managers, and response organizations. However, supervised
learning models for monitoring disaster events require large amounts of
annotated data, making them unrealistic for real-time use in disaster events.
To address this challenge, we present a fine-grained disaster tweet
classification model under the semi-supervised, few-shot learning setting where
only a small number of annotated data is required. Our model, CrisisMatch,
effectively classifies tweets into fine-grained classes of interest using few
labeled data and large amounts of unlabeled data, mimicking the early stage of
a disaster. Through integrating effective semi-supervised learning ideas and
incorporating TextMixUp, CrisisMatch achieves performance improvement on two
disaster datasets of 11.2\% on average. Further analyses are also provided for
the influence of the number of labeled data and out-of-domain results.
- Abstract(参考訳): twitterやfacebookなどのソーシャルメディア上での自然災害に関するリアルタイム情報共有は,ボランティアや緊急事態管理,対応組織への通知において重要な役割を担っている。
しかしながら、災害イベントを監視するための教師付き学習モデルには大量の注釈データが必要であり、災害イベントのリアルタイム使用には非現実的である。
この課題に対処すべく,セミ教師付き,少数ショットの学習環境下で,少量のアノテートデータのみを必要とするディザスタツイート分類モデルを提案する。
当社のモデルであるCrisisMatchは,災害の初期段階を模したラベル付きデータと大量のラベルなしデータを用いて,ツイートを関心の細かいクラスに効果的に分類する。
効果的な半教師付き学習アイデアを統合し、textmixupを組み込むことで、平均11.2\%のディザスタデータセットでパフォーマンス向上を実現する。
さらに、ラベル付きデータ数とドメイン外結果の影響についても分析を行う。
関連論文リスト
- DeCrisisMB: Debiased Semi-Supervised Learning for Crisis Tweet
Classification via Memory Bank [52.20298962359658]
危機イベントにおいて、人々は、状況、警告、アドバイス、サポートに関する情報を広めるために、Twitterのようなソーシャルメディアプラットフォームを使うことが多い。
完全に教師されたアプローチでは、大量のデータを注釈付けする必要があります。
半教師付きモデルは偏りがあり、特定のクラスでは適度に機能し、他のクラスでは極めて貧弱である。
本稿では,メモリバンクを用いて,各学習クラスから生成された擬似ラベルを等しくサンプリングする,単純かつ効果的なデバイアス処理手法であるDeCrisisMBを提案する。
論文 参考訳(メタデータ) (2023-10-23T05:25:51Z) - Sarcasm Detection in a Disaster Context [103.93691731605163]
HurricaneSARCは,意図した皮肉に注釈を付けた15,000ツイートのデータセットである。
私たちの最高のモデルは、データセットで最大0.70F1を得ることができます。
論文 参考訳(メタデータ) (2023-08-16T05:58:12Z) - IKDSumm: Incorporating Key-phrases into BERT for extractive Disaster
Tweet Summarization [5.299958874647294]
災害固有のつぶやき要約フレームワークIKDSummを提案する。
IKDSummは、そのツイートのキーフレーズを通じて、災害に関連する各ツイートから重要かつ重要な情報を識別する。
これらのキーワードを使って、ツイートの要約を自動的に生成する。
論文 参考訳(メタデータ) (2023-05-19T11:05:55Z) - CrisisLTLSum: A Benchmark for Local Crisis Event Timeline Extraction and
Summarization [62.77066949111921]
本稿では,現在までに利用可能な地域危機イベントタイムラインの最大のデータセットであるCrisisLTLSumについて述べる。
CrisisLTLSumには、山火事、地元の火災、交通、嵐の4つの領域にわたる1000の危機イベントタイムラインが含まれている。
最初の実験では, 両タスクの人的性能と比較して, 強いベースライン性能の間に有意な差があることが示唆された。
論文 参考訳(メタデータ) (2022-10-25T17:32:40Z) - Predicting Seriousness of Injury in a Traffic Accident: A New Imbalanced
Dataset and Benchmark [62.997667081978825]
本稿では,交通事故における傷害の重大性を予測するために,機械学習アルゴリズムの性能を評価する新しいデータセットを提案する。
データセットは、英国運輸省から公開されているデータセットを集約することで作成される。
論文 参考訳(メタデータ) (2022-05-20T21:15:26Z) - HumAID: Human-Annotated Disaster Incidents Data from Twitter with Deep
Learning Benchmarks [5.937482215664902]
ソーシャルメディアのコンテンツは、どんなアプリケーションでも直接使うにはうるさい。
効果的な消費と意思決定を促進するために、利用可能なコンテンツをフィルタリング、分類、および簡潔に要約することが重要です。
19の災害イベントで2400万ツイートのプールから抽出された77万ツイートの大規模なデータセットを紹介します。
論文 参考訳(メタデータ) (2021-04-07T12:29:36Z) - Event-Related Bias Removal for Real-time Disaster Events [67.2965372987723]
ソーシャルメディアは、自然災害や大量攻撃などの危機事象に関する情報を共有する重要なツールとなっている。
有用な情報を含む実行可能なポストを検出するには、大量のデータをリアルタイムに高速に分析する必要がある。
我々は、潜在事象固有のバイアスを除去し、ツイート重要度分類の性能を向上させるために、敵対的ニューラルモデルを訓練する。
論文 参考訳(メタデータ) (2020-11-02T02:03:07Z) - Weakly-supervised Fine-grained Event Recognition on Social Media Texts
for Disaster Management [27.811526979673484]
人々はますますソーシャルメディアを使って、災害時の情報を報告したり、助けを求めたり、共有したりしている。
我々は、個々のTwitterメッセージにきめ細かいイベントカテゴリをラベル付けした高品質な分類器を構築するための弱教師付きアプローチを提案する。
論文 参考訳(メタデータ) (2020-10-04T21:06:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。