論文の概要: Bridging the gap between supervised classification and unsupervised
topic modelling for social-media assisted crisis management
- arxiv url: http://arxiv.org/abs/2103.11835v1
- Date: Mon, 22 Mar 2021 13:30:39 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-23 14:40:29.345139
- Title: Bridging the gap between supervised classification and unsupervised
topic modelling for social-media assisted crisis management
- Title(参考訳): ソーシャルメディア支援危機管理のための教師付き分類と教師なしトピックモデリングのギャップを埋める
- Authors: Mikael Brunila, Rosie Zhao, Andrei Mircea, Sam Lumley, Renee Sieber
- Abstract要約: Twitterなどのソーシャルメディアは、自然災害時に危機管理者や被災者に貴重な情報を提供します。
機械学習は、危機時に共有される大量のメッセージから情報を構造化および抽出するのに役立ちます。
bertembedsが危機関連ツイートの分類を微調整することで,新たな危機に効果的に対応できることを示す。
- 参考スコア(独自算出の注目度): 0.5249805590164902
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Social media such as Twitter provide valuable information to crisis managers
and affected people during natural disasters. Machine learning can help
structure and extract information from the large volume of messages shared
during a crisis; however, the constantly evolving nature of crises makes
effective domain adaptation essential. Supervised classification is limited by
unchangeable class labels that may not be relevant to new events, and
unsupervised topic modelling by insufficient prior knowledge. In this paper, we
bridge the gap between the two and show that BERT embeddings finetuned on
crisis-related tweet classification can effectively be used to adapt to a new
crisis, discovering novel topics while preserving relevant classes from
supervised training, and leveraging bidirectional self-attention to extract
topic keywords. We create a dataset of tweets from a snowstorm to evaluate our
method's transferability to new crises, and find that it outperforms
traditional topic models in both automatic, and human evaluations grounded in
the needs of crisis managers. More broadly, our method can be used for textual
domain adaptation where the latent classes are unknown but overlap with known
classes from other domains.
- Abstract(参考訳): Twitterのようなソーシャルメディアは、災害時の危機管理者や被災者に貴重な情報を提供している。
機械学習は、危機時に共有される大量のメッセージから情報を構造化し抽出するのに役立つが、危機の絶え間なく進化する性質によって、効果的なドメイン適応が不可欠となる。
教師付き分類は、新しいイベントとは関係のない変更不能なクラスラベルと、事前知識不足による教師なしトピックモデリングによって制限される。
本稿では,危機関連ツイート分類を微調整したBERT埋め込みが,新たな危機に適応し,教師付きトレーニングから関連クラスを保ちながら新たなトピックを発見できることを示すとともに,トピックキーワードの抽出に双方向自己認識を活用する。
スノーストームからツイートのデータセットを作成し、新しい危機への移管可能性を評価し、危機マネージャのニーズに基づく自動的、人的評価の両方において、従来のトピックモデルよりも優れています。
より広義には、潜在クラスが未知であるが、他のドメインからの既知のクラスと重複するテキストドメイン適応に、本手法を用いることができる。
関連論文リスト
- CrisisSense-LLM: Instruction Fine-Tuned Large Language Model for Multi-label Social Media Text Classification in Disaster Informatics [49.2719253711215]
本研究では,事前学習型大規模言語モデル(LLM)の強化による災害テキスト分類への新たなアプローチを提案する。
本手法では,災害関連ツイートから包括的インストラクションデータセットを作成し,それをオープンソース LLM の微調整に用いる。
この微調整モデルでは,災害関連情報の種類,情報化,人的援助の関与など,複数の側面を同時に分類することができる。
論文 参考訳(メタデータ) (2024-06-16T23:01:10Z) - CrisisMatch: Semi-Supervised Few-Shot Learning for Fine-Grained Disaster
Tweet Classification [51.58605842457186]
半教師付き, 少数ショットの学習環境下で, 微粒な災害ツイート分類モデルを提案する。
私たちのモデルであるCrisisMatchは、ラベルなしデータと大量のラベルなしデータを用いて、ツイートを関心の細かいクラスに効果的に分類する。
論文 参考訳(メタデータ) (2023-10-23T07:01:09Z) - DeCrisisMB: Debiased Semi-Supervised Learning for Crisis Tweet
Classification via Memory Bank [52.20298962359658]
危機イベントにおいて、人々は、状況、警告、アドバイス、サポートに関する情報を広めるために、Twitterのようなソーシャルメディアプラットフォームを使うことが多い。
完全に教師されたアプローチでは、大量のデータを注釈付けする必要があります。
半教師付きモデルは偏りがあり、特定のクラスでは適度に機能し、他のクラスでは極めて貧弱である。
本稿では,メモリバンクを用いて,各学習クラスから生成された擬似ラベルを等しくサンプリングする,単純かつ効果的なデバイアス処理手法であるDeCrisisMBを提案する。
論文 参考訳(メタデータ) (2023-10-23T05:25:51Z) - CrisisTransformers: Pre-trained language models and sentence encoders for crisis-related social media texts [3.690904966341072]
ソーシャルメディアプラットフォームは危機コミュニケーションにおいて重要な役割を担っているが、危機に関連するソーシャルメディアのテキストを分析することは、その非公式な性質のため困難である。
本研究では,事前訓練された言語モデルと文エンコーダのアンサンブルであるCrisisTransformersを紹介した。
論文 参考訳(メタデータ) (2023-09-11T14:36:16Z) - Coping with low data availability for social media crisis message
categorisation [3.0255457622022495]
この論文は、緊急対応のための危機メッセージの分類において、データ可用性の低い課題に対処することに焦点を当てている。
これはまず、過去の危機イベントから注釈付きデータから分類モデルを学ぶことを含む、この問題の解決策としてドメイン適応を提示する。
モデルが過去の複数のイベントに対してトレーニングされ、進行中の複数のイベントに適応する多対多適応では、マルチタスク学習アプローチが提案される。
論文 参考訳(メタデータ) (2023-05-26T19:08:24Z) - CrisisLTLSum: A Benchmark for Local Crisis Event Timeline Extraction and
Summarization [62.77066949111921]
本稿では,現在までに利用可能な地域危機イベントタイムラインの最大のデータセットであるCrisisLTLSumについて述べる。
CrisisLTLSumには、山火事、地元の火災、交通、嵐の4つの領域にわたる1000の危機イベントタイムラインが含まれている。
最初の実験では, 両タスクの人的性能と比較して, 強いベースライン性能の間に有意な差があることが示唆された。
論文 参考訳(メタデータ) (2022-10-25T17:32:40Z) - Event-Related Bias Removal for Real-time Disaster Events [67.2965372987723]
ソーシャルメディアは、自然災害や大量攻撃などの危機事象に関する情報を共有する重要なツールとなっている。
有用な情報を含む実行可能なポストを検出するには、大量のデータをリアルタイムに高速に分析する必要がある。
我々は、潜在事象固有のバイアスを除去し、ツイート重要度分類の性能を向上させるために、敵対的ニューラルモデルを訓練する。
論文 参考訳(メタデータ) (2020-11-02T02:03:07Z) - Clustering of Social Media Messages for Humanitarian Aid Response during
Crisis [47.187609203210705]
近年のDeep Learning and Natural Language Processingの進歩は,情報度を分類する作業において,事前のアプローチよりも優れていることを示す。
本稿では,これらの手法を2つのサブタスクに拡張し,Deep Learning法も有効であることを示す。
論文 参考訳(メタデータ) (2020-07-23T02:18:05Z) - CrisisBERT: a Robust Transformer for Crisis Classification and
Contextual Crisis Embedding [2.7718973516070684]
本稿では,危機検出と危機認識という2つの危機分類タスクのためのエンドツーエンドトランスフォーマーモデルを提案する。
私たちはまた、危機埋め込みのための注意ベースの文書レベルのコンテキスト埋め込みアーキテクチャであるCrisis2Vecを提案しました。
論文 参考訳(メタデータ) (2020-05-11T09:57:24Z) - Unsupervised and Interpretable Domain Adaptation to Rapidly Filter
Tweets for Emergency Services [18.57009530004948]
本稿では,TRECインシデントストリームの公開データセットを用いて,危機時に関連するツイートを分類する新しい手法を提案する。
私たちは各タスクに専用の注意層を使用して、モデル解釈可能性を提供しています。
新型コロナウイルスのパンデミックに対するユースケースを提供することで、我々の仕事の実践的な意味を示す。
論文 参考訳(メタデータ) (2020-03-04T06:40:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。