論文の概要: Weakly-supervised Fine-grained Event Recognition on Social Media Texts
for Disaster Management
- arxiv url: http://arxiv.org/abs/2010.01683v1
- Date: Sun, 4 Oct 2020 21:06:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-11 03:49:28.556925
- Title: Weakly-supervised Fine-grained Event Recognition on Social Media Texts
for Disaster Management
- Title(参考訳): 災害管理のためのソーシャルメディアテキストによる微粒化イベント認識
- Authors: Wenlin Yao, Cheng Zhang, Shiva Saravanan, Ruihong Huang, Ali Mostafavi
- Abstract要約: 人々はますますソーシャルメディアを使って、災害時の情報を報告したり、助けを求めたり、共有したりしている。
我々は、個々のTwitterメッセージにきめ細かいイベントカテゴリをラベル付けした高品質な分類器を構築するための弱教師付きアプローチを提案する。
- 参考スコア(独自算出の注目度): 27.811526979673484
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: People increasingly use social media to report emergencies, seek help or
share information during disasters, which makes social networks an important
tool for disaster management. To meet these time-critical needs, we present a
weakly supervised approach for rapidly building high-quality classifiers that
label each individual Twitter message with fine-grained event categories. Most
importantly, we propose a novel method to create high-quality labeled data in a
timely manner that automatically clusters tweets containing an event keyword
and asks a domain expert to disambiguate event word senses and label clusters
quickly. In addition, to process extremely noisy and often rather short
user-generated messages, we enrich tweet representations using preceding
context tweets and reply tweets in building event recognition classifiers. The
evaluation on two hurricanes, Harvey and Florence, shows that using only 1-2
person-hours of human supervision, the rapidly trained weakly supervised
classifiers outperform supervised classifiers trained using more than ten
thousand annotated tweets created in over 50 person-hours.
- Abstract(参考訳): 人々はソーシャルメディアを使って緊急事態を報告したり、災害時に助けを求めたり、情報を共有したりしている。
このような時間クリティカルなニーズを満たすために、個々のTwitterメッセージをきめ細かいイベントカテゴリにラベル付けする高品質な分類器を迅速に構築するための、弱教師付きアプローチを提案する。
最も重要なのは、イベントキーワードを含むツイートを自動的にクラスタリングし、ドメインの専門家にイベントワードセンスやラベルクラスタを素早く曖昧にするための、高品質なラベル付きデータを作成する方法を提案することである。
さらに、非常に騒々しく、より短いユーザ生成メッセージを処理するために、先行するコンテキストのつぶやきを使ってツイート表現を豊かにし、イベント認識分類器を構築する。
Harvey と Florence という2つのハリケーンの評価は、ヒトの監督に1~2時間しかかからず、急速に訓練された弱い教師付き分類器は、50時間以上で生成された1万件以上の注釈付きツイートを使用して訓練された教師付き分類器よりも優れていることを示している。
関連論文リスト
- Zero-Shot Classification of Crisis Tweets Using Instruction-Finetuned Large Language Models [0.0]
ソーシャルメディア投稿のゼロショット分類において,3つの商業的大規模言語モデルを評価する。
1) ポストが人道的な文脈で情報的かどうかを識別し、2) ランク付けし、人道的な階級に関する確率を与える。
結果はマクロ、重み付け、二進F1スコアを用いて評価される。
論文 参考訳(メタデータ) (2024-09-30T19:33:58Z) - CrisisSense-LLM: Instruction Fine-Tuned Large Language Model for Multi-label Social Media Text Classification in Disaster Informatics [49.2719253711215]
本研究では,事前学習型大規模言語モデル(LLM)の強化による災害テキスト分類への新たなアプローチを提案する。
本手法では,災害関連ツイートから包括的インストラクションデータセットを作成し,それをオープンソース LLM の微調整に用いる。
この微調整モデルでは,災害関連情報の種類,情報化,人的援助の関与など,複数の側面を同時に分類することができる。
論文 参考訳(メタデータ) (2024-06-16T23:01:10Z) - CrisisMatch: Semi-Supervised Few-Shot Learning for Fine-Grained Disaster
Tweet Classification [51.58605842457186]
半教師付き, 少数ショットの学習環境下で, 微粒な災害ツイート分類モデルを提案する。
私たちのモデルであるCrisisMatchは、ラベルなしデータと大量のラベルなしデータを用いて、ツイートを関心の細かいクラスに効果的に分類する。
論文 参考訳(メタデータ) (2023-10-23T07:01:09Z) - Sarcasm Detection in a Disaster Context [103.93691731605163]
HurricaneSARCは,意図した皮肉に注釈を付けた15,000ツイートのデータセットである。
私たちの最高のモデルは、データセットで最大0.70F1を得ることができます。
論文 参考訳(メタデータ) (2023-08-16T05:58:12Z) - IKDSumm: Incorporating Key-phrases into BERT for extractive Disaster
Tweet Summarization [5.299958874647294]
災害固有のつぶやき要約フレームワークIKDSummを提案する。
IKDSummは、そのツイートのキーフレーズを通じて、災害に関連する各ツイートから重要かつ重要な情報を識別する。
これらのキーワードを使って、ツイートの要約を自動的に生成する。
論文 参考訳(メタデータ) (2023-05-19T11:05:55Z) - RweetMiner: Automatic identification and categorization of help requests
on twitter during disasters [8.288082084424863]
破滅的な出来事は人道的な組織にとって不確実な状況を生み出し、被災者への援助を提供する。
災害の際には、助けを求めたり、他人に救いを求めたりして、ソーシャルメディアに目を向ける人が多い。
既存のシステムは、ツイートの前処理とツイートのコンテキストの把握のための効果的な戦略を計画していない。
論文 参考訳(メタデータ) (2023-03-04T12:21:45Z) - CrisisLTLSum: A Benchmark for Local Crisis Event Timeline Extraction and
Summarization [62.77066949111921]
本稿では,現在までに利用可能な地域危機イベントタイムラインの最大のデータセットであるCrisisLTLSumについて述べる。
CrisisLTLSumには、山火事、地元の火災、交通、嵐の4つの領域にわたる1000の危機イベントタイムラインが含まれている。
最初の実験では, 両タスクの人的性能と比較して, 強いベースライン性能の間に有意な差があることが示唆された。
論文 参考訳(メタデータ) (2022-10-25T17:32:40Z) - Event-Related Bias Removal for Real-time Disaster Events [67.2965372987723]
ソーシャルメディアは、自然災害や大量攻撃などの危機事象に関する情報を共有する重要なツールとなっている。
有用な情報を含む実行可能なポストを検出するには、大量のデータをリアルタイムに高速に分析する必要がある。
我々は、潜在事象固有のバイアスを除去し、ツイート重要度分類の性能を向上させるために、敵対的ニューラルモデルを訓練する。
論文 参考訳(メタデータ) (2020-11-02T02:03:07Z) - On Identifying Hashtags in Disaster Twitter Data [55.17975121160699]
我々は,行動可能な情報をフィルタリングするのに有用なハッシュタグを付加した災害関連ツイートのユニークなデータセットを構築した。
このデータセットを用いて,マルチタスク学習フレームワークにおける長期記憶モデルについて検討する。
最高のパフォーマンスモデルでは、F1スコアは92.22%に達する。
論文 参考訳(メタデータ) (2020-01-05T22:37:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。