論文の概要: A Named Entity Recognition and Topic Modeling-based Solution for Locating and Better Assessment of Natural Disasters in Social Media
- arxiv url: http://arxiv.org/abs/2405.00903v1
- Date: Wed, 1 May 2024 23:19:49 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-03 18:23:47.324717
- Title: A Named Entity Recognition and Topic Modeling-based Solution for Locating and Better Assessment of Natural Disasters in Social Media
- Title(参考訳): ソーシャルメディアにおける自然災害の特定と評価のためのエンティティ認識とトピックモデリングに基づくソリューション
- Authors: Ayaz Mehmood, Muhammad Tayyab Zamir, Muhammad Asif Ayub, Nasir Ahmad, Kashif Ahmad,
- Abstract要約: ソーシャルメディアのコンテンツは、災害情報学に非常に効果的であることが証明されている。
しかし、データの構造が不整なため、ソーシャルメディアコンテンツにおける災害分析にいくつかの課題が伴う。
災害情報学におけるソーシャルメディアコンテンツの可能性を完全に探求するためには、関連コンテンツへのアクセスと適切な位置情報情報が非常に重要である。
- 参考スコア(独自算出の注目度): 1.9739821076317217
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Over the last decade, similar to other application domains, social media content has been proven very effective in disaster informatics. However, due to the unstructured nature of the data, several challenges are associated with disaster analysis in social media content. To fully explore the potential of social media content in disaster informatics, access to relevant content and the correct geo-location information is very critical. In this paper, we propose a three-step solution to tackling these challenges. Firstly, the proposed solution aims to classify social media posts into relevant and irrelevant posts followed by the automatic extraction of location information from the posts' text through Named Entity Recognition (NER) analysis. Finally, to quickly analyze the topics covered in large volumes of social media posts, we perform topic modeling resulting in a list of top keywords, that highlight the issues discussed in the tweet. For the Relevant Classification of Twitter Posts (RCTP), we proposed a merit-based fusion framework combining the capabilities of four different models namely BERT, RoBERTa, Distil BERT, and ALBERT obtaining the highest F1-score of 0.933 on a benchmark dataset. For the Location Extraction from Twitter Text (LETT), we evaluated four models namely BERT, RoBERTa, Distil BERTA, and Electra in an NER framework obtaining the highest F1-score of 0.960. For topic modeling, we used the BERTopic library to discover the hidden topic patterns in the relevant tweets. The experimental results of all the components of the proposed end-to-end solution are very encouraging and hint at the potential of social media content and NLP in disaster management.
- Abstract(参考訳): 過去10年間で、他のアプリケーションドメインと同様に、ソーシャルメディアコンテンツは災害情報学に非常に効果的であることが証明された。
しかし,データの構造化されていない性質から,ソーシャルメディアコンテンツにおける災害解析にいくつかの課題が関与している。
災害情報学におけるソーシャルメディアコンテンツの可能性を完全に探求するためには、関連コンテンツへのアクセスと適切な位置情報情報が非常に重要である。
本稿では,これらの課題に対処するための3段階の解決策を提案する。
提案手法は,ソーシャルメディアの投稿を関連性のあるポストと無関係なポストに分類することを目的としており,次いで名前付きエンティティ認識(NER)分析を通じて投稿テキストから位置情報を自動的に抽出する。
最後に、大量のソーシャルメディア投稿でカバーされているトピックを迅速に分析するために、このツイートで議論された問題をハイライトするトップキーワードのリストが得られたトピックモデリングを実行する。
Relevant Classification of Twitter Posts (RCTP) では,BERT,RoBERTa,Distil BERT,ALBERTという4種類のモデルの能力を組み合わせたメリットベースの融合フレームワークを提案し,ベンチマークデータセットで0.933のF1スコアを得た。
Twitter Text (LETT) の位置情報抽出では, BERT, RoBERTa, Distil BERTA, Electra の4つのモデルを NER フレームワークで評価した。
トピックモデリングでは、BERTopicライブラリを使用して、関連するツイートに隠されたトピックパターンを発見しました。
提案するエンド・ツー・エンド・ソリューションのすべてのコンポーネントの実験結果は,災害管理におけるソーシャルメディアコンテンツとNLPの可能性を強く示唆している。
関連論文リスト
- A Social Context-aware Graph-based Multimodal Attentive Learning Framework for Disaster Content Classification during Emergencies [0.0]
CrisisSpotは、テキストと視覚の複雑な関係をキャプチャする手法である。
IDEAは、データ内の調和とコントラストの両方のパターンをキャプチャして、マルチモーダルインタラクションを強化する。
CrisisSpotは最先端の手法と比較してF1スコアの平均9.45%と5.01%の上昇を達成した。
論文 参考訳(メタデータ) (2024-10-11T13:51:46Z) - Learning Traffic Crashes as Language: Datasets, Benchmarks, and What-if Causal Analyses [76.59021017301127]
我々は,CrashEventという大規模トラフィッククラッシュ言語データセットを提案し,実世界のクラッシュレポート19,340を要約した。
さらに,クラッシュイベントの特徴学習を,新たなテキスト推論問題として定式化し,さらに様々な大規模言語モデル(LLM)を微調整して,詳細な事故結果を予測する。
実験の結果, LLMに基づくアプローチは事故の重大度を予測できるだけでなく, 事故の種類を分類し, 損害を予測できることがわかった。
論文 参考訳(メタデータ) (2024-06-16T03:10:16Z) - Large Language Models for Next Point-of-Interest Recommendation [53.93503291553005]
位置情報ベースのソーシャルネットワーク(LBSN)データは、しばしば次のPoint of Interest(POI)レコメンデーションタスクに使用される。
しばしば無視される課題の1つは、LBSNデータに存在する豊富なコンテキスト情報を効果的に利用する方法である。
本稿では,この課題に対処するために,LLM(Large Language Models)を用いたフレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-19T13:28:36Z) - CrisisMatch: Semi-Supervised Few-Shot Learning for Fine-Grained Disaster
Tweet Classification [51.58605842457186]
半教師付き, 少数ショットの学習環境下で, 微粒な災害ツイート分類モデルを提案する。
私たちのモデルであるCrisisMatchは、ラベルなしデータと大量のラベルなしデータを用いて、ツイートを関心の細かいクラスに効果的に分類する。
論文 参考訳(メタデータ) (2023-10-23T07:01:09Z) - ManiTweet: A New Benchmark for Identifying Manipulation of News on Social Media [74.93847489218008]
ソーシャルメディア上でのニュースの操作を識別し,ソーシャルメディア投稿の操作を検出し,操作された情報や挿入された情報を特定することを目的とした,新しいタスクを提案する。
この課題を研究するために,データ収集スキーマを提案し,3.6K対のツイートとそれに対応する記事からなるManiTweetと呼ばれるデータセットをキュレートした。
我々の分析では、このタスクは非常に難しいことを示し、大きな言語モデル(LLM)は不満足なパフォーマンスをもたらす。
論文 参考訳(メタデータ) (2023-05-23T16:40:07Z) - IKDSumm: Incorporating Key-phrases into BERT for extractive Disaster
Tweet Summarization [5.299958874647294]
災害固有のつぶやき要約フレームワークIKDSummを提案する。
IKDSummは、そのツイートのキーフレーズを通じて、災害に関連する各ツイートから重要かつ重要な情報を識別する。
これらのキーワードを使って、ツイートの要約を自動的に生成する。
論文 参考訳(メタデータ) (2023-05-19T11:05:55Z) - TopoBERT: Plug and Play Toponym Recognition Module Harnessing Fine-tuned
BERT [11.446721140340575]
TopoBERTは,一次元畳み込みニューラルネットワーク(CNN1D)と変換器による双方向表現(BERT)に基づくトポニム認識モジュールである。
TopoBERTは、他の5つのベースラインモデルと比較して最先端のパフォーマンスを達成し、追加のトレーニングなしで様々なトポニム認識タスクに適用することができる。
論文 参考訳(メタデータ) (2023-01-31T13:44:34Z) - Algorithmic Fairness Datasets: the Story so Far [68.45921483094705]
データ駆動アルゴリズムは、人々の幸福に直接影響し、批判的な決定をサポートするために、さまざまな領域で研究されている。
研究者のコミュニティは、既存のアルゴリズムの株式を調査し、新しいアルゴリズムを提案し、歴史的に不利な人口に対する自動意思決定のリスクと機会の理解を深めてきた。
公正な機械学習の進歩はデータに基づいており、適切に文書化された場合にのみ適切に使用できる。
残念なことに、アルゴリズムフェアネスコミュニティは、特定のリソース(オパシティ)に関する情報の不足と利用可能な情報の分散(スパーシティ)によって引き起こされる、集合的なデータドキュメント負債に悩まされている。
論文 参考訳(メタデータ) (2022-02-03T17:25:46Z) - T-BERT -- Model for Sentiment Analysis of Micro-blogs Integrating Topic
Model and BERT [0.0]
生のライブデータセットからの感情分類タスクにおけるBERT(Bidirectional Representations from Transformers)の有効性を示す。
T-BERT フレームワークは、潜在トピックとコンテキスト BERT 埋め込みを組み合わせることで得られる性能向上を示す。
論文 参考訳(メタデータ) (2021-06-02T12:01:47Z) - Named Entity Recognition for Social Media Texts with Semantic
Augmentation [70.44281443975554]
名前付きエンティティ認識のための既存のアプローチは、短いテキストと非公式テキストで実行される場合、データ空間の問題に悩まされる。
そこで我々は,NER によるソーシャルメディアテキストに対するニューラルベースアプローチを提案し,ローカルテキストと拡張セマンティクスの両方を考慮に入れた。
論文 参考訳(メタデータ) (2020-10-29T10:06:46Z) - I-AID: Identifying Actionable Information from Disaster-related Tweets [0.0]
ソーシャルメディアは、被災者、寄付、支援要請に関する貴重なデータを提供することによって、災害管理において重要な役割を担っている。
ツイートを自動的にマルチラベル情報タイプに分類するマルチモデルアプローチであるI-AIDを提案する。
以上の結果から,I-AIDはTREC-ISデータセットおよびCOVID-19 Tweetsにおいて,平均F1得点の6%,+4%において最先端のアプローチよりも優れていた。
論文 参考訳(メタデータ) (2020-08-04T19:07:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。