論文の概要: QuakeBERT: Accurate Classification of Social Media Texts for Rapid Earthquake Impact Assessment
- arxiv url: http://arxiv.org/abs/2405.06684v1
- Date: Mon, 6 May 2024 10:52:21 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-19 13:49:26.437396
- Title: QuakeBERT: Accurate Classification of Social Media Texts for Rapid Earthquake Impact Assessment
- Title(参考訳): QuakeBERT: 迅速な地震影響評価のためのソーシャルメディアテキストの正確な分類
- Authors: Jin Han, Zhe Zheng, Xin-Zheng Lu, Ke-Yin Chen, Jia-Rui Lin,
- Abstract要約: ソーシャルメディアは災害対応を援助するが、騒音に悩まされ、正確な影響評価と回復力のある都市の決定を妨げている。
本研究では,最初のドメイン固有大規模言語モデル(LLM)と,地震の早期影響評価のための統合手法を提案する。
提案手法は, ノイズマイクロブロッグの正確な検出により, 影響評価過程を効果的に向上できることが示唆された。
- 参考スコア(独自算出の注目度): 7.777478408048141
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Social media aids disaster response but suffers from noise, hindering accurate impact assessment and decision making for resilient cities, which few studies considered. To address the problem, this study proposes the first domain-specific LLM model and an integrated method for rapid earthquake impact assessment. First, a few categories are introduced to classify and filter microblogs considering their relationship to the physical and social impacts of earthquakes, and a dataset comprising 7282 earthquake-related microblogs from twenty earthquakes in different locations is developed as well. Then, with a systematic analysis of various influential factors, QuakeBERT, a domain-specific large language model (LLM), is developed and fine-tuned for accurate classification and filtering of microblogs. Meanwhile, an integrated method integrating public opinion trend analysis, sentiment analysis, and keyword-based physical impact quantification is introduced to assess both the physical and social impacts of earthquakes based on social media texts. Experiments show that data diversity and data volume dominate the performance of QuakeBERT and increase the macro average F1 score by 27%, while the best classification model QuakeBERT outperforms the CNN- or RNN-based models by improving the macro average F1 score from 60.87% to 84.33%. Finally, the proposed approach is applied to assess two earthquakes with the same magnitude and focal depth. Results show that the proposed approach can effectively enhance the impact assessment process by accurate detection of noisy microblogs, which enables effective post-disaster emergency responses to create more resilient cities.
- Abstract(参考訳): ソーシャルメディアは災害対応を援助するが、騒音に悩まされ、正確な影響評価やレジリエントな都市の決定を妨げている。
そこで本研究では,第1のドメイン固有LLMモデルと,地震の早期影響評価のための統合手法を提案する。
まず, 地震の物理的, 社会的影響を考慮し, マイクロブラッグを分類・フィルタリングするためにいくつかのカテゴリを導入し, 異なる場所にある20の地震から7282個の地震関連マイクロブロッグからなるデータセットを開発した。
次に,様々な要因を体系的に分析し,ドメイン固有大言語モデル(LLM)であるQuakeBERTを開発し,マイクロブロッグの正確な分類とフィルタリングを行う。
一方, 世論傾向分析, 感情分析, キーワードに基づく身体的影響定量化を統合した統合的手法を導入し, ソーシャル・メディア・テキストに基づく地震の物理的影響と社会的影響の両方を評価する。
実験の結果、データの多様性とデータボリュームがQuakeBERTの性能を上回り、マクロ平均F1スコアを27%増加させる一方、最良の分類モデルQuakeBERTはマクロ平均F1スコアを60.87%から84.33%に改善することでCNNまたはRNNベースのモデルより優れていることが示された。
最後に, 提案手法を適用した2つの地震の震度と震源深度を同程度に評価する。
提案手法は, 騒音を正確に検出することで, 影響評価プロセスを効果的に向上し, より回復力のある都市を創出できることを示す。
関連論文リスト
- Turkey's Earthquakes: Damage Prediction and Feature Significance Using A Multivariate Analysis [1.9461727843485295]
本研究は,トルコにおける将来の地震災害における死者の減少に寄与する。
我々は、被災者当たりの死亡率と死亡率を予測するために、様々な機械学習アーキテクチャーを試験した。
その結果,ランダムフォレストモデルが最も信頼性の高い予測結果が得られた。
論文 参考訳(メタデータ) (2024-10-29T10:29:06Z) - Causal Micro-Narratives [62.47217054314046]
テキストから因果マイクロナラティブを分類する新しい手法を提案する。
これらの物語は、対象対象の因果関係と/または効果の文レベルの説明である。
論文 参考訳(メタデータ) (2024-10-07T17:55:10Z) - Learning Traffic Crashes as Language: Datasets, Benchmarks, and What-if Causal Analyses [76.59021017301127]
我々は,CrashEventという大規模トラフィッククラッシュ言語データセットを提案し,実世界のクラッシュレポート19,340を要約した。
さらに,クラッシュイベントの特徴学習を,新たなテキスト推論問題として定式化し,さらに様々な大規模言語モデル(LLM)を微調整して,詳細な事故結果を予測する。
実験の結果, LLMに基づくアプローチは事故の重大度を予測できるだけでなく, 事故の種類を分類し, 損害を予測できることがわかった。
論文 参考訳(メタデータ) (2024-06-16T03:10:16Z) - Data-Driven Prediction of Seismic Intensity Distributions Featuring
Hybrid Classification-Regression Models [21.327960186900885]
本研究では, 地震パラメータに基づいて地震強度分布を予測できる線形回帰モデルを開発した。
このデータセットは、1997年から2020年にかけて日本近海で発生した地震の震度データからなる。
提案モデルでは, 従来のGMPEにおける課題として, 異常な震度分布を予測できる。
論文 参考訳(メタデータ) (2024-02-03T13:39:22Z) - Decoding the Silent Majority: Inducing Belief Augmented Social Graph
with Large Language Model for Response Forecasting [74.68371461260946]
SocialSenseは、既存のソーシャルネットワーク上に信念中心のグラフを誘導するフレームワークであり、グラフベースの伝播によって社会的ダイナミクスを捉える。
本手法は,ゼロショット設定と教師あり設定の両方に対する実験的な評価において,既存の最先端技術を超えている。
論文 参考訳(メタデータ) (2023-10-20T06:17:02Z) - Measuring the Effect of Influential Messages on Varying Personas [67.1149173905004]
我々は、ニュースメッセージを見る際にペルソナが持つ可能性のある応答を推定するために、ニュースメディア向けのペルソナに対するレスポンス予測という新しいタスクを提示する。
提案課題は,モデルにパーソナライズを導入するだけでなく,各応答の感情極性と強度も予測する。
これにより、ペルソナの精神状態に関するより正確で包括的な推測が可能になる。
論文 参考訳(メタデータ) (2023-05-25T21:01:00Z) - Earthquake Impact Analysis Based on Text Mining and Social Media
Analytics [5.949779668853556]
地震は広範囲に深く影響しており、緊急救助活動は災害の範囲と範囲に関するソーシャルメディアの情報から恩恵を受ける可能性がある。
本研究は,早期地震影響解析のためのソーシャルメディアデータを収集・分析するためのテキストマイニング手法を提案する。
論文 参考訳(メタデータ) (2022-12-12T13:51:07Z) - DRFLM: Distributionally Robust Federated Learning with Inter-client
Noise via Local Mixup [58.894901088797376]
連合学習は、生データをリークすることなく、複数の組織のデータを使用してグローバルモデルをトレーニングするための有望なアプローチとして登場した。
上記の2つの課題を同時に解決するための一般的な枠組みを提案する。
我々は、ロバストネス解析、収束解析、一般化能力を含む包括的理論的解析を提供する。
論文 参考訳(メタデータ) (2022-04-16T08:08:29Z) - A CNN-BiLSTM Model with Attention Mechanism for Earthquake Prediction [0.0]
本稿では、注意機構(AM)、畳み込みニューラルネットワーク(CNN)、双方向長短期記憶(BiLSTM)モデルに基づく新しい予測手法を提案する。
中国本土の地震カタログに基づいて,各地域の地震の規模と規模を推定することができる。
論文 参考訳(メタデータ) (2021-12-26T20:16:20Z) - Selecting the suitable resampling strategy for imbalanced data
classification regarding dataset properties [62.997667081978825]
医学、情報検索、サイバーセキュリティ、ソーシャルメディアなどの多くのアプリケーションドメインでは、分類モデルの導入に使用されるデータセットは、各クラスのインスタンスの不平等な分布を持つことが多い。
この状況は不均衡データ分類と呼ばれ、少数民族の例では予測性能が低い。
オーバーサンプリングとアンダーサンプリングの技術は、各クラスの例の数とバランスをとることでこの問題に対処する、よく知られた戦略である。
論文 参考訳(メタデータ) (2021-12-15T18:56:39Z) - Towards advancing the earthquake forecasting by machine learning of
satellite data [22.87513332935679]
本研究では,6マグニチュード以上の1,371地震の衛星データに基づく短期予測を行うための新しい機械学習手法であるInverse Boosting Pruning Trees(IBPT)を開発した。
提案手法は,選択された6つのベースラインを上回り,異なる地震データベースの地震予測の可能性を向上する強力な能力を示す。
論文 参考訳(メタデータ) (2021-01-31T02:29:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。