論文の概要: ADSumm: Annotated Ground-truth Summary Datasets for Disaster Tweet Summarization
- arxiv url: http://arxiv.org/abs/2405.06551v1
- Date: Fri, 10 May 2024 15:49:01 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-13 15:28:24.850446
- Title: ADSumm: Annotated Ground-truth Summary Datasets for Disaster Tweet Summarization
- Title(参考訳): ADSumm: 災害時つぶやき要約のためのアノテート・グラウンド・トゥルース・サマリー・データセット
- Authors: Piyush Kumar Garg, Roshni Chakraborty, Sourav Kumar Dandapat,
- Abstract要約: 既存のつぶやき災害要約アプローチは、政府機関や人道団体などを支援するためにこれらの出来事の要約を提供する。
本稿では,8件の災害イベントに対して,アノテートされた地要要約を付加したADSummを提案する。
実験により,新たに追加されたデータセットはROUGE-N F1スコアにおいて,教師付き要約手法の性能を8~28%向上することが示された。
- 参考スコア(独自算出の注目度): 8.371475703337106
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Online social media platforms, such as Twitter, provide valuable information during disaster events. Existing tweet disaster summarization approaches provide a summary of these events to aid government agencies, humanitarian organizations, etc., to ensure effective disaster response. In the literature, there are two types of approaches for disaster summarization, namely, supervised and unsupervised approaches. Although supervised approaches are typically more effective, they necessitate a sizable number of disaster event summaries for testing and training. However, there is a lack of good number of disaster summary datasets for training and evaluation. This motivates us to add more datasets to make supervised learning approaches more efficient. In this paper, we present ADSumm, which adds annotated ground-truth summaries for eight disaster events which consist of both natural and man-made disaster events belonging to seven different countries. Our experimental analysis shows that the newly added datasets improve the performance of the supervised summarization approaches by 8-28% in terms of ROUGE-N F1-score. Moreover, in newly annotated dataset, we have added a category label for each input tweet which helps to ensure good coverage from different categories in summary. Additionally, we have added two other features relevance label and key-phrase, which provide information about the quality of a tweet and explanation about the inclusion of the tweet into summary, respectively. For ground-truth summary creation, we provide the annotation procedure adapted in detail, which has not been described in existing literature. Experimental analysis shows the quality of ground-truth summary is very good with Coverage, Relevance and Diversity.
- Abstract(参考訳): Twitterのようなオンラインソーシャルメディアプラットフォームは、災害時に貴重な情報を提供する。
既存のつぶやき災害要約手法は、政府機関や人道機関等が効果的な災害対応を確実にするためにこれらの事象の要約を提供する。
文献では,災害要約,すなわち教師なしと教師なしの2つのアプローチがある。
教師付きアプローチは一般的により効果的であるが、テストやトレーニングには膨大な数の災害イベントサマリを必要とする。
しかし、トレーニングや評価には多くの災害概要データセットが欠落している。
これにより、より多くのデータセットを追加して、教師付き学習アプローチをより効率的にするためのモチベーションが得られます。
本稿では,7カ国に属する自然災害と人的災害の両方からなる8つの災害イベントについて,アノテートされた地要要約を付加したADSummを提案する。
実験により,新たに追加されたデータセットはROUGE-N F1スコアにおいて,教師付き要約手法の性能を8~28%向上することが示された。
さらに、新たにアノテートされたデータセットでは、各入力ツイートにカテゴリラベルを追加し、まとめて異なるカテゴリからの良好なカバレッジを確保するのに役立ちます。
さらに、ツイートの品質に関する情報と、ツイートの要約への含意に関する説明を提供する、関連ラベルとキーフレーズを2つ追加しました。
提案手法は, 既存の文献では説明されていないような, 詳細に適応した注釈作成手法を提供する。
実験による解析から, 地底の要約の質は, カバー, 関連性, 多様性に非常によく適合していることがわかった。
関連論文リスト
- CrisisSense-LLM: Instruction Fine-Tuned Large Language Model for Multi-label Social Media Text Classification in Disaster Informatics [49.2719253711215]
本研究では,事前学習型大規模言語モデル(LLM)の強化による災害テキスト分類への新たなアプローチを提案する。
本手法では,災害関連ツイートから包括的インストラクションデータセットを作成し,それをオープンソース LLM の微調整に用いる。
この微調整モデルでは,災害関連情報の種類,情報化,人的援助の関与など,複数の側面を同時に分類することができる。
論文 参考訳(メタデータ) (2024-06-16T23:01:10Z) - Multi-Query Focused Disaster Summarization via Instruction-Based
Prompting [3.6199702611839792]
CrisisFACTSは,マルチストリームファクトフィンディングに基づく災害要約の推進を目的としている。
ここでは、いくつかの災害関連事象から重要な事実を抽出できるシステムを開発するよう、参加者に依頼する。
本稿では,この課題に対処する方法について述べる。
論文 参考訳(メタデータ) (2024-02-14T08:22:58Z) - CrisisMatch: Semi-Supervised Few-Shot Learning for Fine-Grained Disaster
Tweet Classification [51.58605842457186]
半教師付き, 少数ショットの学習環境下で, 微粒な災害ツイート分類モデルを提案する。
私たちのモデルであるCrisisMatchは、ラベルなしデータと大量のラベルなしデータを用いて、ツイートを関心の細かいクラスに効果的に分類する。
論文 参考訳(メタデータ) (2023-10-23T07:01:09Z) - DeCrisisMB: Debiased Semi-Supervised Learning for Crisis Tweet
Classification via Memory Bank [52.20298962359658]
危機イベントにおいて、人々は、状況、警告、アドバイス、サポートに関する情報を広めるために、Twitterのようなソーシャルメディアプラットフォームを使うことが多い。
完全に教師されたアプローチでは、大量のデータを注釈付けする必要があります。
半教師付きモデルは偏りがあり、特定のクラスでは適度に機能し、他のクラスでは極めて貧弱である。
本稿では,メモリバンクを用いて,各学習クラスから生成された擬似ラベルを等しくサンプリングする,単純かつ効果的なデバイアス処理手法であるDeCrisisMBを提案する。
論文 参考訳(メタデータ) (2023-10-23T05:25:51Z) - IKDSumm: Incorporating Key-phrases into BERT for extractive Disaster
Tweet Summarization [5.299958874647294]
災害固有のつぶやき要約フレームワークIKDSummを提案する。
IKDSummは、そのツイートのキーフレーズを通じて、災害に関連する各ツイートから重要かつ重要な情報を識別する。
これらのキーワードを使って、ツイートの要約を自動的に生成する。
論文 参考訳(メタデータ) (2023-05-19T11:05:55Z) - PORTRAIT: a hybrid aPproach tO cReate extractive ground-TRuth summAry
for dIsaster evenT [5.386050544766801]
災害要約アプローチは、Twitterなどのソーシャルメディアプラットフォームで災害イベント中に投稿された重要な情報の概要を提供する。
そこで本研究では,提案手法を部分的に自動化するハイブリッド(半自動)手法を提案する。
本研究では,既存の直観的アプローチ,半自動アプローチ,および PortraIT による地中真実の定量的,定性的な比較により,5つの災害事象に対する PortraIT の有効性を検証した。
論文 参考訳(メタデータ) (2023-05-19T09:07:52Z) - SumREN: Summarizing Reported Speech about Events in News [51.82314543729287]
本稿では,各話者の反応を,それぞれの発言によって表現された反応を,ある事象に要約する新しい課題を提案する。
我々は,多文書要約ベンチマークSUMRENを作成し,様々な公開人物からの報告文の745の要約を作成した。
論文 参考訳(メタデータ) (2022-12-02T12:51:39Z) - Event-Related Bias Removal for Real-time Disaster Events [67.2965372987723]
ソーシャルメディアは、自然災害や大量攻撃などの危機事象に関する情報を共有する重要なツールとなっている。
有用な情報を含む実行可能なポストを検出するには、大量のデータをリアルタイムに高速に分析する必要がある。
我々は、潜在事象固有のバイアスを除去し、ツイート重要度分類の性能を向上させるために、敵対的ニューラルモデルを訓練する。
論文 参考訳(メタデータ) (2020-11-02T02:03:07Z) - Few-Shot Learning for Opinion Summarization [117.70510762845338]
オピニオン要約は、複数の文書で表現された主観的な情報を反映したテキストの自動生成である。
本研究では,要約テキストの生成をブートストラップするのには,少数の要約でも十分であることを示す。
提案手法は, 従来の抽出法および抽象法を, 自動的, 人的評価において大きく上回っている。
論文 参考訳(メタデータ) (2020-04-30T15:37:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。