論文の概要: IKDSumm: Incorporating Key-phrases into BERT for extractive Disaster
Tweet Summarization
- arxiv url: http://arxiv.org/abs/2305.11592v1
- Date: Fri, 19 May 2023 11:05:55 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-22 14:59:07.906177
- Title: IKDSumm: Incorporating Key-phrases into BERT for extractive Disaster
Tweet Summarization
- Title(参考訳): IKDSumm: 災害ツイート要約のためのキーフレーズをBERTに組み込む
- Authors: Piyush Kumar Garg, Roshni Chakraborty, Srishti Gupta, and Sourav Kumar
Dandapat
- Abstract要約: 災害固有のつぶやき要約フレームワークIKDSummを提案する。
IKDSummは、そのツイートのキーフレーズを通じて、災害に関連する各ツイートから重要かつ重要な情報を識別する。
これらのキーワードを使って、ツイートの要約を自動的に生成する。
- 参考スコア(独自算出の注目度): 5.299958874647294
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Online social media platforms, such as Twitter, are one of the most valuable
sources of information during disaster events. Therefore, humanitarian
organizations, government agencies, and volunteers rely on a summary of this
information, i.e., tweets, for effective disaster management. Although there
are several existing supervised and unsupervised approaches for automated tweet
summary approaches, these approaches either require extensive labeled
information or do not incorporate specific domain knowledge of disasters.
Additionally, the most recent approaches to disaster summarization have
proposed BERT-based models to enhance the summary quality. However, for further
improved performance, we introduce the utilization of domain-specific knowledge
without any human efforts to understand the importance (salience) of a tweet
which further aids in summary creation and improves summary quality. In this
paper, we propose a disaster-specific tweet summarization framework, IKDSumm,
which initially identifies the crucial and important information from each
tweet related to a disaster through key-phrases of that tweet. We identify
these key-phrases by utilizing the domain knowledge (using existing ontology)
of disasters without any human intervention. Further, we utilize these
key-phrases to automatically generate a summary of the tweets. Therefore, given
tweets related to a disaster, IKDSumm ensures fulfillment of the summarization
key objectives, such as information coverage, relevance, and diversity in
summary without any human intervention. We evaluate the performance of IKDSumm
with 8 state-of-the-art techniques on 12 disaster datasets. The evaluation
results show that IKDSumm outperforms existing techniques by approximately
2-79% in terms of ROUGE-N F1-score.
- Abstract(参考訳): twitterのようなオンライン・ソーシャルメディア・プラットフォームは災害時に最も価値ある情報源の1つだ。
したがって、人道的組織、政府機関、ボランティアは、効果的な災害管理のために、この情報、すなわちツイートの要約に依存している。
自動ツイートサマリーアプローチには,既存の教師付きアプローチや教師なしアプローチがいくつか存在するが,これらのアプローチではラベル付き情報を幅広く必要とするか,災害に関する特定のドメイン知識を組み込んでいない。
さらに,最近の災害要約手法では,要約品質向上のためのbertモデルが提案されている。
しかし、さらなるパフォーマンス向上のために、要約作成と要約品質の向上に役立つツイートの重要性(信頼性)を理解するために、人間の努力なしにドメイン固有の知識の利用を導入する。
本稿では,災害固有のツイート要約フレームワークikdsummを提案する。このフレームワークはまず,災害に関連する各ツイートから,そのツイートのキーフレーズを通じて重要かつ重要な情報を識別する。
災害のドメイン知識(既存のオントロジーを用いて)を人間の介入なしに活用することにより,これらのキーフレーズを識別する。
さらに,これらのキーフレーズを用いて,ツイートの要約を自動生成する。
それゆえ、災害に関連するツイートを考えると、ikdsummは、人間の介入なしに要約における情報カバレッジ、関連性、多様性といった、要約の重要な目的の達成を保証する。
IKDSummを12の災害データセット上で8つの最先端技術を用いて評価した。
評価の結果,ikdsumm は rouge-n f1-score で既存手法を約2~79%上回っている。
関連論文リスト
- Public Health in Disaster: Emotional Health and Life Incidents Extraction during Hurricane Harvey [1.433758865948252]
嵐に関連する40万件の公開ツイートのデータセットを収集しました。
BERTベースのモデルを用いて、各ツイートに関連する感情を予測した。
グラフニューラルネットワーク(GNN)とLarge Language Models(LLM)を統合して分析をさらに改良した。
論文 参考訳(メタデータ) (2024-08-20T18:31:20Z) - CrisisSense-LLM: Instruction Fine-Tuned Large Language Model for Multi-label Social Media Text Classification in Disaster Informatics [49.2719253711215]
本研究では,事前学習型大規模言語モデル(LLM)の強化による災害テキスト分類への新たなアプローチを提案する。
本手法では,災害関連ツイートから包括的インストラクションデータセットを作成し,それをオープンソース LLM の微調整に用いる。
この微調整モデルでは,災害関連情報の種類,情報化,人的援助の関与など,複数の側面を同時に分類することができる。
論文 参考訳(メタデータ) (2024-06-16T23:01:10Z) - ADSumm: Annotated Ground-truth Summary Datasets for Disaster Tweet Summarization [8.371475703337106]
既存のつぶやき災害要約アプローチは、政府機関や人道団体などを支援するためにこれらの出来事の要約を提供する。
本稿では,8件の災害イベントに対して,アノテートされた地要要約を付加したADSummを提案する。
実験により,新たに追加されたデータセットはROUGE-N F1スコアにおいて,教師付き要約手法の性能を8~28%向上することが示された。
論文 参考訳(メタデータ) (2024-05-10T15:49:01Z) - CrisisMatch: Semi-Supervised Few-Shot Learning for Fine-Grained Disaster
Tweet Classification [51.58605842457186]
半教師付き, 少数ショットの学習環境下で, 微粒な災害ツイート分類モデルを提案する。
私たちのモデルであるCrisisMatchは、ラベルなしデータと大量のラベルなしデータを用いて、ツイートを関心の細かいクラスに効果的に分類する。
論文 参考訳(メタデータ) (2023-10-23T07:01:09Z) - Sarcasm Detection in a Disaster Context [103.93691731605163]
HurricaneSARCは,意図した皮肉に注釈を付けた15,000ツイートのデータセットである。
私たちの最高のモデルは、データセットで最大0.70F1を得ることができます。
論文 参考訳(メタデータ) (2023-08-16T05:58:12Z) - ManiTweet: A New Benchmark for Identifying Manipulation of News on Social Media [74.93847489218008]
ソーシャルメディア上でのニュースの操作を識別し,ソーシャルメディア投稿の操作を検出し,操作された情報や挿入された情報を特定することを目的とした,新しいタスクを提案する。
この課題を研究するために,データ収集スキーマを提案し,3.6K対のツイートとそれに対応する記事からなるManiTweetと呼ばれるデータセットをキュレートした。
我々の分析では、このタスクは非常に難しいことを示し、大きな言語モデル(LLM)は不満足なパフォーマンスをもたらす。
論文 参考訳(メタデータ) (2023-05-23T16:40:07Z) - PORTRAIT: a hybrid aPproach tO cReate extractive ground-TRuth summAry
for dIsaster evenT [5.386050544766801]
災害要約アプローチは、Twitterなどのソーシャルメディアプラットフォームで災害イベント中に投稿された重要な情報の概要を提供する。
そこで本研究では,提案手法を部分的に自動化するハイブリッド(半自動)手法を提案する。
本研究では,既存の直観的アプローチ,半自動アプローチ,および PortraIT による地中真実の定量的,定性的な比較により,5つの災害事象に対する PortraIT の有効性を検証した。
論文 参考訳(メタデータ) (2023-05-19T09:07:52Z) - CrisisLTLSum: A Benchmark for Local Crisis Event Timeline Extraction and
Summarization [62.77066949111921]
本稿では,現在までに利用可能な地域危機イベントタイムラインの最大のデータセットであるCrisisLTLSumについて述べる。
CrisisLTLSumには、山火事、地元の火災、交通、嵐の4つの領域にわたる1000の危機イベントタイムラインが含まれている。
最初の実験では, 両タスクの人的性能と比較して, 強いベースライン性能の間に有意な差があることが示唆された。
論文 参考訳(メタデータ) (2022-10-25T17:32:40Z) - Event-Related Bias Removal for Real-time Disaster Events [67.2965372987723]
ソーシャルメディアは、自然災害や大量攻撃などの危機事象に関する情報を共有する重要なツールとなっている。
有用な情報を含む実行可能なポストを検出するには、大量のデータをリアルタイムに高速に分析する必要がある。
我々は、潜在事象固有のバイアスを除去し、ツイート重要度分類の性能を向上させるために、敵対的ニューラルモデルを訓練する。
論文 参考訳(メタデータ) (2020-11-02T02:03:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。