論文の概要: ATSumm: Auxiliary information enhanced approach for abstractive disaster Tweet Summarization with sparse training data
- arxiv url: http://arxiv.org/abs/2405.06541v1
- Date: Fri, 10 May 2024 15:36:56 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-13 15:28:24.868836
- Title: ATSumm: Auxiliary information enhanced approach for abstractive disaster Tweet Summarization with sparse training data
- Title(参考訳): ATSumm: スパーストレーニングデータを用いた抽象的災害つぶやき要約のための補助情報強化アプローチ
- Authors: Piyush Kumar Garg, Roshni Chakraborty, Sourav Kumar Dandapat,
- Abstract要約: 本研究は、補助情報を用いてデータ空間の問題に効果的に対処する抽象的なTweet Summarizer(ATSumm)を提案する。
キーフレーズアテンションと呼ばれるユニークなアテンション機構を利用するAuxPGN(Auxiliary Pointer Generator Network)モデルを提案する。
提案手法を,13の災害データセットを対象とした10の最先端手法と比較することにより評価した。
- 参考スコア(独自算出の注目度): 8.371475703337106
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The abundance of situational information on Twitter poses a challenge for users to manually discern vital and relevant information during disasters. A concise and human-interpretable overview of this information helps decision-makers in implementing efficient and quick disaster response. Existing abstractive summarization approaches can be categorized as sentence-based or key-phrase-based approaches. This paper focuses on sentence-based approach, which is typically implemented as a dual-phase procedure in literature. The initial phase, known as the extractive phase, involves identifying the most relevant tweets. The subsequent phase, referred to as the abstractive phase, entails generating a more human-interpretable summary. In this study, we adopt the methodology from prior research for the extractive phase. For the abstractive phase of summarization, most existing approaches employ deep learning-based frameworks, which can either be pre-trained or require training from scratch. However, to achieve the appropriate level of performance, it is imperative to have substantial training data for both methods, which is not readily available. This work presents an Abstractive Tweet Summarizer (ATSumm) that effectively addresses the issue of data sparsity by using auxiliary information. We introduced the Auxiliary Pointer Generator Network (AuxPGN) model, which utilizes a unique attention mechanism called Key-phrase attention. This attention mechanism incorporates auxiliary information in the form of key-phrases and their corresponding importance scores from the input tweets. We evaluate the proposed approach by comparing it with 10 state-of-the-art approaches across 13 disaster datasets. The evaluation results indicate that ATSumm achieves superior performance compared to state-of-the-art approaches, with improvement of 4-80% in ROUGE-N F1-score.
- Abstract(参考訳): Twitter上の状況情報の豊富さは、災害時にユーザーが手動で重要な情報や関連情報を識別することの難しさを招いている。
この情報の簡潔で人間の解釈可能な概要は、意思決定者が効率的かつ迅速な災害対応を実装するのに役立ちます。
既存の抽象的な要約アプローチは、文ベースまたはキーフレーズベースのアプローチに分類される。
本論文は文型アプローチに着目し, 典型的には文学における二重相手続きとして実装される。
最初のフェーズは抽出フェーズと呼ばれ、最も関連性の高いツイートを識別する。
その後のフェーズは抽象フェーズと呼ばれ、より人間的に解釈可能な要約を生成する。
本研究では,抽出段階の先行研究から方法論を取り入れた。
要約の抽象的なフェーズでは、既存のアプローチのほとんどはディープラーニングベースのフレームワークを採用しています。
しかし、パフォーマンスの適切なレベルを達成するためには、両方のメソッドに対して実質的なトレーニングデータを持つことが不可欠であり、これは容易には利用できない。
本稿では、補助情報を用いてデータ空間の問題に効果的に対処する抽象ツイート要約器(ATSumm)を提案する。
我々はキーフレーズアテンションと呼ばれるユニークなアテンション機構を利用するAuxPGN(Auxiliary Pointer Generator Network)モデルを導入した。
このアテンションメカニズムは、入力されたツイートから、キーフレーズの形式で補助情報と、それに対応する重要なスコアを組み込む。
提案手法を,13の災害データセットを対象とした10の最先端手法と比較することにより評価した。
評価の結果, ROUGE-N F1スコアの4-80%向上により, ATSummは最先端のアプローチよりも優れた性能が得られることがわかった。
関連論文リスト
- Topic-DPR: Topic-based Prompts for Dense Passage Retrieval [6.265789210037749]
トピックベースのプロンプトを用いた高密度経路探索モデルであるTopic-DPRを提案する。
本稿では, 半構造化データを利用して高密度検索効率を向上させる, 新規な正負サンプリング手法を提案する。
論文 参考訳(メタデータ) (2023-10-10T13:45:24Z) - Boosting Event Extraction with Denoised Structure-to-Text Augmentation [52.21703002404442]
イベント抽出は、テキストから事前に定義されたイベントトリガと引数を認識することを目的としている。
最近のデータ拡張手法は文法的誤りの問題を無視することが多い。
本稿では,イベント抽出DAEEのための記述構造からテキストへの拡張フレームワークを提案する。
論文 参考訳(メタデータ) (2023-05-16T16:52:07Z) - Robust Saliency-Aware Distillation for Few-shot Fine-grained Visual
Recognition [57.08108545219043]
サンプルが少ない新しいサブカテゴリを認識することは、コンピュータビジョンにおいて不可欠で挑戦的な研究課題である。
既存の文献は、ローカルベースの表現アプローチを採用することでこの問題に対処している。
本稿では,ロバスト・サリエンシ・アウェア蒸留法(RSaD)を提案する。
論文 参考訳(メタデータ) (2023-05-12T00:13:17Z) - Curriculum-Guided Abstractive Summarization [45.57561926145256]
最近のTransformerベースの要約モデルは、抽象的な要約に有望なアプローチを提供してきた。
これらのモデルには2つの欠点がある:(1)コンテンツ選択が不十分な場合が多く、(2)トレーニング戦略があまり効率的ではないため、モデルの性能が制限される。
本稿では,これらの落とし穴を補うための2つの方法について検討する。まず,デコーダ内に文のクロスアテンションモジュールを配置することでトランスフォーマーネットワークを拡張し,より健全なコンテンツの抽象化を促進する。
論文 参考訳(メタデータ) (2023-02-02T11:09:37Z) - Active Learning for Abstractive Text Summarization [50.79416783266641]
本稿では,抽象テキスト要約におけるアクティブラーニングのための最初の効果的なクエリ戦略を提案する。
ALアノテーションにおける私たちの戦略は、ROUGEと一貫性スコアの点からモデル性能を向上させるのに役立ちます。
論文 参考訳(メタデータ) (2023-01-09T10:33:14Z) - Cluster-level pseudo-labelling for source-free cross-domain facial
expression recognition [94.56304526014875]
表情認識のためのSFUDA法を提案する。
本手法は,自己教師付き事前学習を利用して,対象データから優れた特徴表現を学習する。
提案手法の有効性を4つの適応方式で検証し,FERに適用した場合,既存のSFUDA法より一貫して優れていることを示す。
論文 参考訳(メタデータ) (2022-10-11T08:24:50Z) - Causal Intervention-based Prompt Debiasing for Event Argument Extraction [19.057467535856485]
我々は、名前ベースのプロンプトとオントロジーベースのプロンプトの2種類のプロンプトを比較し、オントロジーベースのプロンプトメソッドがゼロショットイベント引数抽出(EAE)においてそのプロンプトをいかに上回っているかを明らかにする。
2つのベンチマーク実験により,デバイアス法によって修正されたベースラインモデルは,より効果的かつ堅牢になり,対向攻撃に対する耐性が著しく向上することが示された。
論文 参考訳(メタデータ) (2022-10-04T12:32:00Z) - CUP: Curriculum Learning based Prompt Tuning for Implicit Event Argument
Extraction [22.746071199667146]
Implicit Event argument extract (EAE) は、文書に散らばる可能性のある引数を特定することを目的としている。
本稿では,4つの学習段階によって暗黙的EAEを解消する,カリキュラム学習に基づくプロンプトチューニング(CUP)手法を提案する。
さらに,事前学習した言語モデルから関連する知識を引き出すために,プロンプトベースのエンコーダデコーダモデルを統合する。
論文 参考訳(メタデータ) (2022-05-01T16:03:54Z) - Distant finetuning with discourse relations for stance classification [55.131676584455306]
そこで本研究では,定位分類のモデルとして,原文から銀ラベルでデータを抽出し,微調整する手法を提案する。
また,様々な段階において微調整に用いるデータのノイズレベルが減少する3段階のトレーニングフレームワークを提案する。
NLPCC 2021共有タスクArgumentative Text Understanding for AI Debaterでは,26の競合チームの中で1位にランクインした。
論文 参考訳(メタデータ) (2022-04-27T04:24:35Z) - SAIS: Supervising and Augmenting Intermediate Steps for Document-Level
Relation Extraction [51.27558374091491]
本稿では,関係抽出のための中間ステップ(SAIS)を監督し,拡張することにより,関連コンテキストやエンティティタイプをキャプチャするモデルを明示的に教えることを提案する。
そこで本提案手法は,より効果的な管理を行うため,より優れた品質の関係を抽出するだけでなく,それに対応する証拠をより正確に抽出する。
論文 参考訳(メタデータ) (2021-09-24T17:37:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。