論文の概要: BERT-VBD: Vietnamese Multi-Document Summarization Framework
- arxiv url: http://arxiv.org/abs/2409.12134v1
- Date: Wed, 18 Sep 2024 16:56:06 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-19 16:35:11.519939
- Title: BERT-VBD: Vietnamese Multi-Document Summarization Framework
- Title(参考訳): BERT-VBD:ベトナムの多文書要約フレームワーク
- Authors: Tuan-Cuong Vuong, Trang Mai Xuan, Thien Van Luong,
- Abstract要約: 新しくて有望な戦略は、抽出的および抽象的要約法の相乗的融合を含む。
本稿では,2成分パイプラインアーキテクチャを利用したベトナムのMDSフレームワークを提案する。
提案されたフレームワークは、VN-MDSデータセットで39.6%のROUGE-2スコアを獲得し、最先端のベースラインを上回っている。
- 参考スコア(独自算出の注目度): 2.2526595080231857
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In tackling the challenge of Multi-Document Summarization (MDS), numerous methods have been proposed, spanning both extractive and abstractive summarization techniques. However, each approach has its own limitations, making it less effective to rely solely on either one. An emerging and promising strategy involves a synergistic fusion of extractive and abstractive summarization methods. Despite the plethora of studies in this domain, research on the combined methodology remains scarce, particularly in the context of Vietnamese language processing. This paper presents a novel Vietnamese MDS framework leveraging a two-component pipeline architecture that integrates extractive and abstractive techniques. The first component employs an extractive approach to identify key sentences within each document. This is achieved by a modification of the pre-trained BERT network, which derives semantically meaningful phrase embeddings using siamese and triplet network structures. The second component utilizes the VBD-LLaMA2-7B-50b model for abstractive summarization, ultimately generating the final summary document. Our proposed framework demonstrates a positive performance, attaining ROUGE-2 scores of 39.6% on the VN-MDS dataset and outperforming the state-of-the-art baselines.
- Abstract(参考訳): MDS(Multi-Document Summarization)の課題に対処するために,抽出および抽象的な要約技術にまたがる多くの手法が提案されている。
しかし、それぞれのアプローチには独自の制限があり、どちらのアプローチにも依存することができない。
新しくて有望な戦略は、抽出的および抽象的要約法の相乗的融合を含む。
この領域での多くの研究にもかかわらず、統合された方法論の研究は、特にベトナム語処理の文脈ではほとんど行われていない。
本稿では,抽出・抽象化技術を統合した2成分パイプラインアーキテクチャを利用したベトナムのMDSフレームワークを提案する。
第1のコンポーネントは、各ドキュメント内のキー文を特定するための抽出アプローチを採用している。
これは、シアムと三重項ネットワーク構造を用いた意味的に意味のあるフレーズ埋め込みを導出する、事前訓練されたBERTネットワークの修正によって達成される。
第2のコンポーネントは、VBD-LLaMA2-7B-50bモデルを使用して抽象的な要約を行い、最終的な要約文書を生成する。
提案手法は,VN-MDSデータセットにおけるROUGE-2スコアの39.6%を達成し,最先端のベースラインよりも優れた性能を示す。
関連論文リスト
- Absformer: Transformer-based Model for Unsupervised Multi-Document
Abstractive Summarization [1.066048003460524]
MDS(Multi-document summarization)とは、複数の文書のテキストを簡潔な要約に要約する作業である。
抽象MDSは、自然言語生成技術を用いて、複数の文書の一貫性と流動性を備えた要約を生成することを目的としている。
本稿では、教師なし抽象要約生成のためのトランスフォーマーに基づく新しい手法であるAbsformerを提案する。
論文 参考訳(メタデータ) (2023-06-07T21:18:23Z) - LBMT team at VLSP2022-Abmusu: Hybrid method with text correlation and
generative models for Vietnamese multi-document summarization [1.4716144941085147]
本稿では,クラスタ類似度に基づくマルチドキュメント要約手法を提案する。
各クラスタから最も重要な文を選択して要約を生成した後、BARTpho と ViT5 を用いて抽象モデルを構築する。
論文 参考訳(メタデータ) (2023-04-11T13:15:24Z) - ReSel: N-ary Relation Extraction from Scientific Text and Tables by
Learning to Retrieve and Select [53.071352033539526]
学術論文からN-ary関係を抽出する問題について考察する。
提案手法であるReSelは,このタスクを2段階のプロシージャに分解する。
3つの科学的情報抽出データセットに対する実験により、ReSelは最先端のベースラインを大きく上回っていることがわかった。
論文 参考訳(メタデータ) (2022-10-26T02:28:02Z) - Semantics-Consistent Cross-domain Summarization via Optimal Transport
Alignment [80.18786847090522]
本稿では,視覚とテキストのセグメンテーションによる最適なトランスポートアライメントに基づくセマンティックス・コンスタントなクロスドメイン要約モデルを提案する。
提案手法を最近の3つのマルチモーダルデータセット上で評価し,高品質なマルチモーダル要約を作成する上での有効性を実証した。
論文 参考訳(メタデータ) (2022-10-10T14:27:10Z) - An analysis of document graph construction methods for AMR summarization [2.055054374525828]
本稿では,文書と要約のノード間のアライメントを人間にアノテートした新しいデータセットを提案する。
本稿では,これらの2種類の評価方法とノードマージの新しい手法を適用し,新しい手法が従来の方法よりもはるかに優れた性能を示すことを示す。
論文 参考訳(メタデータ) (2021-11-27T22:12:50Z) - SgSum: Transforming Multi-document Summarization into Sub-graph
Selection [27.40759123902261]
既存の抽出多文書要約(MDS)手法は、各文を個別にスコアし、一つずつ有能な文を抽出して要約を構成する。
サブグラフ選択問題としてMDSタスクを定式化する新しいMDSフレームワーク(SgSum)を提案する。
我々のモデルは従来のMDS法と比較して、より一貫性があり、情報的な要約を生成できる。
論文 参考訳(メタデータ) (2021-10-25T05:12:10Z) - Eider: Evidence-enhanced Document-level Relation Extraction [56.71004595444816]
文書レベルの関係抽出(DocRE)は、文書内のエンティティペア間の意味関係を抽出することを目的としている。
本稿では,共同関係と証拠抽出,エビデンス中心関係抽出(RE),抽出結果の融合からなる3段階のエビデンス強化DocREフレームワークを提案する。
論文 参考訳(メタデータ) (2021-06-16T09:43:16Z) - BASS: Boosting Abstractive Summarization with Unified Semantic Graph [49.48925904426591]
BASSは、統合されたセマンティックグラフに基づく抽象的な要約を促進するためのフレームワークである。
文書表現と要約生成の両方を改善するために,グラフベースのエンコーダデコーダモデルを提案する。
実験結果から,提案アーキテクチャは長期文書および複数文書要約タスクに大幅な改善をもたらすことが示された。
論文 参考訳(メタデータ) (2021-05-25T16:20:48Z) - Topic-Guided Abstractive Text Summarization: a Joint Learning Approach [19.623946402970933]
本稿では,抽象テキスト要約のための新しいアプローチ,トピックガイドによる抽象要約を提案する。
ニューラルネットワークをTransformerベースのシーケンス・ツー・シーケンス(seq2seq)モデルに結合学習フレームワークに組み込むことが目的だ。
論文 参考訳(メタデータ) (2020-10-20T14:45:25Z) - SummPip: Unsupervised Multi-Document Summarization with Sentence Graph
Compression [61.97200991151141]
SummPipはマルチドキュメント要約のための教師なしの手法である。
元の文書を文グラフに変換し、言語表現と深層表現の両方を考慮に入れます。
次に、スペクトルクラスタリングを適用して複数の文のクラスタを取得し、最後に各クラスタを圧縮して最終的な要約を生成する。
論文 参考訳(メタデータ) (2020-07-17T13:01:15Z) - Extractive Summarization as Text Matching [123.09816729675838]
本稿では,ニューラル抽出要約システムの構築方法に関するパラダイムシフトを作成する。
抽出した要約タスクを意味テキストマッチング問題として定式化する。
我々はCNN/DailyMailの最先端抽出結果を新しいレベル(ROUGE-1の44.41)に推し進めた。
論文 参考訳(メタデータ) (2020-04-19T08:27:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。