論文の概要: Vietnamese multi-document summary using subgraph selection approach --
VLSP 2022 AbMuSu Shared Task
- arxiv url: http://arxiv.org/abs/2306.14827v1
- Date: Mon, 26 Jun 2023 16:34:02 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-27 12:38:09.520667
- Title: Vietnamese multi-document summary using subgraph selection approach --
VLSP 2022 AbMuSu Shared Task
- Title(参考訳): サブグラフ選択によるベトナムのマルチドキュメント要約 -vlsp 2022 abmusu shared task
- Authors: Huu-Thin Nguyen, Tam Doan Thanh, Cam-Van Thi Nguyen
- Abstract要約: 文書要約は、文書の流動的で凝縮した要約を生成するタスクである。
本稿では,抽出MDS問題をサブグラフ選択に変換することに焦点を当てる。
VLSP評価キャンペーン2022で発表されたベトナムのデータセットで実験が行われた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Document summarization is a task to generate afluent, condensed summary for a
document, andkeep important information. A cluster of documents serves as the
input for multi-document summarizing (MDS), while the cluster summary serves as
the output. In this paper, we focus on transforming the extractive MDS problem
into subgraph selection. Approaching the problem in the form of graphs helps to
capture simultaneously the relationship between sentences in the same document
and between sentences in the same cluster based on exploiting the overall graph
structure and selected subgraphs. Experiments have been implemented on the
Vietnamese dataset published in VLSP Evaluation Campaign 2022. This model
currently results in the top 10 participating teams reported on the ROUGH-2
$F\_1$ measure on the public test set.
- Abstract(参考訳): 文書要約(英: document summarization)とは、文書を要約し、重要な情報を収集するタスクである。
文書のクラスタはマルチドキュメント要約(MDS)の入力として機能し、クラスタのサマリは出力として機能する。
本稿では,抽出MDS問題をサブグラフ選択に変換することに焦点を当てる。
グラフの形での問題にアプローチすることは、グラフ構造全体と選択した部分グラフを利用して、同じ文書内の文と同一クラスタ内の文の関係を同時にキャプチャするのに役立つ。
VLSP評価キャンペーン2022で発表されたベトナムのデータセットで実験が行われた。
このモデルは現在、公開テストセットの粗い2ドルの$f\_1$測定値で報告される上位10チームの結果となっている。
関連論文リスト
- The Power of Summary-Source Alignments [62.76959473193149]
多文書要約(MDS)は難しい課題であり、しばしばサリエンスと冗長性検出のサブタスクに分解される。
参照要約とそのソース文書間の対応する文のアライメントを利用して、トレーニングデータを生成する。
本稿では,よりきめ細かな提案スパンレベルで適用することで,要約ソースアライメントフレームワークを拡張することを提案する。
論文 参考訳(メタデータ) (2024-06-02T19:35:19Z) - Overview of the VLSP 2022 -- Abmusu Shared Task: A Data Challenge for
Vietnamese Abstractive Multi-document Summarization [0.6827423171182151]
Abmusuの共有タスクの目的は、トピック上の文書の集合に対して抽象的な要約を自動的に作成できる要約システムを開発することである。
ベトナムのニュースから収集した1,839の文書を600のクラスタにまとめた人手によるデータセットを8つのカテゴリに分けて構築する。
モデルは、文書要約問題の最も典型的な評価指標であるtexttROUGE2-F1 スコアで評価され、ランク付けされる。
論文 参考訳(メタデータ) (2023-11-27T04:01:13Z) - Abstractive Summarization of Large Document Collections Using GPT [1.8130068086063336]
本稿では,個々の文書ではなく,文書コレクションにスケールするために設計された抽象的な要約手法を提案する。
提案手法では,トピッククラスタ内のセマンティッククラスタリング,トピッククラスタ内の文書サイズ削減,クラスタの文書のセマンティックチャンク,GPTに基づく要約と結合,各トピックの感情とテキストの可視化を組み合わせて探索データ解析を支援する。
論文 参考訳(メタデータ) (2023-10-09T13:06:21Z) - Doc2SoarGraph: Discrete Reasoning over Visually-Rich Table-Text
Documents via Semantic-Oriented Hierarchical Graphs [79.0426838808629]
視覚的にリッチなテーブルテキスト文書に答えるTAT-DQAを提案する。
具体的には、離散推論機能を強化した新しいDoc2SoarGraphフレームワークを提案する。
我々は,TAT-DQAデータセットに関する広範な実験を行い,提案したフレームワークは,テストセット上でのエクサクティマッチ(EM)とF1スコアでそれぞれ17.73%,F1スコアで16.91%の最高のベースラインモデルを上回る結果を得た。
論文 参考訳(メタデータ) (2023-05-03T07:30:32Z) - LBMT team at VLSP2022-Abmusu: Hybrid method with text correlation and
generative models for Vietnamese multi-document summarization [1.4716144941085147]
本稿では,クラスタ類似度に基づくマルチドキュメント要約手法を提案する。
各クラスタから最も重要な文を選択して要約を生成した後、BARTpho と ViT5 を用いて抽象モデルを構築する。
論文 参考訳(メタデータ) (2023-04-11T13:15:24Z) - Scientific Paper Extractive Summarization Enhanced by Citation Graphs [50.19266650000948]
我々は、引用グラフを活用して、異なる設定下での科学的論文の抽出要約を改善することに重点を置いている。
予備的な結果は、単純な教師なしフレームワークであっても、引用グラフが有用であることを示している。
そこで我々は,大規模ラベル付きデータが利用可能である場合のタスクにおいて,より正確な結果を得るために,グラフベースのスーパービジョン・サムライゼーション・モデル(GSS)を提案する。
論文 参考訳(メタデータ) (2022-12-08T11:53:12Z) - Question-Based Salient Span Selection for More Controllable Text
Summarization [67.68208237480646]
本稿では,質問応答(QA)信号を要約モデルに組み込む手法を提案する。
提案手法は,入力文書中の有声名詞句(NP)を自動生成することで同定する。
このQAベースの信号は、2段階の要約モデルに組み込まれ、まず分類モデルを用いて入力文書中の有能なNPをマークし、その後、条件付きで要約を生成する。
論文 参考訳(メタデータ) (2021-11-15T17:36:41Z) - SgSum: Transforming Multi-document Summarization into Sub-graph
Selection [27.40759123902261]
既存の抽出多文書要約(MDS)手法は、各文を個別にスコアし、一つずつ有能な文を抽出して要約を構成する。
サブグラフ選択問題としてMDSタスクを定式化する新しいMDSフレームワーク(SgSum)を提案する。
我々のモデルは従来のMDS法と比較して、より一貫性があり、情報的な要約を生成できる。
論文 参考訳(メタデータ) (2021-10-25T05:12:10Z) - WSL-DS: Weakly Supervised Learning with Distant Supervision for Query
Focused Multi-Document Abstractive Summarization [16.048329028104643]
Query Focused Multi-Document Summarization (QF-MDS)タスクでは、ドキュメントのセットとクエリが与えられ、そこでこれらのドキュメントから要約を生成する。
このタスクの大きな課題のひとつは、ラベル付きトレーニングデータセットの可用性の欠如である。
本稿では,遠隔指導による弱教師付き学習手法を提案する。
論文 参考訳(メタデータ) (2020-11-03T02:02:55Z) - SummPip: Unsupervised Multi-Document Summarization with Sentence Graph
Compression [61.97200991151141]
SummPipはマルチドキュメント要約のための教師なしの手法である。
元の文書を文グラフに変換し、言語表現と深層表現の両方を考慮に入れます。
次に、スペクトルクラスタリングを適用して複数の文のクラスタを取得し、最後に各クラスタを圧縮して最終的な要約を生成する。
論文 参考訳(メタデータ) (2020-07-17T13:01:15Z) - Leveraging Graph to Improve Abstractive Multi-Document Summarization [50.62418656177642]
我々は、文書のよく知られたグラフ表現を活用することができる、抽象的多文書要約(MDS)モデルを開発する。
本モデルでは,長い文書の要約に欠かせない文書間関係を捉えるために,文書の符号化にグラフを利用する。
また,このモデルでは,要約生成プロセスの導出にグラフを利用することが可能であり,一貫性と簡潔な要約を生成するのに有用である。
論文 参考訳(メタデータ) (2020-05-20T13:39:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。