論文の概要: Overview of the VLSP 2022 -- Abmusu Shared Task: A Data Challenge for
Vietnamese Abstractive Multi-document Summarization
- arxiv url: http://arxiv.org/abs/2311.15525v1
- Date: Mon, 27 Nov 2023 04:01:13 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-28 17:17:30.617836
- Title: Overview of the VLSP 2022 -- Abmusu Shared Task: A Data Challenge for
Vietnamese Abstractive Multi-document Summarization
- Title(参考訳): VLSP 2022 -- Abmusu Shared Task: A data Challenge for Vietnam Abstractive Multi-document Summarization
- Authors: Mai-Vu Tran, Hoang-Quynh Le, Duy-Cat Can, Quoc-An Nguyen
- Abstract要約: Abmusuの共有タスクの目的は、トピック上の文書の集合に対して抽象的な要約を自動的に作成できる要約システムを開発することである。
ベトナムのニュースから収集した1,839の文書を600のクラスタにまとめた人手によるデータセットを8つのカテゴリに分けて構築する。
モデルは、文書要約問題の最も典型的な評価指標であるtexttROUGE2-F1 スコアで評価され、ランク付けされる。
- 参考スコア(独自算出の注目度): 0.6827423171182151
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper reports the overview of the VLSP 2022 - Vietnamese abstractive
multi-document summarization (Abmusu) shared task for Vietnamese News. This
task is hosted at the 9$^{th}$ annual workshop on Vietnamese Language and
Speech Processing (VLSP 2022). The goal of Abmusu shared task is to develop
summarization systems that could create abstractive summaries automatically for
a set of documents on a topic. The model input is multiple news documents on
the same topic, and the corresponding output is a related abstractive summary.
In the scope of Abmusu shared task, we only focus on Vietnamese news
summarization and build a human-annotated dataset of 1,839 documents in 600
clusters, collected from Vietnamese news in 8 categories. Participated models
are evaluated and ranked in terms of \texttt{ROUGE2-F1} score, the most typical
evaluation metric for document summarization problem.
- Abstract(参考訳): 本稿ではベトナムニュースにおけるVLSP 2022-ベトナムの抽象的多文書要約(Abmusu)の概要を報告する。
この仕事はベトナム語と音声処理に関する9$^{th}$年次ワークショップ(vlsp 2022)で開催されている。
Abmusuの共有タスクの目的は、トピック上の文書の集合に対して抽象的な要約を自動的に作成できる要約システムを開発することである。
モデル入力は同じトピック上の複数のニュースドキュメントであり、対応する出力は関連する抽象的な要約である。
Abmusuの共有タスクの範囲では、ベトナムのニュース要約のみに焦点を当て、600クラスタで1,839の人手による注釈付きデータセットを構築し、8カテゴリでベトナムのニュースから収集する。
文書要約問題における最も典型的な評価指標である「texttt{ROUGE2-F1}」スコアを評価・ランク付けする。
関連論文リスト
- Overview of the VLSP 2023 -- ComOM Shared Task: A Data Challenge for
Comparative Opinion Mining from Vietnamese Product Reviews [0.6827423171182151]
本稿ではベトナム製品レビュー共有タスク(ComOM)における比較オピニオンマイニングの概要を概観する。
この共有課題の主な目的は、ベトナムの製品レビューから比較意見を引き出す技術を開発することにより、自然言語処理の分野を前進させることである。
非比較文が7427ドル、比較文が2468ドル、文書が1798ドルである。
論文 参考訳(メタデータ) (2024-02-21T08:29:26Z) - Vietnamese multi-document summary using subgraph selection approach --
VLSP 2022 AbMuSu Shared Task [0.0]
文書要約は、文書の流動的で凝縮した要約を生成するタスクである。
本稿では,抽出MDS問題をサブグラフ選択に変換することに焦点を当てる。
VLSP評価キャンペーン2022で発表されたベトナムのデータセットで実験が行われた。
論文 参考訳(メタデータ) (2023-06-26T16:34:02Z) - $\mu$PLAN: Summarizing using a Content Plan as Cross-Lingual Bridge [72.64847925450368]
言語間の要約は、異なる言語で入力文書が与えられた1つの言語で要約を生成することで構成される。
この研究は、中間計画段階を言語横断橋として利用する言語横断要約へのアプローチである$mu$PLANを提示する。
論文 参考訳(メタデータ) (2023-05-23T16:25:21Z) - LBMT team at VLSP2022-Abmusu: Hybrid method with text correlation and
generative models for Vietnamese multi-document summarization [1.4716144941085147]
本稿では,クラスタ類似度に基づくマルチドキュメント要約手法を提案する。
各クラスタから最も重要な文を選択して要約を生成した後、BARTpho と ViT5 を用いて抽象モデルを構築する。
論文 参考訳(メタデータ) (2023-04-11T13:15:24Z) - VideoXum: Cross-modal Visual and Textural Summarization of Videos [67.03643944475712]
我々は新しい共同ビデオとテキスト要約タスクを提案する。
目標は、短縮されたビデオクリップと、長いビデオから対応するテキスト要約の両方を生成することだ。
生成された短縮ビデオクリップとテキストナラティブは、セマンティックに適切に調整されるべきである。
論文 参考訳(メタデータ) (2023-03-21T17:51:23Z) - CREATIVESUMM: Shared Task on Automatic Summarization for Creative
Writing [90.58269243992318]
本稿では,複数の創作分野,すなわち文学テキスト,映画脚本,テレビ脚本を要約する作業について紹介する。
4つのサブタスクとその対応するデータセットを導入し、本、映画脚本、プライムタイムテレビ脚本、昼間のソープオペラ脚本の要約に焦点を当てた。
COING 2022でのCREATIVESUMMワークショップの一環として、共有タスクには合計18の応募が寄せられた。
論文 参考訳(メタデータ) (2022-11-10T21:31:03Z) - VLSP 2021 Shared Task: Vietnamese Machine Reading Comprehension [2.348805691644086]
本稿では,共有タスクの組織化,共有タスク参加者の実施方法の概要,その結果について述べる。
ベトナム語に対する MRC タスクと質問応答システムを評価するためのベンチマークデータセット UIT-ViQuAD 2.0 を提供する。
UIT-ViQuAD 2.0データセットは、ベトナムの機械読解、質問応答、質問生成を研究するためのより多くの研究者を動機付けている。
論文 参考訳(メタデータ) (2022-03-22T00:44:41Z) - MobIE: A German Dataset for Named Entity Recognition, Entity Linking and
Relation Extraction in the Mobility Domain [76.21775236904185]
データセットは3,232のソーシャルメディアテキストと91Kトークンによるトラフィックレポートで構成され、20.5Kアノテーション付きエンティティを含んでいる。
データセットのサブセットには,7つのモビリティ関連,n-ary関係型がアノテートされている。
私たちの知る限りでは、NER、EL、REのアノテーションを組み合わせた最初のドイツ語データセットです。
論文 参考訳(メタデータ) (2021-08-16T08:21:50Z) - Liputan6: A Large-scale Indonesian Dataset for Text Summarization [43.375797352517765]
オンラインニュースポータルであるLiputan6.comから記事を抽出し、215,827のドキュメント-要約ペアを取得する。
事前学習した言語モデルを用いて,データセット上のベンチマーク抽出および抽象的要約手法を開発する。
論文 参考訳(メタデータ) (2020-11-02T02:01:12Z) - From Standard Summarization to New Tasks and Beyond: Summarization with
Manifold Information [77.89755281215079]
テキスト要約は、原文書の短く凝縮した版を作成することを目的とした研究分野である。
現実世界のアプリケーションでは、ほとんどのデータは平易なテキスト形式ではない。
本稿では,現実のアプリケーションにおけるこれらの新しい要約タスクとアプローチについて調査する。
論文 参考訳(メタデータ) (2020-05-10T14:59:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。