論文の概要: Overview of the VLSP 2022 -- Abmusu Shared Task: A Data Challenge for
Vietnamese Abstractive Multi-document Summarization
- arxiv url: http://arxiv.org/abs/2311.15525v1
- Date: Mon, 27 Nov 2023 04:01:13 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-28 17:17:30.617836
- Title: Overview of the VLSP 2022 -- Abmusu Shared Task: A Data Challenge for
Vietnamese Abstractive Multi-document Summarization
- Title(参考訳): VLSP 2022 -- Abmusu Shared Task: A data Challenge for Vietnam Abstractive Multi-document Summarization
- Authors: Mai-Vu Tran, Hoang-Quynh Le, Duy-Cat Can, Quoc-An Nguyen
- Abstract要約: Abmusuの共有タスクの目的は、トピック上の文書の集合に対して抽象的な要約を自動的に作成できる要約システムを開発することである。
ベトナムのニュースから収集した1,839の文書を600のクラスタにまとめた人手によるデータセットを8つのカテゴリに分けて構築する。
モデルは、文書要約問題の最も典型的な評価指標であるtexttROUGE2-F1 スコアで評価され、ランク付けされる。
- 参考スコア(独自算出の注目度): 0.6827423171182151
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper reports the overview of the VLSP 2022 - Vietnamese abstractive
multi-document summarization (Abmusu) shared task for Vietnamese News. This
task is hosted at the 9$^{th}$ annual workshop on Vietnamese Language and
Speech Processing (VLSP 2022). The goal of Abmusu shared task is to develop
summarization systems that could create abstractive summaries automatically for
a set of documents on a topic. The model input is multiple news documents on
the same topic, and the corresponding output is a related abstractive summary.
In the scope of Abmusu shared task, we only focus on Vietnamese news
summarization and build a human-annotated dataset of 1,839 documents in 600
clusters, collected from Vietnamese news in 8 categories. Participated models
are evaluated and ranked in terms of \texttt{ROUGE2-F1} score, the most typical
evaluation metric for document summarization problem.
- Abstract(参考訳): 本稿ではベトナムニュースにおけるVLSP 2022-ベトナムの抽象的多文書要約(Abmusu)の概要を報告する。
この仕事はベトナム語と音声処理に関する9$^{th}$年次ワークショップ(vlsp 2022)で開催されている。
Abmusuの共有タスクの目的は、トピック上の文書の集合に対して抽象的な要約を自動的に作成できる要約システムを開発することである。
モデル入力は同じトピック上の複数のニュースドキュメントであり、対応する出力は関連する抽象的な要約である。
Abmusuの共有タスクの範囲では、ベトナムのニュース要約のみに焦点を当て、600クラスタで1,839の人手による注釈付きデータセットを構築し、8カテゴリでベトナムのニュースから収集する。
文書要約問題における最も典型的な評価指標である「texttt{ROUGE2-F1}」スコアを評価・ランク付けする。
関連論文リスト
- Write Summary Step-by-Step: A Pilot Study of Stepwise Summarization [48.57273563299046]
本稿では,新たな文書が提案されるたびに追加の要約を生成するステップワイド要約の課題を提案する。
追加された要約は、新たに追加されたコンテンツを要約するだけでなく、以前の要約と一貫性を持たなければならない。
SSGは,自動計測と人的評価の両面から,最先端のパフォーマンスを実現していることを示す。
論文 参考訳(メタデータ) (2024-06-08T05:37:26Z) - Narrative Action Evaluation with Prompt-Guided Multimodal Interaction [60.281405999483]
ナラティブ・アクション・アセスメント(NAE)は、行動の実行を評価する専門家のコメントを作成することを目的としている。
NAEは、物語の柔軟性と評価の厳格さの両方を必要とするため、より困難なタスクです。
本稿では,様々な情報モダリティ間のインタラクションを容易にするための,プロンプト誘導型マルチモーダルインタラクションフレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-22T17:55:07Z) - Overview of the VLSP 2023 -- ComOM Shared Task: A Data Challenge for
Comparative Opinion Mining from Vietnamese Product Reviews [0.6827423171182151]
本稿ではベトナム製品レビュー共有タスク(ComOM)における比較オピニオンマイニングの概要を概観する。
この共有課題の主な目的は、ベトナムの製品レビューから比較意見を引き出す技術を開発することにより、自然言語処理の分野を前進させることである。
非比較文が7427ドル、比較文が2468ドル、文書が1798ドルである。
論文 参考訳(メタデータ) (2024-02-21T08:29:26Z) - On Context Utilization in Summarization with Large Language Models [83.84459732796302]
大きな言語モデル(LLM)は抽象的な要約タスクに優れ、流動的で関連する要約を提供する。
最近の進歩は、100kトークンを超える長期入力コンテキストを扱う能力を拡張している。
要約における文脈利用と位置バイアスに関する最初の総合的研究を行う。
論文 参考訳(メタデータ) (2023-10-16T16:45:12Z) - DeVAn: Dense Video Annotation for Video-Language Models [68.70692422636313]
実世界のビデオクリップに記述を生成する視覚言語モデルの有効性を評価するために,人間の注釈付きデータセットを提案する。
データセットには、20秒から60秒間の8.5KのYouTubeビデオクリップが含まれており、幅広いトピックや関心事をカバーしている。
論文 参考訳(メタデータ) (2023-10-08T08:02:43Z) - Vietnamese multi-document summary using subgraph selection approach --
VLSP 2022 AbMuSu Shared Task [0.0]
文書要約は、文書の流動的で凝縮した要約を生成するタスクである。
本稿では,抽出MDS問題をサブグラフ選択に変換することに焦点を当てる。
VLSP評価キャンペーン2022で発表されたベトナムのデータセットで実験が行われた。
論文 参考訳(メタデータ) (2023-06-26T16:34:02Z) - LBMT team at VLSP2022-Abmusu: Hybrid method with text correlation and
generative models for Vietnamese multi-document summarization [1.4716144941085147]
本稿では,クラスタ類似度に基づくマルチドキュメント要約手法を提案する。
各クラスタから最も重要な文を選択して要約を生成した後、BARTpho と ViT5 を用いて抽象モデルを構築する。
論文 参考訳(メタデータ) (2023-04-11T13:15:24Z) - VideoXum: Cross-modal Visual and Textural Summarization of Videos [54.0985975755278]
我々は新しい共同ビデオとテキスト要約タスクを提案する。
目標は、短縮されたビデオクリップと、長いビデオから対応するテキスト要約の両方を生成することだ。
生成された短縮ビデオクリップとテキストナラティブは、セマンティックに適切に調整されるべきである。
論文 参考訳(メタデータ) (2023-03-21T17:51:23Z) - CREATIVESUMM: Shared Task on Automatic Summarization for Creative
Writing [90.58269243992318]
本稿では,複数の創作分野,すなわち文学テキスト,映画脚本,テレビ脚本を要約する作業について紹介する。
4つのサブタスクとその対応するデータセットを導入し、本、映画脚本、プライムタイムテレビ脚本、昼間のソープオペラ脚本の要約に焦点を当てた。
COING 2022でのCREATIVESUMMワークショップの一環として、共有タスクには合計18の応募が寄せられた。
論文 参考訳(メタデータ) (2022-11-10T21:31:03Z) - VLSP 2021 Shared Task: Vietnamese Machine Reading Comprehension [2.348805691644086]
本稿では,共有タスクの組織化,共有タスク参加者の実施方法の概要,その結果について述べる。
ベトナム語に対する MRC タスクと質問応答システムを評価するためのベンチマークデータセット UIT-ViQuAD 2.0 を提供する。
UIT-ViQuAD 2.0データセットは、ベトナムの機械読解、質問応答、質問生成を研究するためのより多くの研究者を動機付けている。
論文 参考訳(メタデータ) (2022-03-22T00:44:41Z) - Liputan6: A Large-scale Indonesian Dataset for Text Summarization [43.375797352517765]
オンラインニュースポータルであるLiputan6.comから記事を抽出し、215,827のドキュメント-要約ペアを取得する。
事前学習した言語モデルを用いて,データセット上のベンチマーク抽出および抽象的要約手法を開発する。
論文 参考訳(メタデータ) (2020-11-02T02:01:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。