論文の概要: MeetingBank: A Benchmark Dataset for Meeting Summarization
- arxiv url: http://arxiv.org/abs/2305.17529v1
- Date: Sat, 27 May 2023 17:09:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-30 18:38:50.952292
- Title: MeetingBank: A Benchmark Dataset for Meeting Summarization
- Title(参考訳): MeetingBank: 要約のためのベンチマークデータセット
- Authors: Yebowen Hu and Tim Ganter and Hanieh Deilamsalehy and Franck
Dernoncourt and Hassan Foroosh and Fei Liu
- Abstract要約: 本稿では,過去10年間の市議会会議のベンチマークデータセットであるMacheeBankを紹介する。
我々は,会議ビデオリンク,テキスト,参照要約,アジェンダ,その他のメタデータなどのコレクションを作成し,より優れた会議要約技術の開発を容易にする。
- 参考スコア(独自算出の注目度): 37.761684754365945
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As the number of recorded meetings increases, it becomes increasingly
important to utilize summarization technology to create useful summaries of
these recordings. However, there is a crucial lack of annotated meeting corpora
for developing this technology, as it can be hard to collect meetings,
especially when the topics discussed are confidential. Furthermore, meeting
summaries written by experienced writers are scarce, making it hard for
abstractive summarizers to produce sensible output without a reliable
reference. This lack of annotated corpora has hindered the development of
meeting summarization technology. In this paper, we present MeetingBank, a new
benchmark dataset of city council meetings over the past decade. MeetingBank is
unique among other meeting corpora due to its divide-and-conquer approach,
which involves dividing professionally written meeting minutes into shorter
passages and aligning them with specific segments of the meeting. This breaks
down the process of summarizing a lengthy meeting into smaller, more manageable
tasks. The dataset provides a new testbed of various meeting summarization
systems and also allows the public to gain insight into how council decisions
are made. We make the collection, including meeting video links, transcripts,
reference summaries, agenda, and other metadata, publicly available to
facilitate the development of better meeting summarization techniques. Our
dataset can be accessed at: https://meetingbank.github.io
- Abstract(参考訳): 記録された会議の数が増えるにつれて、これらの記録の有用な要約を作成するために要約技術を活用することがますます重要になる。
しかし,この技術を開発する上では,特にトピックが非公開である場合に,ミーティングの収集が困難になるため,注釈付きミーティングコーパスが欠落している。
さらに、経験豊富な作家による要約は乏しいため、抽象的な要約者が信頼できる参照を伴わずに合理的なアウトプットを生成することは困難である。
この注釈付きコーパスの欠如は、ミーティング要約技術の開発を妨げている。
本稿では,過去10年間の市政委員会会議のベンチマークデータセットである meetingbank について述べる。
ミーティングバンクは他のミーティングコーパスの中で、専門的に書かれたミーティング分を短いパスに分割し、ミーティングの特定のセグメントにまとめる、というアプローチでユニークなものです。
これは、長いミーティングをもっと小さく、より管理しやすいタスクにまとめるプロセスを壊します。
データセットは、様々なミーティングの要約システムの新しいテストベッドを提供し、また、一般大衆が理事会の決定がどのように行われるかについての洞察を得ることを可能にする。
我々は,会議ビデオリンク,テキスト,参照要約,アジェンダ,その他のメタデータなどのコレクションを作成し,より優れた会議要約技術の開発を容易にする。
私たちのデータセットは、https://meetingbank.github.ioでアクセスできます。
関連論文リスト
- Investigating Consistency in Query-Based Meeting Summarization: A
Comparative Study of Different Embedding Methods [0.0]
テキスト要約は自然言語処理(NLP)分野における有名な応用の1つである。
与えられたコンテキストに基づいて重要な情報による要約を自動的に生成することを目的としている。
本稿では,Microsoft が提案した "QMSum: A New Benchmark for Query-based Multi-domain Meeting Summarization" に着想を得た。
また,提案するLocaterモデルを用いて,与えられたテキストとクエリに基づいて関連するスパンを抽出し,それをSummarizerモデルで要約する。
論文 参考訳(メタデータ) (2024-02-10T08:25:30Z) - Aspect-based Meeting Transcript Summarization: A Two-Stage Approach with
Weak Supervision on Sentence Classification [91.13086984529706]
Aspect-based meeting transcript summarization は複数の要約を生成することを目的としている。
従来の要約手法は、全ての側面の情報を1つの要約で混合する。
アスペクトベースの会議書き起こし要約のための2段階の手法を提案する。
論文 参考訳(メタデータ) (2023-11-07T19:06:31Z) - Summaries, Highlights, and Action items: Design, implementation and evaluation of an LLM-powered meeting recap system [30.35387091657807]
対話要約のための大規模言語モデル(LLM)は、ミーティングの体験を改善する可能性がある。
この可能性にもかかわらず、長い書き起こしと、ユーザのコンテキストに基づいて多様なリキャップニーズをキャプチャできないため、技術的な制限に直面している。
本研究では,対話要約による表現をビルディングブロックとして運用するシステムを開発した。
論文 参考訳(メタデータ) (2023-07-28T20:25:11Z) - Meeting Summarization: A Survey of the State of the Art [0.0]
仮想通信プラットフォームの台頭により,対話データの過剰が生じる。
Covid-19の台頭は、Zoom、Slack、Microsoft Teams、Discordなどのオンラインコミュニケーションプラットフォームを企業ミーティングに頼りにしている。
会議要約の分野では総合的な調査が欠如している。
論文 参考訳(メタデータ) (2022-12-16T00:21:30Z) - A Sliding-Window Approach to Automatic Creation of Meeting Minutes [66.39584679676817]
会議の議事録には、議論された問題、決定、会議での行動が記録されている。
会議時間の自動生成のためのスライディングウインドウ手法を提案する。
長い写本や文書構造の欠如など、発話テキストの性質に関連する問題に取り組むことを目指しています。
論文 参考訳(メタデータ) (2021-04-26T02:44:14Z) - QMSum: A New Benchmark for Query-based Multi-domain Meeting
Summarization [45.83402681068943]
QMSumは、複数のドメインで232のミーティングで1,808のクエリサマリーペアで構成されている。
find-then-summarizeメソッドを調査し、タスクに関する強力な要約ベースラインのセットを評価します。
論文 参考訳(メタデータ) (2021-04-13T05:00:35Z) - How Domain Terminology Affects Meeting Summarization Performance [61.12624289478716]
我々は、巨大ミーティングコーパス上で、ドメイン用語のゴールドスタンダードアノテーションを作成します。
本稿では,会議要約システムの性能を,用語の活用の有無で分析する。
論文 参考訳(メタデータ) (2020-11-02T02:33:59Z) - A Hierarchical Network for Abstractive Meeting Summarization with
Cross-Domain Pretraining [52.11221075687124]
本稿では,会議シナリオに適応する抽象的要約ネットワークを提案する。
提案手法は,長時間の会議記録に対応する階層構造と,話者間の差異を表現する役割ベクトルを設計する。
我々のモデルは、自動測定と人的評価の両方において、過去のアプローチよりも優れています。
論文 参考訳(メタデータ) (2020-04-04T21:00:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。