論文の概要: How Domain Terminology Affects Meeting Summarization Performance
- arxiv url: http://arxiv.org/abs/2011.00692v2
- Date: Mon, 9 Nov 2020 01:34:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-30 11:47:57.114613
- Title: How Domain Terminology Affects Meeting Summarization Performance
- Title(参考訳): ドメイン用語がミーティングの要約性能にどのように影響するか
- Authors: Jia Jin Koay and Alexander Roustai and Xiaojin Dai and Dillon Burns
and Alec Kerrigan and Fei Liu
- Abstract要約: 我々は、巨大ミーティングコーパス上で、ドメイン用語のゴールドスタンダードアノテーションを作成します。
本稿では,会議要約システムの性能を,用語の活用の有無で分析する。
- 参考スコア(独自算出の注目度): 61.12624289478716
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Meetings are essential to modern organizations. Numerous meetings are held
and recorded daily, more than can ever be comprehended. A meeting summarization
system that identifies salient utterances from the transcripts to automatically
generate meeting minutes can help. It empowers users to rapidly search and sift
through large meeting collections. To date, the impact of domain terminology on
the performance of meeting summarization remains understudied, despite that
meetings are rich with domain knowledge. In this paper, we create gold-standard
annotations for domain terminology on a sizable meeting corpus; they are known
as jargon terms. We then analyze the performance of a meeting summarization
system with and without jargon terms. Our findings reveal that domain
terminology can have a substantial impact on summarization performance. We
publicly release all domain terminology to advance research in meeting
summarization.
- Abstract(参考訳): 現代の組織には会議が不可欠です。
多くの会議が開催され、毎日記録されている。
原稿から有能な発話を識別し、会議時間を自動生成する会議要約システムに役立てることができる。
ユーザーは大規模なミーティングのコレクションを素早く検索して共有できる。
これまでのところ、会議はドメイン知識に富んでいるにもかかわらず、ドメイン用語が会議要約のパフォーマンスに与える影響は検討されていない。
本稿では,大規模なミーティングコーパス上に,ドメイン用語のためのゴールド標準アノテーションを作成し,それをジャーゴン用語と呼ぶ。
次に,会議要約システムの性能を,ジャーゴン用語と無関係に解析する。
以上の結果から,ドメイン用語は要約性能に大きな影響を与えることが判明した。
要約を満たす研究を進めるために、すべてのドメイン用語を公開します。
関連論文リスト
- Investigating Consistency in Query-Based Meeting Summarization: A
Comparative Study of Different Embedding Methods [0.0]
テキスト要約は自然言語処理(NLP)分野における有名な応用の1つである。
与えられたコンテキストに基づいて重要な情報による要約を自動的に生成することを目的としている。
本稿では,Microsoft が提案した "QMSum: A New Benchmark for Query-based Multi-domain Meeting Summarization" に着想を得た。
また,提案するLocaterモデルを用いて,与えられたテキストとクエリに基づいて関連するスパンを抽出し,それをSummarizerモデルで要約する。
論文 参考訳(メタデータ) (2024-02-10T08:25:30Z) - Improving Query-Focused Meeting Summarization with Query-Relevant
Knowledge [71.14873115781366]
本稿では,その課題に対処するため,知識認識要約器(KAS)と呼ばれる知識強化2段階のフレームワークを提案する。
最初の段階では、クエリ関連セグメント抽出を改善するために知識認識スコアを導入します。
第2段階では,クエリ関連知識を要約生成に取り入れる。
論文 参考訳(メタデータ) (2023-09-05T10:26:02Z) - Summaries, Highlights, and Action items: Design, implementation and evaluation of an LLM-powered meeting recap system [30.35387091657807]
対話要約のための大規模言語モデル(LLM)は、ミーティングの体験を改善する可能性がある。
この可能性にもかかわらず、長い書き起こしと、ユーザのコンテキストに基づいて多様なリキャップニーズをキャプチャできないため、技術的な制限に直面している。
本研究では,対話要約による表現をビルディングブロックとして運用するシステムを開発した。
論文 参考訳(メタデータ) (2023-07-28T20:25:11Z) - MeetingBank: A Benchmark Dataset for Meeting Summarization [37.761684754365945]
本稿では,過去10年間の市議会会議のベンチマークデータセットであるMacheeBankを紹介する。
我々は,会議ビデオリンク,テキスト,参照要約,アジェンダ,その他のメタデータなどのコレクションを作成し,より優れた会議要約技術の開発を容易にする。
論文 参考訳(メタデータ) (2023-05-27T17:09:25Z) - MUG: A General Meeting Understanding and Generation Benchmark [60.09540662936726]
我々はAliMeeting4MUG Corpusを構築した。
本稿では,このコーパスの詳細な紹介,SLPタスクと評価方法,ベースラインシステムとその性能について述べる。
論文 参考訳(メタデータ) (2023-03-24T11:52:25Z) - Overview of the ICASSP 2023 General Meeting Understanding and Generation
Challenge (MUG) [60.09540662936726]
MUGには、トピックセグメンテーション、トピックレベルおよびセッションレベルの抽出要約、トピックタイトル生成、キーフレーズ抽出、アクションアイテム検出の5つのトラックが含まれている。
MUGを容易にするために,大規模なミーティングデータセットであるAliMeeting4MUG Corpusを構築し,リリースする。
論文 参考訳(メタデータ) (2023-03-24T11:42:19Z) - A Sliding-Window Approach to Automatic Creation of Meeting Minutes [66.39584679676817]
会議の議事録には、議論された問題、決定、会議での行動が記録されている。
会議時間の自動生成のためのスライディングウインドウ手法を提案する。
長い写本や文書構造の欠如など、発話テキストの性質に関連する問題に取り組むことを目指しています。
論文 参考訳(メタデータ) (2021-04-26T02:44:14Z) - QMSum: A New Benchmark for Query-based Multi-domain Meeting
Summarization [45.83402681068943]
QMSumは、複数のドメインで232のミーティングで1,808のクエリサマリーペアで構成されている。
find-then-summarizeメソッドを調査し、タスクに関する強力な要約ベースラインのセットを評価します。
論文 参考訳(メタデータ) (2021-04-13T05:00:35Z) - A Hierarchical Network for Abstractive Meeting Summarization with
Cross-Domain Pretraining [52.11221075687124]
本稿では,会議シナリオに適応する抽象的要約ネットワークを提案する。
提案手法は,長時間の会議記録に対応する階層構造と,話者間の差異を表現する役割ベクトルを設計する。
我々のモデルは、自動測定と人的評価の両方において、過去のアプローチよりも優れています。
論文 参考訳(メタデータ) (2020-04-04T21:00:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。