論文の概要: Towards Abstractive Grounded Summarization of Podcast Transcripts
- arxiv url: http://arxiv.org/abs/2203.11425v1
- Date: Tue, 22 Mar 2022 02:44:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-23 12:41:34.617929
- Title: Towards Abstractive Grounded Summarization of Podcast Transcripts
- Title(参考訳): ポッドキャスト原稿の要約的要約に向けて
- Authors: Kaiqiang Song, Chen Li, Xiaoyang Wang, Dong Yu, Fei Liu
- Abstract要約: ポッドキャストの書き起こしの要約は、コンテンツ提供者と消費者の両方にとって実用的な利益である。
これは、コンシューマーがポッドキャストを聴くかどうかを素早く判断し、要約を書くためのコンテンツプロバイダの負荷を減らすのに役立つ。
しかし、ポッドキャストの要約は、入力に関する事実上の矛盾を含む重大な課題に直面している。
- 参考スコア(独自算出の注目度): 33.268079036601634
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Podcasts have recently shown a rapid rise in popularity. Summarization of
podcast transcripts is of practical benefit to both content providers and
consumers. It helps consumers to quickly decide whether they will listen to the
podcasts and reduces the cognitive load of content providers to write
summaries. Nevertheless, podcast summarization faces significant challenges
including factual inconsistencies with respect to the inputs. The problem is
exacerbated by speech disfluencies and recognition errors in transcripts of
spoken language. In this paper, we explore a novel abstractive summarization
method to alleviate these challenges. Specifically, our approach learns to
produce an abstractive summary while grounding summary segments in specific
portions of the transcript to allow for full inspection of summary details. We
conduct a series of analyses of the proposed approach on a large podcast
dataset and show that the approach can achieve promising results. Grounded
summaries bring clear benefits in locating the summary and transcript segments
that contain inconsistent information, and hence significantly improve
summarization quality in both automatic and human evaluation metrics.
- Abstract(参考訳): ポッドキャストは、最近急速に人気が高まっている。
ポッドキャストの書き起こしの要約は、コンテンツ提供者と消費者の両方にとって実用的な利益である。
消費者がポッドキャストを聴くかどうかを素早く判断し、要約を書くためのコンテンツ提供者の認知的負荷を減らすのに役立つ。
それでもポッドキャストの要約は、入力に関する事実上の矛盾を含む重大な課題に直面している。
この問題は、音声言語の文字起こしにおける音声の拡散と認識誤りによって悪化する。
本稿では,これらの課題を解決するために,抽象的な要約手法を提案する。
具体的には,要約文の特定部分に要約文を接地しながら要約文を生成することで,要約文の完全検査を可能にする。
本研究では,大規模ポッドキャストデータセット上で提案手法の一連の分析を行い,提案手法が有望な結果が得られることを示す。
グラウンデッドサマリーは、一貫性のない情報を含む要約と転写セグメントの特定において明らかな利点をもたらし、その結果、自動評価指標と人的評価指標の両方において、要約品質を著しく向上させる。
関連論文リスト
- Speech vs. Transcript: Does It Matter for Human Annotators in Speech Summarization? [35.71047777304832]
録音を聴くアノテータに基づく要約は、アノテータが書き起こしを読むものとは異なるかを検討する。
音声に基づく要約は、転写文に基づく要約よりも、現実的に一貫性があり、情報選択的であることが判明した。
論文 参考訳(メタデータ) (2024-08-12T13:25:53Z) - Factually Consistent Summarization via Reinforcement Learning with
Textual Entailment Feedback [57.816210168909286]
我々は,この問題を抽象的な要約システムで解くために,テキストエンテーメントモデルの最近の進歩を活用している。
我々は、事実整合性を最適化するために、レファレンスフリーのテキストエンターメント報酬を用いた強化学習を用いる。
自動測定と人的評価の両結果から,提案手法は生成した要約の忠実さ,サリエンス,簡潔さを著しく向上させることが示された。
論文 参考訳(メタデータ) (2023-05-31T21:04:04Z) - Salience Allocation as Guidance for Abstractive Summarization [61.31826412150143]
本稿では, サリエンセ・サリエンス・ガイダンス(SEASON, SaliencE Allocation as Guidance for Abstractive SummarizatiON)を用いた新しい要約手法を提案する。
SEASONは、サリエンス予測の割り当てを利用して抽象的な要約を導き、異なる抽象性のある記事に順応する。
論文 参考訳(メタデータ) (2022-10-22T02:13:44Z) - StreamHover: Livestream Transcript Summarization and Annotation [54.41877742041611]
ライブストリームの書き起こしを注釈付けして要約するフレームワークであるStreamHoverを紹介します。
合計500時間以上のビデオに抽出的要約と抽象的要約を併用したベンチマークデータセットは,既存の注釈付きコーパスよりもはるかに大きい。
我々のモデルはより一般化され、強力なベースラインよりも性能が向上することを示す。
論文 参考訳(メタデータ) (2021-09-11T02:19:37Z) - Learning Opinion Summarizers by Selecting Informative Reviews [81.47506952645564]
31,000以上の製品のユーザレビューと組み合わせた大規模な要約データセットを収集し、教師付きトレーニングを可能にします。
多くのレビューの内容は、人間が書いた要約には反映されず、したがってランダムなレビューサブセットで訓練された要約者は幻覚する。
我々は、これらのサブセットで表現された意見を要約し、レビューの情報的サブセットを選択するための共同学習としてタスクを定式化する。
論文 参考訳(メタデータ) (2021-09-09T15:01:43Z) - Extractive Summarization of Call Transcripts [77.96603959765577]
本稿では, 話題のモデル化と文選択と句読点の復元を併用した母語的手法を提案する。
大規模なテスト,評価,比較により,この要約法の有効性が証明された。
論文 参考訳(メタデータ) (2021-03-19T02:40:59Z) - Detecting Extraneous Content in Podcasts [6.335863593761816]
本稿では,ポッドキャスト記述と音声書き起こしの不要なコンテンツを検出するために,テキストパターンとリスニングパターンの両方を利用するモデルを提案する。
本モデルでは,ROUGEスコアを瞬時に改善し,要約で生成された外部コンテンツを減らすことができることを示す。
論文 参考訳(メタデータ) (2021-03-03T18:30:50Z) - A Two-Phase Approach for Abstractive Podcast Summarization [18.35061145103997]
ポッドキャストの要約は他のデータフォーマットの要約とは異なる。
文選択とSeq2seq学習という2段階の手法を提案する。
提案手法は,ROUGEに基づく測定と人的評価の両面で有望な結果をもたらす。
論文 参考訳(メタデータ) (2020-11-16T21:31:28Z) - Automatic Summarization of Open-Domain Podcast Episodes [33.268079036601634]
本稿では,TREC 2020 の Podcast Summarization タスクにおいて,競争結果を達成する抽象要約器の実装について述べる。
本システムでは,NIST評価者による1.559の品質評価を達成し,クリエーター記述に対する0.268(+21%)の絶対的な増加を実現した。
論文 参考訳(メタデータ) (2020-11-09T01:31:05Z) - PodSumm -- Podcast Audio Summarization [0.0]
テキストドメインからのガイダンスを用いて,ポッドキャストの要約を自動的に作成する手法を提案する。
このタスクにはデータセットが不足しているため、内部データセットをキュレートし、データ拡張の効果的なスキームを見つけ、アノテータから要約を集めるためのプロトコルを設計する。
本手法は, ROUGE-F(1/2/L) スコア0.63/0.53/0.63をデータセット上で達成する。
論文 参考訳(メタデータ) (2020-09-22T04:49:33Z) - Unsupervised Opinion Summarization with Noising and Denoising [85.49169453434554]
ユーザレビューのコーパスから合成データセットを作成し、レビューをサンプリングし、要約のふりをして、ノイズのあるバージョンを生成します。
テスト時に、モデルは本物のレビューを受け入れ、健全な意見を含む要約を生成し、合意に達しないものをノイズとして扱います。
論文 参考訳(メタデータ) (2020-04-21T16:54:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。