論文の概要: A Two-Phase Approach for Abstractive Podcast Summarization
- arxiv url: http://arxiv.org/abs/2011.08291v1
- Date: Mon, 16 Nov 2020 21:31:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-25 00:14:49.493932
- Title: A Two-Phase Approach for Abstractive Podcast Summarization
- Title(参考訳): 抽象ポッドキャスト要約のための2相アプローチ
- Authors: Chujie Zheng, Kunpeng Zhang, Harry Jiannan Wang, Ling Fan
- Abstract要約: ポッドキャストの要約は他のデータフォーマットの要約とは異なる。
文選択とSeq2seq学習という2段階の手法を提案する。
提案手法は,ROUGEに基づく測定と人的評価の両面で有望な結果をもたらす。
- 参考スコア(独自算出の注目度): 18.35061145103997
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Podcast summarization is different from summarization of other data formats,
such as news, patents, and scientific papers in that podcasts are often longer,
conversational, colloquial, and full of sponsorship and advertising
information, which imposes great challenges for existing models. In this paper,
we focus on abstractive podcast summarization and propose a two-phase approach:
sentence selection and seq2seq learning. Specifically, we first select
important sentences from the noisy long podcast transcripts. The selection is
based on sentence similarity to the reference to reduce the redundancy and the
associated latent topics to preserve semantics. Then the selected sentences are
fed into a pre-trained encoder-decoder framework for the summary generation.
Our approach achieves promising results regarding both ROUGE-based measures and
human evaluations.
- Abstract(参考訳): ポッドキャストの要約は、ニュース、特許、科学論文などの他のデータフォーマットの要約とは違い、ポッドキャストは長く、会話的、口語的であり、スポンサーシップや広告情報が多いため、既存のモデルには大きな課題が伴う。
本稿では,要約的ポッドキャスト要約に着目し,文選択とseq2seq学習という2段階のアプローチを提案する。
具体的には、まず、ノイズの多い長いポッドキャストの書き起こしから重要な文を選択する。
この選択は、セマンティクスを保存するために冗長性と関連する潜在トピックを減らすために、参照と文の類似性に基づいている。
そして、選択した文を訓練済みエンコーダデコーダフレームワークに入力して要約生成する。
提案手法は,ROUGEに基づく測定と人的評価の両面で有望な結果をもたらす。
関連論文リスト
- TransVIP: Speech to Speech Translation System with Voice and Isochrony Preservation [97.54885207518946]
カスケード方式で多様なデータセットを活用する新しいモデルフレームワークTransVIPを提案する。
本稿では、話者の音声特性と、翻訳過程における音源音声からの等時性を維持するために、2つの分離エンコーダを提案する。
フランス語と英語のペアに関する実験により、我々のモデルは、現在最先端の音声音声翻訳モデルよりも優れていることを示した。
論文 参考訳(メタデータ) (2024-05-28T04:11:37Z) - Aspect-based Meeting Transcript Summarization: A Two-Stage Approach with
Weak Supervision on Sentence Classification [91.13086984529706]
Aspect-based meeting transcript summarization は複数の要約を生成することを目的としている。
従来の要約手法は、全ての側面の情報を1つの要約で混合する。
アスペクトベースの会議書き起こし要約のための2段階の手法を提案する。
論文 参考訳(メタデータ) (2023-11-07T19:06:31Z) - A Survey on Audio Diffusion Models: Text To Speech Synthesis and
Enhancement in Generative AI [64.71397830291838]
生成AIは様々な分野で印象的な性能を示しており、音声合成は興味深い方向である。
拡散モデルを最も一般的な生成モデルとし、テキストから音声への拡張と音声への拡張という2つのアクティブなタスクを試みている。
本研究は,既存の調査を補完する音声拡散モデルに関する調査を行う。
論文 参考訳(メタデータ) (2023-03-23T15:17:15Z) - Towards Abstractive Grounded Summarization of Podcast Transcripts [33.268079036601634]
ポッドキャストの書き起こしの要約は、コンテンツ提供者と消費者の両方にとって実用的な利益である。
これは、コンシューマーがポッドキャストを聴くかどうかを素早く判断し、要約を書くためのコンテンツプロバイダの負荷を減らすのに役立つ。
しかし、ポッドキャストの要約は、入力に関する事実上の矛盾を含む重大な課題に直面している。
論文 参考訳(メタデータ) (2022-03-22T02:44:39Z) - Topic Modeling on Podcast Short-Text Metadata [0.9539495585692009]
短いテキストのモデリング技術を用いて,ポッドキャストのメタデータやタイトル,記述から関連トピックを発見できる可能性を評価する。
非負行列因子化モデリングフレームワークにおいて、しばしばポッドキャストメタデータに現れる名前付きエンティティ(NE)に対する新しい戦略を提案する。
SpotifyとiTunesとDeezerの既存の2つのデータセットに対する実験により、提案したドキュメント表現であるNEiCEがベースラインの一貫性を改善していることが示された。
論文 参考訳(メタデータ) (2022-01-12T11:07:05Z) - Spotify at TREC 2020: Genre-Aware Abstractive Podcast Summarization [4.456617185465443]
この挑戦の目的は、ポッドキャストエピソードに存在する重要な情報を含む短く有益な要約を生成することでした。
ジャンルと名前付きエンティティを明確に考慮した2つの要約モデルを提案する。
我々のモデルは抽象的であり、創造者が提供する記述を根拠となる真実の要約として利用している。
論文 参考訳(メタデータ) (2021-04-07T18:27:28Z) - Multi-View Sequence-to-Sequence Models with Conversational Structure for
Abstractive Dialogue Summarization [72.54873655114844]
テキスト要約は、NLPにおいて最も困難で興味深い問題の1つである。
本研究では、まず、異なる視点から構造化されていない日々のチャットの会話構造を抽出し、会話を表現するマルチビューシーケンス・ツー・シーケンスモデルを提案する。
大規模対話要約コーパスの実験により,本手法は,自動評価と人的判断の両面から,従来の最先端モデルよりも有意に優れた性能を示した。
論文 参考訳(メタデータ) (2020-10-04T20:12:44Z) - PodSumm -- Podcast Audio Summarization [0.0]
テキストドメインからのガイダンスを用いて,ポッドキャストの要約を自動的に作成する手法を提案する。
このタスクにはデータセットが不足しているため、内部データセットをキュレートし、データ拡張の効果的なスキームを見つけ、アノテータから要約を集めるためのプロトコルを設計する。
本手法は, ROUGE-F(1/2/L) スコア0.63/0.53/0.63をデータセット上で達成する。
論文 参考訳(メタデータ) (2020-09-22T04:49:33Z) - Unsupervised Abstractive Dialogue Summarization for Tete-a-Tetes [49.901984490961624]
テテ-ア-テト(SuTaT)のための非教師なし抽象的対話要約モデルを提案する。
SuTaTは条件付き生成モジュールと2つの教師なし要約モジュールからなる。
実験の結果,SuTaTは自動評価と人的評価の両方において教師なし対話要約よりも優れていることがわかった。
論文 参考訳(メタデータ) (2020-09-15T03:27:52Z) - A Baseline Analysis for Podcast Abstractive Summarization [18.35061145103997]
本稿では,Spotify Podcastデータセットを用いたポッドキャスト要約のベースライン解析について述べる。
研究者が現在の最先端の事前訓練モデルを理解するのを助け、より良いモデルを作るための基盤を構築することを目的としている。
論文 参考訳(メタデータ) (2020-08-24T18:38:42Z) - Abstractive Summarization of Spoken and Written Instructions with BERT [66.14755043607776]
本稿では,BERTSumモデルの最初の対話型言語への応用について述べる。
我々は多種多様な話題にまたがるナレーションビデオの抽象要約を生成する。
我々は、これをインテリジェントな仮想アシスタントの機能として統合し、要求に応じて文字と音声の両方の指導内容の要約を可能にすることを想定する。
論文 参考訳(メタデータ) (2020-08-21T20:59:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。