論文の概要: Automatic Summarization of Open-Domain Podcast Episodes
- arxiv url: http://arxiv.org/abs/2011.04132v2
- Date: Thu, 12 Nov 2020 17:34:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-28 01:01:10.976329
- Title: Automatic Summarization of Open-Domain Podcast Episodes
- Title(参考訳): オープンドメインポッドキャストエピソードの自動要約
- Authors: Kaiqiang Song and Chen Li and Xiaoyang Wang and Dong Yu and Fei Liu
- Abstract要約: 本稿では,TREC 2020 の Podcast Summarization タスクにおいて,競争結果を達成する抽象要約器の実装について述べる。
本システムでは,NIST評価者による1.559の品質評価を達成し,クリエーター記述に対する0.268(+21%)の絶対的な増加を実現した。
- 参考スコア(独自算出の注目度): 33.268079036601634
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present implementation details of our abstractive summarizers that achieve
competitive results on the Podcast Summarization task of TREC 2020. A concise
textual summary that captures important information is crucial for users to
decide whether to listen to the podcast. Prior work focuses primarily on
learning contextualized representations. Instead, we investigate several
less-studied aspects of neural abstractive summarization, including (i) the
importance of selecting important segments from transcripts to serve as input
to the summarizer; (ii) striking a balance between the amount and quality of
training instances; (iii) the appropriate summary length and start/end points.
We highlight the design considerations behind our system and offer key insights
into the strengths and weaknesses of neural abstractive systems. Our results
suggest that identifying important segments from transcripts to use as input to
an abstractive summarizer is advantageous for summarizing long documents. Our
best system achieves a quality rating of 1.559 judged by NIST evaluators---an
absolute increase of 0.268 (+21%) over the creator descriptions.
- Abstract(参考訳): 本稿では,TREC 2020 の Podcast Summarization タスクにおいて,競争結果を達成する抽象要約器の実装について述べる。
重要な情報をキャプチャする簡潔なテキスト要約は、ユーザがポッドキャストを聴くかどうかを判断することが重要である。
先行研究は主に文脈化された表現の学習に焦点を当てている。
代わりに、神経抽象的要約のいくつかの未研究の側面について検討する。
(i)要約者への入力として機能する写本から重要セグメントを選択することの重要性
二 訓練インスタンスの量と品質のバランスをとること。
(iii)適切な要約長と開始/終了ポイント。
システムの背後にある設計上の考慮点を強調し、ニューラル抽象システムの強みと弱みに関する重要な洞察を提供する。
以上の結果から,テキストから要約文への入力として使用する重要なセグメントを識別することは,長い文書の要約に有利であることが示唆された。
本システムでは,NIST評価者による1.559の品質評価を達成し,クリエーター記述に対する0.268(+21%)の絶対的な増加を実現した。
関連論文リスト
- SummIt: Iterative Text Summarization via ChatGPT [12.966825834765814]
本稿では,ChatGPTのような大規模言語モデルに基づく反復的なテキスト要約フレームワークSummItを提案する。
我々のフレームワークは、自己評価とフィードバックによって生成された要約を反復的に洗練することを可能にする。
また, 繰り返し改良の有効性を検証し, 過補正の潜在的な問題を特定するために, 人間の評価を行う。
論文 参考訳(メタデータ) (2023-05-24T07:40:06Z) - Salience Allocation as Guidance for Abstractive Summarization [61.31826412150143]
本稿では, サリエンセ・サリエンス・ガイダンス(SEASON, SaliencE Allocation as Guidance for Abstractive SummarizatiON)を用いた新しい要約手法を提案する。
SEASONは、サリエンス予測の割り当てを利用して抽象的な要約を導き、異なる抽象性のある記事に順応する。
論文 参考訳(メタデータ) (2022-10-22T02:13:44Z) - Podcast Summary Assessment: A Resource for Evaluating Summary Assessment
Methods [42.08097583183816]
本稿では,新たなデータセット,ポッドキャスト要約評価コーパスについて述べる。
このデータセットには、2つのユニークな側面がある: (i)ロングインプット、音声ポッドキャストベース、文書; (ii)ポッドキャストコーパスにおける不適切な参照要約を検出する機会。
論文 参考訳(メタデータ) (2022-08-28T18:24:41Z) - Towards Abstractive Grounded Summarization of Podcast Transcripts [33.268079036601634]
ポッドキャストの書き起こしの要約は、コンテンツ提供者と消費者の両方にとって実用的な利益である。
これは、コンシューマーがポッドキャストを聴くかどうかを素早く判断し、要約を書くためのコンテンツプロバイダの負荷を減らすのに役立つ。
しかし、ポッドキャストの要約は、入力に関する事実上の矛盾を含む重大な課題に直面している。
論文 参考訳(メタデータ) (2022-03-22T02:44:39Z) - Learning Opinion Summarizers by Selecting Informative Reviews [81.47506952645564]
31,000以上の製品のユーザレビューと組み合わせた大規模な要約データセットを収集し、教師付きトレーニングを可能にします。
多くのレビューの内容は、人間が書いた要約には反映されず、したがってランダムなレビューサブセットで訓練された要約者は幻覚する。
我々は、これらのサブセットで表現された意見を要約し、レビューの情報的サブセットを選択するための共同学習としてタスクを定式化する。
論文 参考訳(メタデータ) (2021-09-09T15:01:43Z) - Controllable Abstractive Dialogue Summarization with Sketch Supervision [56.59357883827276]
本モデルは,最大50.79のROUGE-Lスコアを持つ最大対話要約コーパスSAMSumの最先端性能を実現する。
論文 参考訳(メタデータ) (2021-05-28T19:05:36Z) - What Makes a Good Summary? Reconsidering the Focus of Automatic
Summarization [49.600619575148706]
フィールドの現在の焦点は、参加者の希望と完全に一致していないことがわかります。
以上の結果から,自動要約のより広い視点を取り入れることが重要であると論じる。
論文 参考訳(メタデータ) (2020-12-14T15:12:35Z) - Screenplay Summarization Using Latent Narrative Structure [78.45316339164133]
本稿では,物語の基盤となる構造を一般教師なし・教師付き抽出要約モデルに明示的に組み込むことを提案する。
重要な物語イベント(転回点)の観点で物語構造を定式化し、脚本を要約するために潜伏状態として扱う。
シーンレベルの要約ラベルを付加したテレビ画面のCSIコーパスの実験結果から,潜角点がCSIエピソードの重要な側面と相関していることが判明した。
論文 参考訳(メタデータ) (2020-04-27T11:54:19Z) - Salience Estimation with Multi-Attention Learning for Abstractive Text
Summarization [86.45110800123216]
テキスト要約のタスクでは、単語、フレーズ、文のサリエンス推定が重要な要素である。
本稿では,サラレンス推定のための2つの新しい注目学習要素を含むマルチアテンション学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-04-07T02:38:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。