論文の概要: StreamHover: Livestream Transcript Summarization and Annotation
- arxiv url: http://arxiv.org/abs/2109.05160v1
- Date: Sat, 11 Sep 2021 02:19:37 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-14 15:51:13.358026
- Title: StreamHover: Livestream Transcript Summarization and Annotation
- Title(参考訳): streamhover: ライブストリームの書き起こし要約とアノテーション
- Authors: Sangwoo Cho and Franck Dernoncourt and Tim Ganter and Trung Bui and
Nedim Lipka and Walter Chang and Hailin Jin and Jonathan Brandt and Hassan
Foroosh and Fei Liu
- Abstract要約: ライブストリームの書き起こしを注釈付けして要約するフレームワークであるStreamHoverを紹介します。
合計500時間以上のビデオに抽出的要約と抽象的要約を併用したベンチマークデータセットは,既存の注釈付きコーパスよりもはるかに大きい。
我々のモデルはより一般化され、強力なベースラインよりも性能が向上することを示す。
- 参考スコア(独自算出の注目度): 54.41877742041611
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the explosive growth of livestream broadcasting, there is an urgent need
for new summarization technology that enables us to create a preview of
streamed content and tap into this wealth of knowledge. However, the problem is
nontrivial due to the informal nature of spoken language. Further, there has
been a shortage of annotated datasets that are necessary for transcript
summarization. In this paper, we present StreamHover, a framework for
annotating and summarizing livestream transcripts. With a total of over 500
hours of videos annotated with both extractive and abstractive summaries, our
benchmark dataset is significantly larger than currently existing annotated
corpora. We explore a neural extractive summarization model that leverages
vector-quantized variational autoencoder to learn latent vector representations
of spoken utterances and identify salient utterances from the transcripts to
form summaries. We show that our model generalizes better and improves
performance over strong baselines. The results of this study provide an avenue
for future research to improve summarization solutions for efficient browsing
of livestreams.
- Abstract(参考訳): ライブストリーム放送の爆発的な成長に伴い、ストリーミングコンテンツのプレビューを作成し、この豊富な知識を活用できる新しい要約技術が緊急に必要となる。
しかし、音声言語の非公式な性質のため、この問題は自明ではない。
さらに、書き起こし要約に必要な注釈付きデータセットが不足している。
本稿では,ライブストリームの書き起こしを注釈・要約するフレームワークstreamhoverを提案する。
合計500時間以上のビデオに抽出的要約と抽象的要約を併用したベンチマークデータセットは,既存の注釈付きコーパスよりもはるかに大きい。
ベクトル量子化変分オートエンコーダを用いて音声発話の潜時ベクトル表現を学習し、転写文から有意な発話を識別して要約を生成するニューラルネットワーク抽出要約モデルについて検討する。
我々のモデルはより一般化され、強力なベースラインよりも性能が向上することを示す。
本研究の結果は,ライブストリームの効率的なブラウジングのための要約ソリューションの改善に向けた今後の研究の道筋を提供する。
関連論文リスト
- Personalized Video Summarization using Text-Based Queries and Conditional Modeling [3.4447129363520337]
この論文は、テキストベースのクエリと条件付きモデリングを統合することで、ビデオ要約の強化を探求する。
精度やF1スコアなどの評価指標は、生成された要約の品質を評価する。
論文 参考訳(メタデータ) (2024-08-27T02:43:40Z) - Towards Enhancing Coherence in Extractive Summarization: Dataset and Experiments with LLMs [70.15262704746378]
我々は,5つの公開データセットと自然言語ユーザフィードバックのためのコヒーレントな要約からなる,体系的に作成された人間アノテーションデータセットを提案する。
Falcon-40BとLlama-2-13Bによる予備的な実験では、コヒーレントなサマリーを生成するという点で大幅な性能向上(10%ルージュ-L)が見られた。
論文 参考訳(メタデータ) (2024-07-05T20:25:04Z) - Scaling Up Video Summarization Pretraining with Large Language Models [73.74662411006426]
本稿では,大規模ビデオ要約データセットを生成するための,自動化されたスケーラブルなパイプラインを提案する。
我々は既存のアプローチの限界を分析し、それらに効果的に対処する新しいビデオ要約モデルを提案する。
我々の研究は、プロが注釈付けした高品質の要約を持つ1200本の長編ビデオを含む新しいベンチマークデータセットも提示した。
論文 参考訳(メタデータ) (2024-04-04T11:59:06Z) - Zero-Shot Video Moment Retrieval from Frozen Vision-Language Models [58.17315970207874]
モーメント・テキストアライメントを容易にするため、任意のVLMから一般化可能なビジュアル・テクスチャの事前適応のためのゼロショット手法を提案する。
3つのVMRベンチマークデータセットで実施された実験は、ゼロショットアルゴリズムの顕著なパフォーマンス上の利点を示している。
論文 参考訳(メタデータ) (2023-09-01T13:06:50Z) - Abstractive Summary Generation for the Urdu Language [1.9594639581421422]
我々は、自己認識機構を利用して入力テキストを符号化し、要約を生成するトランスフォーマーベースのモデルを用いる。
実験の結果,我々のモデルは文法的に正し,意味的に意味のある要約を生成できることがわかった。
論文 参考訳(メタデータ) (2023-05-25T15:55:42Z) - Learning Summary-Worthy Visual Representation for Abstractive
Summarization in Video [34.202514532882]
本稿では,抽象的な要約を容易にする要約価値のある視覚表現を学習するための新しいアプローチを提案する。
本手法は, クロスモーダル転写データと擬似要約から抽出した知識の両方から, 要約に値する情報を利用する。
論文 参考訳(メタデータ) (2023-05-08T16:24:46Z) - Video Summarization Based on Video-text Modelling [0.0]
ビデオのセマンティック表現を得るために,マルチモーダルな自己教師型学習フレームワークを提案する。
また,より優れた要約を生成するために,動画内の重要なコンテンツを段階的にピンポイントするプログレッシブな映像要約手法も導入する。
映像分類に基づく映像要約の質を客観的に評価する枠組みを提案する。
論文 参考訳(メタデータ) (2022-01-07T15:21:46Z) - Abstractive Summarization of Spoken and Written Instructions with BERT [66.14755043607776]
本稿では,BERTSumモデルの最初の対話型言語への応用について述べる。
我々は多種多様な話題にまたがるナレーションビデオの抽象要約を生成する。
我々は、これをインテリジェントな仮想アシスタントの機能として統合し、要求に応じて文字と音声の両方の指導内容の要約を可能にすることを想定する。
論文 参考訳(メタデータ) (2020-08-21T20:59:34Z) - Knowledge Graph-Augmented Abstractive Summarization with Semantic-Driven
Cloze Reward [42.925345819778656]
本稿では,グラフ拡張と意味駆動型RewarDによる抽象要約のための新しいフレームワークであるASGARDを紹介する。
本稿では,2つのエンコーダ(シーケンシャル文書エンコーダ)とグラフ構造化エンコーダ(グラフ構造化エンコーダ)の利用を提案する。
その結果、我々のモデルは、New York TimesとCNN/Daily Mailのデータセットからの入力として、知識グラフのない変種よりもはるかに高いROUGEスコアを生成することがわかった。
論文 参考訳(メタデータ) (2020-05-03T18:23:06Z) - Few-Shot Learning for Opinion Summarization [117.70510762845338]
オピニオン要約は、複数の文書で表現された主観的な情報を反映したテキストの自動生成である。
本研究では,要約テキストの生成をブートストラップするのには,少数の要約でも十分であることを示す。
提案手法は, 従来の抽出法および抽象法を, 自動的, 人的評価において大きく上回っている。
論文 参考訳(メタデータ) (2020-04-30T15:37:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。