論文の概要: Unsupervised Graph-based Topic Modeling from Video Transcriptions
- arxiv url: http://arxiv.org/abs/2105.01466v1
- Date: Tue, 4 May 2021 12:48:17 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-05 12:54:15.557638
- Title: Unsupervised Graph-based Topic Modeling from Video Transcriptions
- Title(参考訳): ビデオ記録からの教師なしグラフに基づくトピックモデリング
- Authors: Lukas Stappen, Gerhard Hagerer, Bj\"orn W. Schuller, Georg Groh
- Abstract要約: ニューラルワード埋め込みとグラフベースのクラスタリング手法を用いて,映像の書き起こしに関するトピック抽出器を開発した。
実生活マルチモーダルデータセット MuSe-CaR の実験結果から,本手法は一貫性と意味のあるトピックを抽出することを示した。
- 参考スコア(独自算出の注目度): 5.210353244951637
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: To unfold the tremendous amount of audiovisual data uploaded daily to social
media platforms, effective topic modelling techniques are needed. Existing work
tends to apply variants of topic models on text data sets. In this paper, we
aim at developing a topic extractor on video transcriptions. The model improves
coherence by exploiting neural word embeddings through a graph-based clustering
method. Unlike typical topic models, this approach works without knowing the
true number of topics. Experimental results on the real-life multimodal data
set MuSe-CaR demonstrates that our approach extracts coherent and meaningful
topics, outperforming baseline methods. Furthermore, we successfully
demonstrate the generalisability of our approach on a pure text review data
set.
- Abstract(参考訳): ソーシャルメディアプラットフォームに毎日アップロードされる膨大な量のオーディオビジュアルデータを広めるためには、効果的なトピックモデリング技術が必要である。
既存の作業はテキストデータセットにトピックモデルの変種を適用する傾向がある。
本稿では,映像の書き起こしにおける話題抽出器の開発を目標とする。
このモデルは、グラフベースのクラスタリング手法により、ニューラルネットワークの埋め込みを利用してコヒーレンスを改善する。
典型的なトピックモデルとは異なり、このアプローチは真のトピックの数を知ることなく機能する。
実生活マルチモーダルデータセット MuSe-CaR の実験結果から,本手法は一貫性と有意義なトピックを抽出し,ベースライン法よりも優れた性能を示すことが示された。
さらに,純粋なテキストレビューデータセットに対するアプローチの汎用性を実証することに成功した。
関連論文リスト
- Let the Pretrained Language Models "Imagine" for Short Texts Topic
Modeling [29.87929724277381]
短いテキストでは、共起情報は最小限であり、結果として文書表現の特徴が分散する。
既存のトピックモデル(確率的あるいは神経的)は、ほとんどの場合、一貫性のあるトピックを生成するためにパターンのマイニングに失敗します。
既存の事前学習言語モデル(PLM)を用いて、短いテキストを長いシーケンスに拡張する。
論文 参考訳(メタデータ) (2023-10-24T00:23:30Z) - StableLLaVA: Enhanced Visual Instruction Tuning with Synthesized
Image-Dialogue Data [129.92449761766025]
本稿では,視覚的インストラクションチューニングのための画像と対話を同期的に合成する新しいデータ収集手法を提案する。
このアプローチは生成モデルのパワーを活用し、ChatGPTとテキスト・ツー・イメージ生成モデルの能力とを結合する。
本研究は,各種データセットを対象とした総合的な実験を含む。
論文 参考訳(メタデータ) (2023-08-20T12:43:52Z) - Topic-Selective Graph Network for Topic-Focused Summarization [0.0]
トピック弧認識とトピック選択グラフネットワークを提案する。
第一に、トピック・アーク認識の目的は、モデルのトピックを識別する能力を持つ訓練をモデル化するために使用される。
トピック選択グラフネットワークは、トピックアーク認識の結果に基づいて、文に対してトピック誘導のクロスインタラクションを行うことができる。
論文 参考訳(メタデータ) (2023-02-25T15:56:06Z) - Debiasing Vision-Language Models via Biased Prompts [79.04467131711775]
本稿では,テキスト埋め込みにおけるバイアスのある方向を投影することで,視覚言語基盤モデルを疎外する一般的な手法を提案する。
偏平投影行列を組み込んだテキストのみをデバイアスすることで、ロバストな分類器と公正な生成モデルが得られることを示す。
論文 参考訳(メタデータ) (2023-01-31T20:09:33Z) - Improving the Inference of Topic Models via Infinite Latent State
Replications [18.632435007093594]
トピックモデルに対する最も一般的な推論手法の1つは、おそらく崩壊したギブスサンプリング(CGS)である。
本稿では, トピックサンプル数を無限大に最大化することで, 状態拡張技術を活用することを提案する。
そこで我々は,各文書と単語のペアごとに頑健なソフトトピック代入を生成するために,無限潜在状態複製 (ILR) と呼ばれる新しい推論手法を開発した。
論文 参考訳(メタデータ) (2023-01-25T17:07:25Z) - Topic Discovery via Latent Space Clustering of Pretrained Language Model
Representations [35.74225306947918]
本研究では, PLM 埋め込みを基盤とした空間学習とクラスタリングの連携フレームワークを提案する。
提案モデルでは,トピック発見のためにPLMがもたらす強力な表現力と言語的特徴を効果的に活用する。
論文 参考訳(メタデータ) (2022-02-09T17:26:08Z) - Generating More Pertinent Captions by Leveraging Semantics and Style on
Multi-Source Datasets [56.018551958004814]
本稿では,データソースの非一様結合をトレーニングすることで,流動的な記述を生成するタスクに対処する。
ノイズの多い画像とテキストのペアを持つ大規模データセットは、サブ最適の監視源を提供する。
本稿では,検索コンポーネントから抽出したスタイルトークンとキーワードを組み込むことにより,セマンティクスと記述スタイルを活用・分離することを提案する。
論文 参考訳(メタデータ) (2021-11-24T19:00:05Z) - ConvoSumm: Conversation Summarization Benchmark and Improved Abstractive
Summarization with Argument Mining [61.82562838486632]
我々は、さまざまなオンライン会話形式のニュースコメント、ディスカッションフォーラム、コミュニティ質問応答フォーラム、電子メールスレッドに関する4つの新しいデータセットをクラウドソースする。
我々は、データセットの最先端モデルをベンチマークし、データに関連する特徴を分析します。
論文 参考訳(メタデータ) (2021-06-01T22:17:13Z) - Improving Neural Topic Models using Knowledge Distillation [84.66983329587073]
我々は,確率論的トピックモデルと事前学習されたトランスフォーマーの最適属性を組み合わせるために,知識蒸留を用いる。
我々のモジュラー手法は、どのニューラルトピックモデルでも簡単に適用でき、トピックの品質を向上させることができる。
論文 参考訳(メタデータ) (2020-10-05T22:49:16Z) - Topic Adaptation and Prototype Encoding for Few-Shot Visual Storytelling [81.33107307509718]
トピック間一般化の能力をモデル化するためのトピック適応型ストーリーテラを提案する。
また,アトピー内導出能力のモデル化を目的とした符号化手法の試作も提案する。
実験結果から,トピック適応とプロトタイプ符号化構造が相互に利益をもたらすことが明らかとなった。
論文 参考訳(メタデータ) (2020-08-11T03:55:11Z) - Tired of Topic Models? Clusters of Pretrained Word Embeddings Make for
Fast and Good Topics too! [5.819224524813161]
事前学習した単語の埋め込みをクラスタリングし、重み付けされたクラスタリングと上位単語の再ランク付けのための文書情報を組み込んだ別の方法を提案する。
このアプローチの最も優れた組み合わせは、従来のトピックモデルと同様に機能するが、ランタイムと計算の複雑さは低い。
論文 参考訳(メタデータ) (2020-04-30T16:18:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。