論文の概要: Probabilistic Model of Narratives Over Topical Trends in Social Media: A
Discrete Time Model
- arxiv url: http://arxiv.org/abs/2004.06793v1
- Date: Tue, 14 Apr 2020 20:18:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-13 09:57:41.954688
- Title: Probabilistic Model of Narratives Over Topical Trends in Social Media: A
Discrete Time Model
- Title(参考訳): ソーシャルメディアの話題傾向に関する物語の確率論的モデル:離散時間モデル
- Authors: Toktam A. Oghaz, Ece C. Mutlu, Jasser Jasser, Niloofar Yousefi, Ivan
Garibay
- Abstract要約: 本稿では,イベントベースの物語要約抽出フレームワークを提案する。
我々のフレームワークは確率論的トピックモデルとして設計され、分類時間分布と抽出テキスト要約が続く。
我々は、シリアのホワイトヘルメッツに対して行われた偽情報キャンペーンのドメインで100万以上のツイートを含む、Twitterデータの大規模なコーパスで、我々のモデルを評価した。
- 参考スコア(独自算出の注目度): 4.073849137967964
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Online social media platforms are turning into the prime source of news and
narratives about worldwide events. However,a systematic summarization-based
narrative extraction that can facilitate communicating the main underlying
events is lacking. To address this issue, we propose a novel event-based
narrative summary extraction framework. Our proposed framework is designed as a
probabilistic topic model, with categorical time distribution, followed by
extractive text summarization. Our topic model identifies topics' recurrence
over time with a varying time resolution. This framework not only captures the
topic distributions from the data, but also approximates the user activity
fluctuations over time. Furthermore, we define significance-dispersity
trade-off (SDT) as a comparison measure to identify the topic with the highest
lifetime attractiveness in a timestamped corpus. We evaluate our model on a
large corpus of Twitter data, including more than one million tweets in the
domain of the disinformation campaigns conducted against the White Helmets of
Syria. Our results indicate that the proposed framework is effective in
identifying topical trends, as well as extracting narrative summaries from text
corpus with timestamped data.
- Abstract(参考訳): オンラインソーシャルメディアプラットフォームは、世界中の出来事に関するニュースや物語の主要な情報源になりつつある。
しかし、主要な出来事を伝達しやすくする体系的な要約に基づく物語抽出は欠落している。
そこで本研究では,イベントベースの物語要約抽出フレームワークを提案する。
提案するフレームワークは確率論的トピックモデルとして設計され,分類時間分布と抽出テキスト要約が続く。
トピックモデルは,トピックの繰り返しを時間分解能で識別する。
このフレームワークは、データからトピックの分布をキャプチャするだけでなく、時間とともにユーザアクティビティの変動を近似する。
さらに, 意味分散トレードオフ(sdt)を, タイムスタンプされたコーパスにおいて, 最盛期魅力のあるトピックを識別するための比較尺度として定義する。
我々は、シリアのホワイトヘルメットに対して行われた偽情報キャンペーンのドメイン内に100万以上のツイートを含む、大量のtwitterデータに基づいて、我々のモデルを評価する。
提案手法は,テキストコーパスから記事の要約をタイムスタンプ付きデータで抽出するだけでなく,話題の傾向を特定する上でも有効であることを示す。
関連論文リスト
- MomentDiff: Generative Video Moment Retrieval from Random to Real [71.40038773943638]
私たちは、MomentDiffという拡散に基づく生成フレームワークを提供しています。
MomentDiffは、ランダムなブラウジングから段階的なローカライゼーションまで、典型的な人間の検索プロセスをシミュレートする。
MomentDiffは3つの公開ベンチマークで最先端の手法を一貫して上回っていることを示す。
論文 参考訳(メタデータ) (2023-07-06T09:12:13Z) - Follow the Timeline! Generating Abstractive and Extractive Timeline
Summary in Chronological Order [78.46986998674181]
時間順で抽象的かつ抽出的な時系列を生成できる統一タイムライン要約器(UTS)を提案する。
我々は、以前の中国の大規模タイムライン要約データセットを拡張し、新しい英語タイムラインデータセットを収集する。
UTSは、自動評価と人的評価の両方の観点から最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2023-01-02T20:29:40Z) - A Closer Look at Debiased Temporal Sentence Grounding in Videos:
Dataset, Metric, and Approach [53.727460222955266]
テンポラル・センテンス・グラウンディング・イン・ビデオ(TSGV)は、未編集のビデオに自然言語文を埋め込むことを目的としている。
最近の研究では、現在のベンチマークデータセットには明らかなモーメントアノテーションバイアスがあることが判明している。
偏りのあるデータセットによる膨らませ評価を緩和するため、基礎的リコールスコアを割引する新しい評価基準「dR@n,IoU@m」を導入する。
論文 参考訳(メタデータ) (2022-03-10T08:58:18Z) - Topic-Aware Encoding for Extractive Summarization [15.113768658584979]
この問題に対処するために,文書要約のためのトピック認識符号化を提案する。
ニューラルネットワークに基づく文レベルの表現学習にニューラルトピックモデルを追加し、中心トピック情報を適切に検討する。
3つの公開データセットの実験結果は、我々のモデルが最先端のモデルより優れていることを示している。
論文 参考訳(メタデータ) (2021-12-17T15:26:37Z) - TopNet: Learning from Neural Topic Model to Generate Long Stories [43.5564336855688]
Long Story Generation (LSG) は自然言語処理における目標の1つである。
短い入力を補完する高品質なスケルトン語を得るために,emphTopNetを提案する。
提案手法は骨格語選択に極めて有効であり, 自動評価と人的評価の両方において最先端のモデルよりも優れていた。
論文 参考訳(メタデータ) (2021-12-14T09:47:53Z) - HTMOT : Hierarchical Topic Modelling Over Time [0.0]
本稿では,階層的話題モデリングを行うための新しい手法であるHTMOTを提案する。
時間モデリングを深層サブトピックに適用するだけで、特定のストーリーやイベントを抽出できることを示す。
以上の結果から,トレーニング手順は高速で,高精度なトピックと時間的高精度なサブトピックを抽出できることが示唆された。
論文 参考訳(メタデータ) (2021-11-22T11:02:35Z) - Author Clustering and Topic Estimation for Short Texts [69.54017251622211]
同じ文書中の単語間の強い依存をモデル化することにより、遅延ディリクレ割当を拡張できる新しいモデルを提案する。
同時にユーザをクラスタ化し、ホック後のクラスタ推定の必要性を排除しています。
我々の手法は、短文で生じる問題に対する従来のアプローチよりも、-または----------- で機能する。
論文 参考訳(メタデータ) (2021-06-15T20:55:55Z) - Modeling Collective Anticipation and Response on Wikipedia [1.299941371793082]
本研究では,概日リズムとともに,予測的成長と集団的注意の崩壊といった重要な特徴を取り入れ,人気ピーク周辺のダイナミクスを記述するモデルを提案する。
我々の研究は、注意の時間的パターンとそれらが表す事象の特徴的基盤情報との関連性だけでなく、集合的注意のすべてのフェーズを適切にモデル化することの重要性を示す。
論文 参考訳(メタデータ) (2021-05-23T09:51:32Z) - Bengali Abstractive News Summarization(BANS): A Neural Attention
Approach [0.8793721044482612]
本稿では,エンコーダ・デコーダに着目したSeq2seqベースのLong Short-Term Memory(LSTM)ネットワークモデルを提案する。
提案システムでは,単語の長い列を人文や人文で生成する,局所的な注意に基づくモデルを構築している。
また,Bangla.bdnews24.com1から収集した19k以上の記事とそれに対応する人文要約のデータセットも作成した。
論文 参考訳(メタデータ) (2020-12-03T08:17:31Z) - Topic Adaptation and Prototype Encoding for Few-Shot Visual Storytelling [81.33107307509718]
トピック間一般化の能力をモデル化するためのトピック適応型ストーリーテラを提案する。
また,アトピー内導出能力のモデル化を目的とした符号化手法の試作も提案する。
実験結果から,トピック適応とプロトタイプ符号化構造が相互に利益をもたらすことが明らかとなった。
論文 参考訳(メタデータ) (2020-08-11T03:55:11Z) - Screenplay Summarization Using Latent Narrative Structure [78.45316339164133]
本稿では,物語の基盤となる構造を一般教師なし・教師付き抽出要約モデルに明示的に組み込むことを提案する。
重要な物語イベント(転回点)の観点で物語構造を定式化し、脚本を要約するために潜伏状態として扱う。
シーンレベルの要約ラベルを付加したテレビ画面のCSIコーパスの実験結果から,潜角点がCSIエピソードの重要な側面と相関していることが判明した。
論文 参考訳(メタデータ) (2020-04-27T11:54:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。