論文の概要: Temporal Analysis on Topics Using Word2Vec
- arxiv url: http://arxiv.org/abs/2209.11717v2
- Date: Sun, 17 Sep 2023 18:27:13 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-20 01:30:42.837432
- Title: Temporal Analysis on Topics Using Word2Vec
- Title(参考訳): Word2Vecを用いた話題の時間的分析
- Authors: Angad Sandhu, Aneesh Edara, Vishesh Narayan, Faizan Wajid, Ashok
Agrawala
- Abstract要約: 本研究では,トレンド検出と可視化の新しい手法を提案する。具体的には,話題の変化を時間とともにモデル化する。
この手法は、20のNews Groupsデータセットに存在する様々なメディアハウスの記事群でテストされた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The present study proposes a novel method of trend detection and
visualization - more specifically, modeling the change in a topic over time.
Where current models used for the identification and visualization of trends
only convey the popularity of a singular word based on stochastic counting of
usage, the approach in the present study illustrates the popularity and
direction that a topic is moving in. The direction in this case is a distinct
subtopic within the selected corpus. Such trends are generated by modeling the
movement of a topic by using k-means clustering and cosine similarity to group
the distances between clusters over time. In a convergent scenario, it can be
inferred that the topics as a whole are meshing (tokens between topics,
becoming interchangeable). On the contrary, a divergent scenario would imply
that each topics' respective tokens would not be found in the same context (the
words are increasingly different to each other). The methodology was tested on
a group of articles from various media houses present in the 20 Newsgroups
dataset.
- Abstract(参考訳): 本研究では,トレンド検出と可視化の新しい手法を提案する。具体的には,話題の変化を時間とともにモデル化する。
トレンドの識別と視覚化のために現在使われているモデルが, 確率的使用量のカウントに基づいて, 単数語の人気のみを伝える場合, 本研究のアプローチは, 話題が移りつつある人気と方向性を示すものである。
この場合の方向は、選択されたコーパス内で異なるサブトピックである。
このような傾向はk平均クラスタリングとコサイン類似性を用いてトピックの動きをモデル化し、時間とともにクラスタ間の距離をグループ化する。
収束シナリオでは、トピック全体がメッシュである(トピック間のトークンは交換可能である)と推測することができる。
それとは対照的に、発散したシナリオは、各トピックのそれぞれのトークンが同じ文脈で見つからないことを意味する(単語は次第に互いに異なる)。
この方法論は20のnewsgroupsデータセットに存在する様々なメディアハウスからの記事のグループでテストされた。
関連論文リスト
- CAST: Corpus-Aware Self-similarity Enhanced Topic modelling [16.562349140796115]
CAST: Corpus-Aware Self-similarity Enhanced Topic modelling, a novel topic modelling methodを紹介する。
機能的単語が候補話題語として振る舞うのを防ぐための効果的な指標として自己相似性を見出した。
提案手法は,生成したトピックの一貫性と多様性,およびノイズの多いデータを扱うトピックモデルの能力を大幅に向上させる。
論文 参考訳(メタデータ) (2024-10-19T15:27:11Z) - Visualizing Temporal Topic Embeddings with a Compass [1.5184974790808403]
本稿では,コンパス整列時相Word2Vec手法を動的トピックモデリングに拡張することを提案する。
このような手法により、動的トピックにおける時間にわたって単語と文書の埋め込みを直接比較することができる。
論文 参考訳(メタデータ) (2024-09-16T18:29:19Z) - Variational Cross-Graph Reasoning and Adaptive Structured Semantics
Learning for Compositional Temporal Grounding [143.5927158318524]
テンポラルグラウンドティング(Temporal grounding)とは、クエリ文に従って、未編集のビデオから特定のセグメントを特定するタスクである。
新たに構成時間グラウンドタスクを導入し,2つの新しいデータセット分割を構築した。
ビデオや言語に内在する構造的意味論は、構成的一般化を実現する上で重要な要素である、と我々は主張する。
論文 参考訳(メタデータ) (2023-01-22T08:02:23Z) - Topics in Contextualised Attention Embeddings [7.6650522284905565]
最近の研究で、言語モデルから単語レベルの文脈表現をクラスタ化することは、潜在ディリクレ割当から単語の潜在トピックで見つかる単語クラスタをエミュレートすることを示した。
重要な疑問は、潜在トピックをモデル化するように明示的に設計されていない言語モデルにおいて、そのような話題の単語クラスタが、クラスタリングを通じてどのように自動的に形成されるかである。
BERT と DistilBERT を用いて,このような話題クラスタをモデル化する上で,アテンションフレームワークが重要な役割を担っていることがわかった。
論文 参考訳(メタデータ) (2023-01-11T07:26:19Z) - Twitter Topic Classification [15.306383757213956]
我々は、ツイートトピック分類に基づく新しいタスクを提案し、関連する2つのデータセットをリリースする。
ソーシャルメディアで最も重要な議論点をカバーする幅広いトピックについて、トレーニングとテストデータを提供しています。
タスク上で,現在の汎用言語モデルとドメイン固有言語モデルの定量的評価と分析を行う。
論文 参考訳(メタデータ) (2022-09-20T16:13:52Z) - Compositional Temporal Grounding with Structured Variational Cross-Graph
Correspondence Learning [92.07643510310766]
ビデオの時間的接地は、あるクエリ文に意味的に対応する1つのターゲットビデオセグメントをローカライズすることを目的としている。
新たに構成時間グラウンドタスクを導入し,2つの新しいデータセット分割を構築した。
出現した単語の新たな組み合わせによるクエリの一般化に失敗したことを実証的に見出した。
本稿では,ビデオと言語を複数の階層構造に明示的に分解する多変分グラフ推論フレームワークを提案する。
論文 参考訳(メタデータ) (2022-03-24T12:55:23Z) - SCoT: Sense Clustering over Time: a tool for the analysis of lexical
change [79.80787569986283]
我々は、語彙変化を分析する新しいネットワークベースのツールであるSense Clustering over Time (SCoT)を提示する。
SCoTは、単語の意味を類似した単語の集合として表現する。
危機の意味の変化に関するヨーロッパの研究で、うまく使われてきた」。
論文 参考訳(メタデータ) (2022-03-18T12:04:09Z) - TopicNet: Semantic Graph-Guided Topic Discovery [51.71374479354178]
既存の階層的なトピックモデルでは、教師なしの方法でテキストコーパスから意味論的意味のあるトピックを抽出することができる。
TopicNetを階層的なトピックモデルとして導入し、学習に影響を与えるための帰納的バイアスとして、事前構造知識を注入する。
論文 参考訳(メタデータ) (2021-10-27T09:07:14Z) - Time Series Analysis via Network Science: Concepts and Algorithms [62.997667081978825]
本稿では,時系列をネットワークに変換する既存のマッピング手法について概観する。
我々は、主要な概念的アプローチを説明し、権威的な参照を提供し、統一された表記法と言語におけるそれらの利点と限界について洞察を与える。
ごく最近の研究だが、この研究領域には大きな可能性を秘めており、今後の研究の道を開くことを目的としている。
論文 参考訳(メタデータ) (2021-10-11T13:33:18Z) - Author Clustering and Topic Estimation for Short Texts [69.54017251622211]
同じ文書中の単語間の強い依存をモデル化することにより、遅延ディリクレ割当を拡張できる新しいモデルを提案する。
同時にユーザをクラスタ化し、ホック後のクラスタ推定の必要性を排除しています。
我々の手法は、短文で生じる問題に対する従来のアプローチよりも、-または----------- で機能する。
論文 参考訳(メタデータ) (2021-06-15T20:55:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。