論文の概要: A Semantic Modular Framework for Events Topic Modeling in Social Media
- arxiv url: http://arxiv.org/abs/2301.09009v1
- Date: Sat, 21 Jan 2023 21:08:45 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-24 15:23:17.149444
- Title: A Semantic Modular Framework for Events Topic Modeling in Social Media
- Title(参考訳): ソーシャルメディアにおけるイベントトピックモデリングのためのセマンティックモジュラーフレームワーク
- Authors: Arya Hadizadeh Moghaddam and Saeedeh Momtazi
- Abstract要約: 5つの異なるモジュールからなるセマンティックモジュールモデル(SMM)を提案する。
提案手法は,(1)複数の文書を集約し,イベントの識別に寄与しない可能性のある文書を無視すること,(2)より重要かつ記述的なキーワードを識別することを目的としている。
提案手法と比較すると,提案手法はより低いランクのイベントを識別し,より重要なイベントのキーワードを抽出する上で高い性能を示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The advancement of social media contributes to the growing amount of content
they share frequently. This framework provides a sophisticated place for people
to report various real-life events. Detecting these events with the help of
natural language processing has received researchers' attention, and various
algorithms have been developed for this goal. In this paper, we propose a
Semantic Modular Model (SMM) consisting of 5 different modules, namely
Distributional Denoising Autoencoder, Incremental Clustering, Semantic
Denoising, Defragmentation, and Ranking and Processing. The proposed model aims
to (1) cluster various documents and ignore the documents that might not
contribute to the identification of events, (2) identify more important and
descriptive keywords. Compared to the state-of-the-art methods, the results
show that the proposed model has a higher performance in identifying events
with lower ranks and extracting keywords for more important events in three
English Twitter datasets: FACup, SuperTuesday, and USElection. The proposed
method outperformed the best reported results in the mean keyword-precision
metric by 7.9\%.
- Abstract(参考訳): ソーシャルメディアの進歩は、彼らが頻繁に共有するコンテンツの量の増加に寄与する。
このフレームワークは、さまざまな実生活イベントを報告するための洗練された場所を提供する。
これらの事象を自然言語処理の助けを借りて検出することは研究者の注目を集め、この目的のために様々なアルゴリズムが開発されている。
本稿では,SMM(Semantic Modular Model)を提案する。SMM(Semantic Modular Model)は,分散デノイングオートエンコーダ,インクリメンタルクラスタリング,セマンティックデノージング,デフラグメンテーション,ランク付けとプロセッシングの5つのモジュールからなる。
提案手法は,(1)様々な文書を集約し,イベントの識別に寄与しない文書を無視し,(2)より重要で記述的なキーワードを識別することを目的とする。
提案手法と比較すると,提案手法は,FACup,SuperTuesday,USElectionの3つの英語Twitterデータセットにおいて,より低いランクのイベントを識別し,より重要なイベントのキーワードを抽出する上で,より高い性能を示す。
提案手法は平均キーワード精度指標の報告結果の7.9\%を上回った。
関連論文リスト
- MetaKP: On-Demand Keyphrase Generation [52.48698290354449]
オンデマンドのキーフレーズ生成は,特定のハイレベルな目標や意図に従うキーフレーズを必要とする新しいパラダイムである。
そこで我々は,4つのデータセット,7500のドキュメント,3760の目標からなる大規模ベンチマークであるMetaKPを紹介した。
ソーシャルメディアからの流行事象検出に応用して,一般のNLP基盤として機能する可能性を示す。
論文 参考訳(メタデータ) (2024-06-28T19:02:59Z) - A Large-Scale Evaluation of Speech Foundation Models [110.95827399522204]
音声処理ユニバーサルパフォーマンスベンチマーク(SUPERB)を構築し,基礎モデルパラダイムの有効性について検討する。
凍結基盤モデルを用いてSUPERBにおける音声処理タスクに対処する統合マルチタスクフレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-15T00:03:16Z) - USER: Unified Semantic Enhancement with Momentum Contrast for Image-Text
Retrieval [115.28586222748478]
Image-Text Retrieval (ITR) は、与えられたクエリに意味のあるターゲットインスタンスを、他のモダリティから検索することを目的としている。
既存のアプローチは通常、2つの大きな制限に悩まされる。
論文 参考訳(メタデータ) (2023-01-17T12:42:58Z) - Named Entity and Relation Extraction with Multi-Modal Retrieval [51.660650522630526]
マルチモーダルな名前付きエンティティ認識(NER)と関係抽出(RE)は、関連画像情報を活用してNERとREの性能を向上させることを目的としている。
新たなマルチモーダル検索フレームワーク(MoRe)を提案する。
MoReはテキスト検索モジュールと画像ベースの検索モジュールを含み、入力されたテキストと画像の関連知識をそれぞれ知識コーパスで検索する。
論文 参考訳(メタデータ) (2022-12-03T13:11:32Z) - Improved Topic modeling in Twitter through Community Pooling [0.0]
Twitterの投稿は短いが、他のテキストよりも一貫性が低いことが多い。
著者が同じコミュニティに属しているツイートをグループ化する,トピックモデリングのための新しいプール方式を提案する。
その結果、我々のコミュニティポーリング手法は、2つの異種データセットの指標の大部分において、他の手法よりも優れていた。
論文 参考訳(メタデータ) (2021-12-20T17:05:32Z) - Importance Estimation from Multiple Perspectives for Keyphrase
Extraction [34.51718374923614]
複数視点からキーフレーズの重要性を推定する新しい手法を提案する(textitKIEMP)。
textitKIEMPは、構文的正確性を測定するチャンキングモジュール、情報の正確性をチェックするランキングモジュール、フレーズとドキュメント全体の概念整合性を判断するマッチングモジュールの3つのモジュールで、フレーズの重要性を見積もっている。
6つのベンチマークデータセットの実験結果から、textitKIEMPは、ほとんどの場合、既存の最先端のキーフレーズ抽出手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2021-10-19T05:48:22Z) - SChME at SemEval-2020 Task 1: A Model Ensemble for Detecting Lexical
Semantic Change [58.87961226278285]
本稿では,SemEval-2020 Task 1における語彙意味変化の教師なし検出法であるSChMEについて述べる。
SChMEは、分布モデル(単語埋め込み)とワード周波数モデルの信号を組み合わせたモデルアンサンブルを使用し、各モデルは、その特徴に応じて単語が苦しむ確率を示す投票を行う。
論文 参考訳(メタデータ) (2020-12-02T23:56:34Z) - Keyphrase Extraction with Dynamic Graph Convolutional Networks and
Diversified Inference [50.768682650658384]
キーワード抽出(KE)は、ある文書でカバーされている概念やトピックを正確に表現するフレーズの集合を要約することを目的としている。
最近のシークエンス・ツー・シークエンス(Seq2Seq)ベースの生成フレームワークはKEタスクで広く使われ、様々なベンチマークで競合性能を得た。
本稿では,この2つの問題を同時に解くために,動的グラフ畳み込みネットワーク(DGCN)を採用することを提案する。
論文 参考訳(メタデータ) (2020-10-24T08:11:23Z) - BATS: A Spectral Biclustering Approach to Single Document Topic Modeling
and Segmentation [17.003488045214972]
既存のトピックモデリングとテキストセグメンテーションの方法論は一般的に、トレーニングのために大きなデータセットを必要とする。
単一のドキュメントを扱う方法論を開発する際、我々は2つの大きな課題に直面します。
1つのドキュメントのみにアクセスすることで、従来のトピックモデルやディープラーニングアルゴリズムをトレーニングすることはできないのです。
第二に大きなノイズ: 単一の文書にある単語のかなりの部分がノイズのみを生成し、トピックやセグメントの識別に役立ちません。
論文 参考訳(メタデータ) (2020-08-05T16:34:33Z) - Embed2Detect: Temporally Clustered Embedded Words for Event Detection in
Social Media [1.7205106391379026]
ワード埋め込みの採用により、Embed2Detectは強力なセマンティック機能をイベント検出に組み込むことができる。
以上の結果から,Embed2Detectは効率的かつ効率的なイベント検出が可能であることが示唆された。
論文 参考訳(メタデータ) (2020-06-10T15:52:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。