論文の概要: A Human Word Association based model for topic detection in social networks
- arxiv url: http://arxiv.org/abs/2301.13066v3
- Date: Wed, 21 Aug 2024 08:25:25 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-22 23:35:54.702918
- Title: A Human Word Association based model for topic detection in social networks
- Title(参考訳): ソーシャルネットワークにおける話題検出のためのヒューマンワードアソシエーションに基づくモデル
- Authors: Mehrdad Ranjbar Khadivi, Shahin Akbarpour, Mohammad-Reza Feizi-Derakhshi, Babak Anari,
- Abstract要約: 本稿では,単語連想の心的能力を模倣する概念に基づく,ソーシャルネットワークの話題検出フレームワークを提案する。
このフレームワークの性能は、トピック検出の分野におけるベンチマークであるFA-CUPデータセットを用いて評価される。
- 参考スコア(独自算出の注目度): 1.8749305679160366
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the widespread use of social networks, detecting the topics discussed on these platforms has become a significant challenge. Current approaches primarily rely on frequent pattern mining or semantic relations, often neglecting the structure of the language. Language structural methods aim to discover the relationships between words and how humans understand them. Therefore, this paper introduces a topic detection framework for social networks based on the concept of imitating the mental ability of word association. This framework employs the Human Word Association method and includes a specially designed extraction algorithm. The performance of this method is evaluated using the FA-CUP dataset, a benchmark in the field of topic detection. The results indicate that the proposed method significantly improves topic detection compared to other methods, as evidenced by Topic-recall and the keyword F1 measure. Additionally, to assess the applicability and generalizability of the proposed method, a dataset of Telegram posts in the Persian language is used. The results demonstrate that this method outperforms other topic detection methods.
- Abstract(参考訳): ソーシャルネットワークの普及に伴い、これらのプラットフォーム上で議論されているトピックを検出することは大きな課題となっている。
現在のアプローチは主に頻繁なパターンマイニングやセマンティックな関係に依存しており、言語の構造を無視することが多い。
言語構造的手法は、単語間の関係と人間がそれらを理解する方法を見つけることを目的としている。
そこで本稿では,単語連想の精神能力の模倣という概念に基づく,ソーシャルネットワークの話題検出フレームワークを提案する。
このフレームワークは、ヒューマンワードアソシエーション法を採用し、特別に設計された抽出アルゴリズムを含んでいる。
トピック検出の分野におけるベンチマークであるFA-CUPデータセットを用いて,本手法の性能を評価する。
その結果,提案手法はトピックリコールやキーワードF1測定によって実証されるように,他の手法と比較してトピック検出を著しく改善することがわかった。
さらに,提案手法の適用性と一般化性を評価するために,ペルシャ語におけるテレグラムポストのデータセットを用いる。
その結果,本手法は他のトピック検出法よりも優れていることがわかった。
関連論文リスト
- A comprehensive study on Frequent Pattern Mining and Clustering categories for topic detection in Persian text stream [6.446062819763263]
本研究の目的は,トピック検出のための最適なアルゴリズムについて広範な研究を行うことである。
ペルシアのソーシャルネットワーク投稿のテキストがデータセットとして使用される。
以上の結果から,人間が容易に理解できるキーワードトピックを探索する場合には,ハイブリッドカテゴリーの方が優れていることが示唆された。
論文 参考訳(メタデータ) (2024-03-15T12:08:58Z) - Natural Language Processing for Dialects of a Language: A Survey [56.93337350526933]
最先端自然言語処理(NLP)モデルは、大規模なトレーニングコーパスでトレーニングされ、評価データセットで最上位のパフォーマンスを報告します。
この調査は、これらのデータセットの重要な属性である言語の方言を掘り下げる。
方言データセットに対するNLPモデルの性能劣化と言語技術のエクイティへのその影響を動機として,我々はデータセットやアプローチの観点から,方言に対するNLPの過去の研究を調査した。
論文 参考訳(メタデータ) (2024-01-11T03:04:38Z) - On the Generalization of Training-based ChatGPT Detection Methods [33.46128880100525]
ChatGPTは、様々な自然言語タスクにおいて素晴らしいパフォーマンスを達成する最もポピュラーな言語モデルの1つである。
また、人書きから生成されたChatGPTのテキストを検出する必要がある。
論文 参考訳(メタデータ) (2023-10-02T16:13:08Z) - Towards Open Vocabulary Learning: A Survey [146.90188069113213]
ディープニューラルネットワークは,セグメンテーションやトラッキング,検出といった,さまざまなコアタスクにおいて,目覚ましい進歩を遂げている。
近年、視覚言語事前学習の急速な進歩により、オープンな語彙設定が提案されている。
本稿では,その分野における最近の発展を要約し分析し,オープンな語彙学習の徹底的なレビューを行う。
論文 参考訳(メタデータ) (2023-06-28T02:33:06Z) - Topics in the Haystack: Extracting and Evaluating Topics beyond
Coherence [0.0]
本稿では,文と文書のテーマを深く理解する手法を提案する。
これにより、一般的な単語やネオロジズムを含む潜在トピックを検出することができる。
本稿では, 侵入者の単語の人間識別と相関係数を示し, 単語侵入作業において, ほぼ人間レベルの結果を得る。
論文 参考訳(メタデータ) (2023-03-30T12:24:25Z) - Persian topic detection based on Human Word association and graph
embedding [3.8137985834223507]
本稿では,Human Word Associationに基づくソーシャルメディアのトピック検出フレームワークを提案する。
この地域での作業のほとんどは英語で行われているが、ペルシア語で行われている。
論文 参考訳(メタデータ) (2023-02-20T05:46:47Z) - Ensemble Transfer Learning for Multilingual Coreference Resolution [60.409789753164944]
非英語で作業する場合に頻繁に発生する問題は、注釈付きトレーニングデータの不足である。
我々は,様々なトランスファー学習技術を組み合わせた,シンプルだが効果的なアンサンブルベースのフレームワークを設計する。
また、ウィキペディアアンカーテキストを利用して、コア参照解決モデルをブートストラップする低コストのTL手法を提案する。
論文 参考訳(メタデータ) (2023-01-22T18:22:55Z) - Semantic Search for Large Scale Clinical Ontologies [63.71950996116403]
本稿では,大規模臨床語彙検索システムを構築するための深層学習手法を提案する。
本稿では,意味学習データに基づくトレーニングデータを生成するTriplet-BERTモデルを提案する。
このモデルは,5つの実ベンチマークデータセットを用いて評価され,提案手法は自由テキストから概念,概念まで,概念語彙の検索において高い結果が得られることを示す。
論文 参考訳(メタデータ) (2022-01-01T05:15:42Z) - Be More with Less: Hypergraph Attention Networks for Inductive Text
Classification [56.98218530073927]
グラフニューラルネットワーク(GNN)は、研究コミュニティで注目され、この標準タスクで有望な結果を実証している。
成功にもかかわらず、それらのパフォーマンスは、単語間の高次相互作用をキャプチャできないため、実際は大部分が危険に晒される可能性がある。
本稿では,テキスト表現学習において,少ない計算量でより表現力の高いハイパーグラフアテンションネットワーク(HyperGAT)を提案する。
論文 参考訳(メタデータ) (2020-11-01T00:21:59Z) - Polysemy Deciphering Network for Robust Human-Object Interaction
Detection [86.97181280842098]
本稿では,HOI検出のための動詞の視覚的ポリセミーを復号する新しいポリセミー・デセプティング・ネットワーク(PD-Net)を提案する。
2つの新しいモジュールを用いてHOI検出機能をポリセミヤウェアに洗練する。
第2に, PD-Net に先立ってより重要と思われる特徴型に基づいて決定を下すための, 新たなpolysemy-Aware Modal Fusion モジュール (PAMF) を導入する。
論文 参考訳(メタデータ) (2020-08-07T00:49:27Z) - A novel approach to sentiment analysis in Persian using discourse and
external semantic information [0.0]
自然言語で書かれた文書から個人の感情を抽出するための多くのアプローチが提案されている。
これらのアプローチの大半は英語に重点を置いているが、ペルシア語のような資源中心の言語は研究作業や言語資源の欠如に悩まされている。
ペルシア語におけるこのギャップのため、現在の研究はペルシア語に適用される感情分析の新しい手法を導入することを目的としている。
論文 参考訳(メタデータ) (2020-07-18T18:40:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。