論文の概要: A Human Word Association based model for topic detection in social
networks
- arxiv url: http://arxiv.org/abs/2301.13066v1
- Date: Mon, 30 Jan 2023 17:10:34 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-31 13:45:43.158675
- Title: A Human Word Association based model for topic detection in social
networks
- Title(参考訳): ソーシャルネットワークにおける話題検出のためのヒューマンワードアソシエーションに基づくモデル
- Authors: Mehrdad Ranjbar Khadivi, Shahin Akbarpour, Mohammad-Reza
Feizi-Derakhshi, Babak Anari
- Abstract要約: 本稿では,「心的能力の模倣」の概念を用いて,ソーシャルネットワークにおける話題検出フレームワークを提案する。
FA-CUPデータセットを用いて,本手法の性能評価を行った。
これはトピック検出の分野におけるベンチマークデータセットである。
- 参考スコア(独自算出の注目度): 3.8137985834223507
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the widespread use of social networks, detecting the topics discussed in
these networks has become a significant challenge. The current works are mainly
based on frequent pattern mining or semantic relations, and the language
structure is not considered. The meaning of language structural methods is to
discover the relationship between words and how humans understand them.
Therefore, this paper uses the Concept of the Imitation of the Mental Ability
of Word Association to propose a topic detection framework in social networks.
This framework is based on the Human Word Association method. The performance
of this method is evaluated on the FA-CUP dataset. It is a benchmark dataset in
the field of topic detection. The results show that the proposed method is a
good improvement compared to other methods, based on the Topic-recall and the
keyword F1 measure. Also, most of the previous works in the field of topic
detection are limited to the English language, and the Persian language,
especially microblogs written in this language, is considered a low-resource
language. Therefore, a data set of Telegram posts in the Farsi language has
been collected. Applying the proposed method to this dataset also shows that
this method works better than other topic detection methods.
- Abstract(参考訳): ソーシャルネットワークの普及に伴い、これらのネットワークで議論されている話題の検出が大きな課題となっている。
現在の研究は主に頻繁なパターンマイニングや意味的関係に基づいており、言語構造は考慮されていない。
言語構造的手法の意味は、単語と人間の理解方法の関係を発見することである。
そこで,本稿では,「心的能力の模倣」の概念を用いて,ソーシャルネットワークにおける話題検出フレームワークを提案する。
この枠組みはHuman Word Association法に基づいている。
FA-CUPデータセットを用いて,本手法の性能評価を行った。
これはトピック検出の分野におけるベンチマークデータセットである。
提案手法は,Topic-recallとキーワードF1測度に基づいて,他の手法と比較して改善されている。
また、トピック検出の分野における以前の研究のほとんどは英語に限られており、ペルシア語、特にこの言語で書かれたマイクロブログは低リソース言語と考えられている。
そのため、farsi言語におけるテレグラム投稿のデータセットが収集されている。
このデータセットに提案手法を適用することで,本手法は他のトピック検出手法よりも有効であることを示す。
関連論文リスト
- Language Model Decoding as Direct Metrics Optimization [87.68281625776282]
現在の復号法は、異なる側面にわたる人間のテキストと整合するテキストを生成するのに苦労している。
本研究では,言語モデルからの復号化を最適化問題として,期待される性能と人間のテキストとの厳密なマッチングを目的とした。
この誘導分布は,人間のテキストの難易度を向上させることが保証されていることを証明し,人間のテキストの基本的な分布に対するより良い近似を示唆する。
論文 参考訳(メタデータ) (2023-10-02T09:35:27Z) - Topics in the Haystack: Extracting and Evaluating Topics beyond
Coherence [0.0]
本稿では,文と文書のテーマを深く理解する手法を提案する。
これにより、一般的な単語やネオロジズムを含む潜在トピックを検出することができる。
本稿では, 侵入者の単語の人間識別と相関係数を示し, 単語侵入作業において, ほぼ人間レベルの結果を得る。
論文 参考訳(メタデータ) (2023-03-30T12:24:25Z) - Persian topic detection based on Human Word association and graph
embedding [3.8137985834223507]
本稿では,Human Word Associationに基づくソーシャルメディアのトピック検出フレームワークを提案する。
この地域での作業のほとんどは英語で行われているが、ペルシア語で行われている。
論文 参考訳(メタデータ) (2023-02-20T05:46:47Z) - Representation Learning for Resource-Constrained Keyphrase Generation [78.02577815973764]
本稿では,言語モデリングの目的を導くために,有能なスパンリカバリと有能なスパン予測を導入する。
提案手法が低リソースおよびゼロショットのキーフレーズ生成に有効であることを示す。
論文 参考訳(メタデータ) (2022-03-15T17:48:04Z) - Semantic Search for Large Scale Clinical Ontologies [63.71950996116403]
本稿では,大規模臨床語彙検索システムを構築するための深層学習手法を提案する。
本稿では,意味学習データに基づくトレーニングデータを生成するTriplet-BERTモデルを提案する。
このモデルは,5つの実ベンチマークデータセットを用いて評価され,提案手法は自由テキストから概念,概念まで,概念語彙の検索において高い結果が得られることを示す。
論文 参考訳(メタデータ) (2022-01-01T05:15:42Z) - Phonetic Word Embeddings [1.2192936362342826]
本稿では,人間の音知覚からモチベーションを受ける単語間の音声的類似性を計算するための新しい手法を提案する。
この計量は、類似の発声語をまとめる連続ベクトル埋め込み空間を学ぶために用いられる。
本手法の有効性を2つの異なる言語(ヒンディー語、ヒンディー語)で示し、過去の報告よりも高い性能を示した。
論文 参考訳(メタデータ) (2021-09-30T01:46:01Z) - Context Decoupling Augmentation for Weakly Supervised Semantic
Segmentation [53.49821324597837]
微調整されたセマンティックセグメンテーションは、近年深く研究されている困難な問題です。
本稿では、オブジェクトが現れる固有のコンテキストを変更する Context Decoupling Augmentation (CDA) メソッドを紹介します。
提案手法の有効性を検証するため, PASCAL VOC 2012データセットにいくつかの代替ネットワークアーキテクチャを用いた広範な実験を行い, CDAが様々なWSSS手法を新たな最先端技術に拡張できることを実証した。
論文 参考訳(メタデータ) (2021-03-02T15:05:09Z) - Unsupervised Key-phrase Extraction and Clustering for Classification
Scheme in Scientific Publications [0.0]
本稿では,システムマッピング (SM) とシステムレビュー (SR) プロセスの自動化の可能性について検討する。
キーフレーズは教師なしの方法で科学文書から抽出され、対応する分類体系を構築するために使用される。
また、クラスタリングを使って関連するキーフレーズをグループ化する方法についても検討する。
論文 参考訳(メタデータ) (2021-01-25T10:17:33Z) - Keyphrase Extraction with Dynamic Graph Convolutional Networks and
Diversified Inference [50.768682650658384]
キーワード抽出(KE)は、ある文書でカバーされている概念やトピックを正確に表現するフレーズの集合を要約することを目的としている。
最近のシークエンス・ツー・シークエンス(Seq2Seq)ベースの生成フレームワークはKEタスクで広く使われ、様々なベンチマークで競合性能を得た。
本稿では,この2つの問題を同時に解くために,動的グラフ畳み込みネットワーク(DGCN)を採用することを提案する。
論文 参考訳(メタデータ) (2020-10-24T08:11:23Z) - Evolution of Semantic Similarity -- A Survey [8.873705500708196]
自然言語処理(NLP)分野におけるテキストデータ間の意味的類似性の推定は困難かつオープンな研究課題である
この問題に対処するために、長年にわたって様々な意味的類似性手法が提案されてきた。
本稿では,知識ベース,コーパスベース,ディープニューラルネットワークベースの手法,ハイブリッド手法といった基本原則に基づいて,これらの手法の進化を追究する。
論文 参考訳(メタデータ) (2020-04-19T22:07:39Z) - How Far are We from Effective Context Modeling? An Exploratory Study on
Semantic Parsing in Context [59.13515950353125]
文法に基づく意味解析を行い,その上に典型的な文脈モデリング手法を適用する。
我々は,2つの大きなクロスドメインデータセットに対して,13のコンテキストモデリング手法を評価した。
論文 参考訳(メタデータ) (2020-02-03T11:28:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。