論文の概要: A Framework for Pre-processing of Social Media Feeds based on Integrated
Local Knowledge Base
- arxiv url: http://arxiv.org/abs/2006.15854v1
- Date: Mon, 29 Jun 2020 07:56:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-15 14:30:02.191944
- Title: A Framework for Pre-processing of Social Media Feeds based on Integrated
Local Knowledge Base
- Title(参考訳): 統合的ローカル知識ベースに基づくソーシャルメディアフィードの事前処理フレームワーク
- Authors: Taiwo Kolajo, Olawande Daramola, Ayodele Adebiyi, Seth Aaditeshwar
- Abstract要約: 本稿では,ソーシャルメディアフィードの事前処理によるパフォーマンス向上のためのフレームワークを提案する。
このフレームワークは、標準化されたデータセットで94.07%、ツイートから感情を抽出する際には、局所化されたデータセットで99.78%の精度を持っていた。
- 参考スコア(独自算出の注目度): 1.5749416770494706
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Most of the previous studies on the semantic analysis of social media feeds
have not considered the issue of ambiguity that is associated with slangs,
abbreviations, and acronyms that are embedded in social media posts. These
noisy terms have implicit meanings and form part of the rich semantic context
that must be analysed to gain complete insights from social media feeds. This
paper proposes an improved framework for pre-processing of social media feeds
for better performance. To do this, the use of an integrated knowledge base
(ikb) which comprises a local knowledge source (Naijalingo), urban dictionary
and internet slang was combined with the adapted Lesk algorithm to facilitate
semantic analysis of social media feeds. Experimental results showed that the
proposed approach performed better than existing methods when it was tested on
three machine learning models, which are support vector machines, multilayer
perceptron, and convolutional neural networks. The framework had an accuracy of
94.07% on a standardized dataset, and 99.78% on localised dataset when used to
extract sentiments from tweets. The improved performance on the localised
dataset reveals the advantage of integrating the use of local knowledge sources
into the process of analysing social media feeds particularly in interpreting
slangs/acronyms/abbreviations that have contextually rooted meanings.
- Abstract(参考訳): ソーシャルメディアフィードの意味分析に関するこれまでの研究のほとんどは、ソーシャルメディア投稿に埋め込まれたスラング、略語、頭字語に関連する曖昧性の問題を考慮していない。
これらの騒がしい用語は暗黙的な意味を持ち、ソーシャルメディアのフィードから完全な洞察を得るために分析されなければならないリッチな意味的文脈の一部を形成する。
本稿では,ソーシャルメディアフィードの事前処理によるパフォーマンス向上のためのフレームワークを提案する。
これを実現するために,地域知識源(naijalingo),都市辞書,インターネットスラングを含む統合知識ベース(ikb)を,ソーシャルメディアフィードの意味分析を容易にするためにleskアルゴリズムと組み合わせた。
実験の結果,提案手法は,ベクトルマシン,多層パーセプトロン,畳み込みニューラルネットワークをサポートする3つの機械学習モデルにおいて,既存の手法よりも優れた性能を示した。
このフレームワークは、標準データセットで94.07%、ツイートから感情を抽出するために使用されるローカライズされたデータセットで99.78%の精度を持っていた。
局所化データセットの性能向上は、特に文脈的に根付いた意味を持つスラング/アクロニム/省略を解釈する際に、ローカル知識ソースの使用をソーシャルメディアフィードの分析プロセスに統合する利点を明らかにする。
関連論文リスト
- Text-Video Retrieval with Global-Local Semantic Consistent Learning [122.15339128463715]
我々は,シンプルで効果的なグローバル局所意味的一貫性学習(GLSCL)を提案する。
GLSCLは、テキストビデオ検索のためのモダリティをまたいだ潜在共有セマンティクスを活用する。
本手法はSOTAと同等の性能を実現し,計算コストの約220倍の高速化を実現している。
論文 参考訳(メタデータ) (2024-05-21T11:59:36Z) - Informed Meta-Learning [55.2480439325792]
メタラーニングとインシデントMLは、事前知識をMLパイプラインに組み込むための2つのアプローチとして際立っている。
我々は,非構造化知識表現からの事前の取り込みを容易にする,情報メタラーニングというハイブリッドパラダイムを定式化する。
データ効率、観測ノイズに対する堅牢性、タスク分散シフトを改善する上で、情報メタラーニングの潜在的な利点を実証する。
論文 参考訳(メタデータ) (2024-02-25T15:08:37Z) - HICL: Hashtag-Driven In-Context Learning for Social Media Natural
Language Understanding [15.743523533234224]
本稿では,ソーシャルメディア上での自然言語理解のための新しいハッシュタグ駆動型インコンテキスト学習フレームワークを提案する。
我々の目標は、モデル#Encoderがトピック関連セマンティック情報を組み込むことで、トピック関連投稿を検索できるようにすることである。
In-context NLUベンチマークを作成するために4500万のつぶやきを収集し、7つの下流タスクの実験結果から、HICLは過去の最先端の成果を大幅に向上することが示された。
論文 参考訳(メタデータ) (2023-08-19T11:31:45Z) - Unsupervised Sentiment Analysis of Plastic Surgery Social Media Posts [91.3755431537592]
ソーシャルメディアプラットフォームにまたがる膨大なユーザー投稿は、主に人工知能(AI)のユースケースに使われていない。
自然言語処理(NLP)は、コーパス(corpora)として知られるドキュメントの体系を利用して、人間のような言語理解でコンピュータを訓練するAIのサブフィールドである。
本研究は, 教師なし解析の応用により, コンピュータがプラスティック手術に対する否定的, 肯定的, 中立的なユーザ感情を予測できることを示した。
論文 参考訳(メタデータ) (2023-07-05T20:16:20Z) - Comparative Study of Sentiment Analysis for Multi-Sourced Social Media
Platforms [0.0]
本稿では,レキシコンベース,機械学習,ディープラーニングの手法を用いた比較分析を行う。
私たちが使ったデータセットは、TwitterやRedditなど、さまざまなソーシャルネットワークサイトのコメントセクションからのマルチソースデータセットでした。
論文 参考訳(メタデータ) (2022-12-09T06:33:49Z) - Contextual information integration for stance detection via
cross-attention [59.662413798388485]
スタンス検出は、著者の目標に対する姿勢を特定することを扱う。
既存のスタンス検出モデルの多くは、関連するコンテキスト情報を考慮していないため、制限されている。
文脈情報をテキストとして統合する手法を提案する。
論文 参考訳(メタデータ) (2022-11-03T15:04:29Z) - Data Expansion using Back Translation and Paraphrasing for Hate Speech
Detection [1.192436948211501]
本稿では,バック翻訳手法を融合した新しい深層学習手法と,データ拡張のためのパラフレージング手法を提案する。
AskFm corpus, Formspring データセット, Warner と Waseem データセット, Olid および Wikipedia の有毒なコメントデータセットである。
論文 参考訳(メタデータ) (2021-05-25T09:52:42Z) - Named Entity Recognition for Social Media Texts with Semantic
Augmentation [70.44281443975554]
名前付きエンティティ認識のための既存のアプローチは、短いテキストと非公式テキストで実行される場合、データ空間の問題に悩まされる。
そこで我々は,NER によるソーシャルメディアテキストに対するニューラルベースアプローチを提案し,ローカルテキストと拡張セマンティクスの両方を考慮に入れた。
論文 参考訳(メタデータ) (2020-10-29T10:06:46Z) - Meta-Learning with Context-Agnostic Initialisations [86.47040878540139]
メタ学習プロセスにコンテキスト・逆成分を導入する。
これにより、コンテキストに依存しないタスクを一般化したターゲットへの微調整の初期化が実現される。
我々は,3つのメタ学習アルゴリズムと2つの問題に対するアプローチを評価した。
論文 参考訳(メタデータ) (2020-07-29T08:08:38Z) - Convolutional Neural Networks for Sentiment Analysis in Persian Social
Media [6.51882364384472]
畳み込みニューラルネットワーク(CNN)を用いたペルシア語テキストの感情分析手法を提案する。
本研究では,Curve 測定値を用いた3種類のペルシア語ソーシャルメディアテキストのデータセットの評価を行った。
論文 参考訳(メタデータ) (2020-02-14T19:52:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。