論文の概要: A Big Data Analytics System for Predicting Suicidal Ideation in Real-Time Based on Social Media Streaming Data
- arxiv url: http://arxiv.org/abs/2404.12394v1
- Date: Tue, 19 Mar 2024 21:46:52 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-01 11:58:46.125471
- Title: A Big Data Analytics System for Predicting Suicidal Ideation in Real-Time Based on Social Media Streaming Data
- Title(参考訳): ソーシャル・メディア・ストリーミング・データに基づくリアルタイムの適切な思考予測のためのビッグデータ分析システム
- Authors: Mohamed A. Allayla, Serkan Ayvaz,
- Abstract要約: 本稿では,ソーシャルメディアコンテンツからの自殺思考を予測するため,ビッグデータアーキテクチャに基づく新しい手法を提案する。
提案手法は、バッチ処理とリアルタイムストリーミング予測という2つのフェーズで、ソーシャルメディアデータの実用的な分析を提供する。
- 参考スコア(独自算出の注目度): 1.6574413179773761
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Online social media platforms have recently become integral to our society and daily routines. Every day, users worldwide spend a couple of hours on such platforms, expressing their sentiments and emotional state and contacting each other. Analyzing such huge amounts of data from these platforms can provide a clear insight into public sentiments and help detect their mental status. The early identification of these health condition risks may assist in preventing or reducing the number of suicide ideation and potentially saving people's lives. The traditional techniques have become ineffective in processing such streams and large-scale datasets. Therefore, the paper proposed a new methodology based on a big data architecture to predict suicidal ideation from social media content. The proposed approach provides a practical analysis of social media data in two phases: batch processing and real-time streaming prediction. The batch dataset was collected from the Reddit forum and used for model building and training, while streaming big data was extracted using Twitter streaming API and used for real-time prediction. After the raw data was preprocessed, the extracted features were fed to multiple Apache Spark ML classifiers: NB, LR, LinearSVC, DT, RF, and MLP. We conducted various experiments using various feature-extraction techniques with different testing scenarios. The experimental results of the batch processing phase showed that the features extracted of (Unigram + Bigram) + CV-IDF with MLP classifier provided high performance for classifying suicidal ideation, with an accuracy of 93.47%, and then applied for real-time streaming prediction phase.
- Abstract(参考訳): オンラインソーシャルメディアプラットフォームは、最近、私たちの社会や日々のルーチンに不可欠なものになっています。
世界中のユーザーは毎日、このようなプラットフォームに何時間も費やし、感情や感情の状態を表現し、お互いに連絡を取り合っている。
このような膨大なデータをこれらのプラットフォームから分析することで、世論の感情を明確に把握し、彼らの精神状態を検出することができる。
これらの健康状態のリスクを早期に特定することは、自殺のアイデアの数を予防したり減らしたり、人々の命を救ったりするのに役立ちます。
従来の手法は、ストリームや大規模なデータセットを処理するのに効果がない。
そこで本稿では,ソーシャルメディアコンテンツからの自殺思考を予測するため,ビッグデータアーキテクチャに基づく新たな手法を提案する。
提案手法は、バッチ処理とリアルタイムストリーミング予測という2つのフェーズで、ソーシャルメディアデータの実用的な分析を提供する。
バッチデータセットはRedditフォーラムから収集され、モデル構築とトレーニングに使用され、ビッグデータのストリーミングはTwitterストリーミングAPIを使用して抽出され、リアルタイム予測に使用された。
生データを前処理した後、抽出した機能は複数のApache Spark ML分類器(NB、LR、LinearSVC、DT、RF、MLP)に供給された。
様々なテストシナリオを用いて,様々な特徴抽出手法を用いて様々な実験を行った。
バッチ処理フェーズの実験結果から, (Unigram + Bigram) + CV-IDF と MLP の分類器を用いて抽出した特徴は, 93.47%の精度で自殺思考を分類し, リアルタイムストリーミング予測フェーズに適用できることを示した。
関連論文リスト
- Decoding the Silent Majority: Inducing Belief Augmented Social Graph
with Large Language Model for Response Forecasting [74.68371461260946]
SocialSenseは、既存のソーシャルネットワーク上に信念中心のグラフを誘導するフレームワークであり、グラフベースの伝播によって社会的ダイナミクスを捉える。
本手法は,ゼロショット設定と教師あり設定の両方に対する実験的な評価において,既存の最先端技術を超えている。
論文 参考訳(メタデータ) (2023-10-20T06:17:02Z) - Unsupervised Sentiment Analysis of Plastic Surgery Social Media Posts [91.3755431537592]
ソーシャルメディアプラットフォームにまたがる膨大なユーザー投稿は、主に人工知能(AI)のユースケースに使われていない。
自然言語処理(NLP)は、コーパス(corpora)として知られるドキュメントの体系を利用して、人間のような言語理解でコンピュータを訓練するAIのサブフィールドである。
本研究は, 教師なし解析の応用により, コンピュータがプラスティック手術に対する否定的, 肯定的, 中立的なユーザ感情を予測できることを示した。
論文 参考訳(メタデータ) (2023-07-05T20:16:20Z) - Early Warning Signals of Social Instabilities in Twitter Data [0.42816770420595307]
本研究では、ソーシャルメディア上でのみ公開されているデータを用いて、社会的に破壊的な事象に対する早期警戒信号を特定する新しい手法について研究する。
私たちは、あるツイートが破壊的なイベントと関連しているかどうかを予測するバイナリ分類器を構築します。
その結果, 永続段階のアプローチは, ディープラーニングに基づく異常検出アルゴリズムよりも安定であり, より高性能であることが示唆された。
論文 参考訳(メタデータ) (2023-03-03T11:18:02Z) - A Closer Look at Debiased Temporal Sentence Grounding in Videos:
Dataset, Metric, and Approach [53.727460222955266]
テンポラル・センテンス・グラウンディング・イン・ビデオ(TSGV)は、未編集のビデオに自然言語文を埋め込むことを目的としている。
最近の研究では、現在のベンチマークデータセットには明らかなモーメントアノテーションバイアスがあることが判明している。
偏りのあるデータセットによる膨らませ評価を緩和するため、基礎的リコールスコアを割引する新しい評価基準「dR@n,IoU@m」を導入する。
論文 参考訳(メタデータ) (2022-03-10T08:58:18Z) - Practical Challenges in Differentially-Private Federated Survival
Analysis of Medical Data [57.19441629270029]
本稿では,ニューラルネットワークの本質的特性を活用し,生存分析モデルの訓練過程を関連づける。
小さな医療データセットと少数のデータセンターの現実的な設定では、このノイズはモデルを収束させるのが難しくなります。
DPFed-post は,私的フェデレート学習方式に後処理の段階を追加する。
論文 参考訳(メタデータ) (2022-02-08T10:03:24Z) - An ensemble deep learning technique for detecting suicidal ideation from
posts in social media platforms [0.0]
本稿ではLSTM-Attention-CNN複合モデルを提案する。
提案されたモデルは90.3%の精度、F1スコア92.6%の精度を示した。
論文 参考訳(メタデータ) (2021-12-17T15:34:03Z) - Identification of Twitter Bots based on an Explainable ML Framework: the
US 2020 Elections Case Study [72.61531092316092]
本稿では,ラベル付きTwitterデータに基づくTwitterボット識別システムの設計に焦点をあてる。
Supervised Machine Learning (ML)フレームワークは、Extreme Gradient Boosting (XGBoost)アルゴリズムを用いて採用されている。
また、MLモデルの予測を説明するためにShapley Additive Explanations (SHAP)をデプロイした。
論文 参考訳(メタデータ) (2021-12-08T14:12:24Z) - HumAID: Human-Annotated Disaster Incidents Data from Twitter with Deep
Learning Benchmarks [5.937482215664902]
ソーシャルメディアのコンテンツは、どんなアプリケーションでも直接使うにはうるさい。
効果的な消費と意思決定を促進するために、利用可能なコンテンツをフィルタリング、分類、および簡潔に要約することが重要です。
19の災害イベントで2400万ツイートのプールから抽出された77万ツイートの大規模なデータセットを紹介します。
論文 参考訳(メタデータ) (2021-04-07T12:29:36Z) - Omni-supervised Facial Expression Recognition via Distilled Data [120.11782405714234]
ネットワークトレーニングにおいて,信頼度の高いサンプルを多量のラベルのないデータで活用するためのオムニ教師付き学習を提案する。
我々は,新しいデータセットが学習したFERモデルの能力を大幅に向上させることができることを実験的に検証した。
そこで本研究では,生成したデータセットを複数のクラスワイド画像に圧縮するために,データセット蒸留戦略を適用することを提案する。
論文 参考訳(メタデータ) (2020-05-18T09:36:51Z) - Ensemble Deep Learning on Time-Series Representation of Tweets for Rumor
Detection in Social Media [2.6514980627603006]
本稿では,Twitterデータの時系列ベクトル表現を用いて,深層ニューラルネットワークによる予測の集合に対して多数投票を行い,噂をタイムリーに検出するアンサンブルモデルを提案する。
実験結果から, マイクロF1スコアの分類性能は, ベースラインに比べて7.9%向上していることがわかった。
論文 参考訳(メタデータ) (2020-04-26T23:13:31Z) - Curating Social Media Data [0.0]
本稿では,ソーシャルデータのクリーン化とキュレーションを可能にするデータキュレーションパイプラインであるCrowdCorrectを提案する。
当社のパイプラインは,既存の社内ツールを使用してソーシャルメディアデータのコーパスから自動機能抽出を行う。
このパイプラインの実装には、生データをキュレートするクラウドユーザの貢献を促進するために、マイクロタスクを自動生成するツールセットも含まれている。
論文 参考訳(メタデータ) (2020-02-21T10:07:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。