論文の概要: Real-time stress detection on social network posts using big data technology
- arxiv url: http://arxiv.org/abs/2411.04532v1
- Date: Thu, 07 Nov 2024 08:41:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-08 19:38:00.031285
- Title: Real-time stress detection on social network posts using big data technology
- Title(参考訳): ビッグデータ技術を用いたソーシャルネットワーク投稿のリアルタイムストレス検出
- Authors: Hai-Yen Phan Nguyen, Phi-Lan Ly, Duc-Manh Le, Trong-Hop Do,
- Abstract要約: Dreaddit: A Reddit dataset for Stress Analysis in Social Media" を用いて,オンライン投稿におけるストレス検出のリアルタイムシステムを開発した。
トレーニングには3,553行のラベル付きデータセットが作成された。モデルの構築とデプロイにはApache Kafka、PySpark、AirFlowが使用されている。
ロジスティック回帰は新たなストリーミングデータに対して最高の結果となり、精度は69,39%、F1スコアは68,97となった。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: In the context of modern life, particularly in Industry 4.0 within the online space, emotions and moods are frequently conveyed through social media posts. The trend of sharing stories, thoughts, and feelings on these platforms generates a vast and promising data source for Big Data. This creates both a challenge and an opportunity for research in applying technology to develop more automated and accurate methods for detecting stress in social media users. In this study, we developed a real-time system for stress detection in online posts, using the "Dreaddit: A Reddit Dataset for Stress Analysis in Social Media," which comprises 187,444 posts across five different Reddit domains. Each domain contains texts with both stressful and non-stressful content, showcasing various expressions of stress. A labeled dataset of 3,553 lines was created for training. Apache Kafka, PySpark, and AirFlow were utilized to build and deploy the model. Logistic Regression yielded the best results for new streaming data, achieving 69,39% for measuring accuracy and 68,97 for measuring F1-scores.
- Abstract(参考訳): 現代の生活、特にオンライン空間における産業4.0の文脈では、感情や気分はソーシャルメディアの投稿を通じて頻繁に伝えられる。
これらのプラットフォーム上でストーリや考え,感情を共有する傾向は,ビッグデータのための巨大で有望なデータソースを生み出します。
これにより、ソーシャルメディア利用者のストレスを検出するための、より自動化され、正確な方法を開発するための技術研究の課題と機会が生まれる。
本研究では,5つのRedditドメインにまたがる187,444の投稿からなる「Dreaddit: A Reddit Dataset for Stress Analysis in Social Media」を用いて,オンライン投稿におけるストレス検出のためのリアルタイムシステムを開発した。
各ドメインには、ストレスのある内容とストレスのない内容の両方のテキストが含まれており、様々なストレスの表現を示している。
トレーニング用にラベル付き3,553行のデータセットが作成された。
Apache Kafka、PySpark、AirFlowがモデルの構築とデプロイに使用された。
ロジスティック回帰は新たなストリーミングデータに対して最高の結果となり、精度は69,39%、F1スコアは68,97となった。
関連論文リスト
- A Big Data Analytics System for Predicting Suicidal Ideation in Real-Time Based on Social Media Streaming Data [1.6574413179773761]
本稿では,ソーシャルメディアコンテンツからの自殺思考を予測するため,ビッグデータアーキテクチャに基づく新しい手法を提案する。
提案手法は、バッチ処理とリアルタイムストリーミング予測という2つのフェーズで、ソーシャルメディアデータの実用的な分析を提供する。
論文 参考訳(メタデータ) (2024-03-19T21:46:52Z) - Detection and Analysis of Stress-Related Posts in Reddit Acamedic
Communities [0.0]
本研究は,Reddit学術コミュニティにおけるストレス関連投稿の検出と分析に焦点をあてる。
テキストは、自然言語処理と機械学習分類器を用いて、強調されているか、そうでないかを分類する。
重要な発見は、Redditの教授コミュニティにおける投稿やコメントが最もストレスが強いことを示している。
論文 参考訳(メタデータ) (2023-12-02T07:34:03Z) - Data Augmentation for Emotion Detection in Small Imbalanced Text Data [0.0]
課題の1つは、感情で注釈付けされた利用可能なデータセットが不足していることだ。
我々は、小さな不均衡なデータセットに適用した場合に、データ拡張技術が与える影響を正確に調査した。
実験結果から,分類器モデルの訓練に拡張データを用いることで,大幅な改善が得られた。
論文 参考訳(メタデータ) (2023-10-25T21:29:36Z) - Decoding the Silent Majority: Inducing Belief Augmented Social Graph
with Large Language Model for Response Forecasting [74.68371461260946]
SocialSenseは、既存のソーシャルネットワーク上に信念中心のグラフを誘導するフレームワークであり、グラフベースの伝播によって社会的ダイナミクスを捉える。
本手法は,ゼロショット設定と教師あり設定の両方に対する実験的な評価において,既存の最先端技術を超えている。
論文 参考訳(メタデータ) (2023-10-20T06:17:02Z) - Understanding writing style in social media with a supervised
contrastively pre-trained transformer [57.48690310135374]
オンラインソーシャルネットワークは、ヘイトスピーチから偽情報の拡散まで、有害な行動の場として機能している。
本稿では, 4.5 x 106テキストの公開資料から得られた大規模コーパスに基づいて学習したStyle Transformer for Authorship Representations (STAR)を紹介する。
512個のトークンからなる8つのドキュメントからなるサポートベースを使用して、著者を最大1616人の著者のセットから、少なくとも80%の精度で識別することができる。
論文 参考訳(メタデータ) (2023-10-17T09:01:17Z) - ManiTweet: A New Benchmark for Identifying Manipulation of News on Social Media [74.93847489218008]
ソーシャルメディア上でのニュースの操作を識別し,ソーシャルメディア投稿の操作を検出し,操作された情報や挿入された情報を特定することを目的とした,新しいタスクを提案する。
この課題を研究するために,データ収集スキーマを提案し,3.6K対のツイートとそれに対応する記事からなるManiTweetと呼ばれるデータセットをキュレートした。
我々の分析では、このタスクは非常に難しいことを示し、大きな言語モデル(LLM)は不満足なパフォーマンスをもたらす。
論文 参考訳(メタデータ) (2023-05-23T16:40:07Z) - Harnessing the Power of Text-image Contrastive Models for Automatic
Detection of Online Misinformation [50.46219766161111]
誤情報識別の領域における構成的学習を探求する自己学習モデルを構築した。
本モデルでは、トレーニングデータが不十分な場合、非マッチング画像-テキストペア検出の優れた性能を示す。
論文 参考訳(メタデータ) (2023-04-19T02:53:59Z) - ForDigitStress: A multi-modal stress dataset employing a digital job
interview scenario [48.781127275906435]
本稿では,デジタル面接を利用してストレスを誘発するマルチモーダルストレスデータセットを提案する。
このデータセットは、オーディオ、ビデオ、生理情報を含む40人の参加者のマルチモーダルデータを提供する。
ベースラインを確立するために、5つの異なる機械学習分類器が訓練され、評価されている。
論文 参考訳(メタデータ) (2023-03-14T09:40:37Z) - Validating daily social media macroscopes of emotions [0.12656629989060433]
われわれはオンライン新聞で大規模な調査を行い、ユーザーから毎日の情緒的状態の自己報告を収集した。
同じオンラインプラットフォーム上でのユーザディスカッションの感情分析の結果と比較した。
両プラットフォームにおいて,テキスト分析結果と自己報告感情のレベルとの間には強い相関関係が認められた。
論文 参考訳(メタデータ) (2021-08-17T14:28:56Z) - Human Trajectory Forecasting in Crowds: A Deep Learning Perspective [89.4600982169]
本稿では,既存の深層学習に基づくソーシャルインタラクションのモデル化手法について詳細に分析する。
本稿では、これらの社会的相互作用を効果的に捉えるための知識に基づく2つのデータ駆動手法を提案する。
我々は,人間の軌道予測分野において,重要かつ欠落したコンポーネントであるTrajNet++を大規模に開発する。
論文 参考訳(メタデータ) (2020-07-07T17:19:56Z) - News Sentiment Analysis [0.0]
本稿では,レキシコンを用いたニュース記事の感情分析手法を提案する。
この実験はBBCのニュースデータセットで実施されており、採用されたアプローチの適用性と妥当性を示している。
論文 参考訳(メタデータ) (2020-07-05T05:15:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。