論文の概要: A Machine Learning Approach for Detection of Mental Health Conditions and Cyberbullying from Social Media
- arxiv url: http://arxiv.org/abs/2511.20001v2
- Date: Mon, 01 Dec 2025 11:07:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 15:37:38.323469
- Title: A Machine Learning Approach for Detection of Mental Health Conditions and Cyberbullying from Social Media
- Title(参考訳): ソーシャルメディアからのメンタルヘルス状態とサイバーバブル検出のための機械学習アプローチ
- Authors: Edward Ajayi, Martha Kachweka, Mawuli Deku, Emily Aiken,
- Abstract要約: メンタルヘルスの課題とサイバーいじめは、デジタル空間でますます広まっている。
本稿では、ソーシャルメディアデータから10種類のメンタルヘルスとサイバーいじめのカテゴリを検出するための統合型マルチクラス分類フレームワークを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Mental health challenges and cyberbullying are increasingly prevalent in digital spaces, necessitating scalable and interpretable detection systems. This paper introduces a unified multiclass classification framework for detecting ten distinct mental health and cyberbullying categories from social media data. We curate datasets from Twitter and Reddit, implementing a rigorous "split-then-balance" pipeline to train on balanced data while evaluating on a realistic, held-out imbalanced test set. We conducted a comprehensive evaluation comparing traditional lexical models, hybrid approaches, and several end-to-end fine-tuned transformers. Our results demonstrate that end-to-end fine-tuning is critical for performance, with the domain-adapted MentalBERT emerging as the top model, achieving an accuracy of 0.92 and a Macro F1 score of 0.76, surpassing both its generic counterpart and a zero-shot LLM baseline. Grounded in a comprehensive ethical analysis, we frame the system as a human-in-the-loop screening aid, not a diagnostic tool. To support this, we introduce a hybrid SHAPLLM explainability framework and present a prototype dashboard ("Social Media Screener") designed to integrate model predictions and their explanations into a practical workflow for moderators. Our work provides a robust baseline, highlighting future needs for multi-label, clinically-validated datasets at the critical intersection of online safety and computational mental health.
- Abstract(参考訳): メンタルヘルスの課題やサイバーいじめは、デジタル空間でますます広まり、スケーラブルで解釈可能な検知システムを必要としている。
本稿では、ソーシャルメディアデータから10種類のメンタルヘルスとサイバーいじめのカテゴリを検出するための統合型マルチクラス分類フレームワークを提案する。
TwitterとRedditのデータセットをキュレートし、厳格な"スプリット・ザ・バランス"パイプラインを実装して、バランスのとれたデータでトレーニングし、現実的でホールドアウトのアンバランスなテストセットを評価します。
従来の語彙モデル,ハイブリッドアプローチ,およびいくつかのエンドツーエンド微調整変換器を比較し,総合的な評価を行った。
この結果から,ドメイン適応型MentalBERTが最上位モデルとして登場し,マクロF1スコアが0.92,マクロF1スコアが0.76となり,汎用とゼロショットのLCMベースラインを上回り,エンド・ツー・エンドの微調整が性能上重要であることが示された。
包括的倫理的分析に基づいて、我々はこのシステムを診断ツールではなく、人間によるループ内スクリーニング支援とみなした。
これを支援するために,ハイブリッドSHAPLLM説明可能性フレームワークを導入し,モデル予測とその説明をモデレータの実用的なワークフローに統合するプロトタイプダッシュボード(Social Media Screener)を提案する。
私たちの研究は堅牢なベースラインを提供し、オンラインの安全と計算的メンタルヘルスの重要な交差点において、多ラベルで臨床的に検証されたデータセットの将来的なニーズを強調します。
関連論文リスト
- Mental Multi-class Classification on Social Media: Benchmarking Transformer Architectures against LSTM Models [7.464241214592479]
本稿では,精神保健ポストを分類するために,LSTM(Long Short-Term Memory)モデルと最先端トランスフォーマーの比較を行った。
まず、厳密なフィルタリングと統計的探索分析を用いて、6つのメンタルヘルス状態とコントロールグループにまたがるReddit投稿の大規模なデータセットをキュレートし、アノテーションの品質を保証する。
実験結果から, トランスフォーマーモデルは, 全クラスで91-99%のF1スコアとアキュラシーを達成した。
論文 参考訳(メタデータ) (2025-09-20T05:41:59Z) - Advancing Mental Disorder Detection: A Comparative Evaluation of Transformer and LSTM Architectures on Social Media [0.16385815610837165]
本研究では,Long Short-Term Memory (LSTM) に基づくアプローチに対して,最先端のトランスフォーマーモデルの総合評価を行う。
Redditのメンタルヘルス障害分類のためのテキスト埋め込み技術を用いて,大規模な注釈付きデータセットを構築した。
実験により,従来のディープラーニングモデルよりもトランスフォーマーモデルの方が優れた性能を示した。
論文 参考訳(メタデータ) (2025-07-17T04:58:31Z) - Latent Space Data Fusion Outperforms Early Fusion in Multimodal Mental Health Digital Phenotyping Data [0.0]
うつ病や不安などの精神疾患は早期発見とパーソナライズされた介入の方法を改善する必要がある。
従来の予測モデルは、精神医学的なデータの複雑なマルチモーダルな性質を捉えるのに失敗する、単調なデータや初期の融合戦略に依存していることが多い。
日常的なうつ症状の予測のための中間的(相対的空間)核融合の評価を行った。
論文 参考訳(メタデータ) (2025-07-10T18:10:46Z) - MoodAngels: A Retrieval-augmented Multi-agent Framework for Psychiatry Diagnosis [58.67342568632529]
MoodAngelsは、気分障害の診断のための最初の特殊なマルチエージェントフレームワークである。
MoodSynは、合成精神医学の1,173件のオープンソースデータセットである。
論文 参考訳(メタデータ) (2025-06-04T09:18:25Z) - Leveraging Embedding Techniques in Multimodal Machine Learning for Mental Illness Assessment [0.8458496687170665]
うつ病やPTSDなどの精神疾患の世界的な流行は、客観的でスケーラブルな診断ツールを必要とする。
本稿では、テキスト、音声、ビデオデータに相補的な情報を活用することで、これらの課題に対処するためのマルチモーダル機械学習の可能性を検討する。
大規模言語モデル予測の新たな統合を含む,データレベル,機能レベル,意思決定レベルの融合技術について検討する。
論文 参考訳(メタデータ) (2025-04-02T14:19:06Z) - Early Detection of Mental Health Issues Using Social Media Posts [0.0]
Redditのようなソーシャルメディアプラットフォームは、ユーザー生成コンテンツの豊富なソースを表している。
メンタルヘルス危機の早期発見に言語的特徴と時間的特徴を統合したマルチモーダルディープラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-06T23:08:08Z) - LlaMADRS: Prompting Large Language Models for Interview-Based Depression Assessment [75.44934940580112]
LlaMADRSは、オープンソースのLarge Language Models(LLM)を利用して、うつ病の重症度評価を自動化する新しいフレームワークである。
本研究は,クリニカルインタヴューの解釈・スコアリングにおけるモデル指導のために,慎重に設計された手がかりを用いたゼロショットプロンプト戦略を用いている。
実世界における236件のインタビューを対象とし,臨床評価と強い相関性を示した。
論文 参考訳(メタデータ) (2025-01-07T08:49:04Z) - Differentiable Agent-based Epidemiology [71.81552021144589]
GradABM(GradABM)は、エージェントベースのモデリングのためのスケーラブルで微分可能な設計で、勾配に基づく学習と自動微分が可能である。
GradABMは、コモディティハードウェア上で数秒で数百万の人口をシミュレートし、ディープニューラルネットワークと統合し、異種データソースを取り込みます。
論文 参考訳(メタデータ) (2022-07-20T07:32:02Z) - Dynamic Bank Learning for Semi-supervised Federated Image Diagnosis with
Class Imbalance [65.61909544178603]
クラス不均衡半教師付きFL(imFed-Semi)の実用的かつ困難な問題について検討する。
このImFed-Semi問題は、クラス比例情報を利用してクライアントトレーニングを改善する新しい動的銀行学習方式によって解決される。
25,000個のCTスライスによる頭蓋内出血診断と10,015個の皮膚内視鏡画像による皮膚病変診断の2つの公開実世界の医療データセットに対するアプローチを評価した。
論文 参考訳(メタデータ) (2022-06-27T06:51:48Z) - Estimating and Improving Fairness with Adversarial Learning [65.99330614802388]
本研究では,深層学習に基づく医療画像解析システムにおけるバイアスの同時緩和と検出を目的としたマルチタスク・トレーニング戦略を提案する。
具体的には,バイアスに対する識別モジュールと,ベース分類モデルにおける不公平性を予測するクリティカルモジュールを追加することを提案する。
大規模で利用可能な皮膚病変データセットのフレームワークを評価します。
論文 参考訳(メタデータ) (2021-03-07T03:10:32Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。