論文の概要: Data Augmentation for Mental Health Classification on Social Media
- arxiv url: http://arxiv.org/abs/2112.10064v1
- Date: Sun, 19 Dec 2021 05:09:01 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-22 07:45:12.641254
- Title: Data Augmentation for Mental Health Classification on Social Media
- Title(参考訳): ソーシャルメディア上でのメンタルヘルス分類のためのデータ拡張
- Authors: Gunjan Ansari, Muskan Garg and Chandni Saxena
- Abstract要約: オンライン利用者の精神障害はソーシャルメディア投稿を用いて決定される。
この領域における大きな課題は、ソーシャルメディアプラットフォーム上でユーザーが生成したテキストを使用するための倫理的クリアランスを活用することである。
メンタルヘルス分類のためのドメイン固有ユーザ生成テキストに対するデータ拡張手法の効果について検討した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The mental disorder of online users is determined using social media posts.
The major challenge in this domain is to avail the ethical clearance for using
the user generated text on social media platforms. Academic re searchers
identified the problem of insufficient and unlabeled data for mental health
classification. To handle this issue, we have studied the effect of data
augmentation techniques on domain specific user generated text for mental
health classification. Among the existing well established data augmentation
techniques, we have identified Easy Data Augmentation (EDA), conditional BERT,
and Back Translation (BT) as the potential techniques for generating additional
text to improve the performance of classifiers. Further, three different
classifiers Random Forest (RF), Support Vector Machine (SVM) and Logistic
Regression (LR) are employed for analyzing the impact of data augmentation on
two publicly available social media datasets. The experiments mental results
show significant improvements in classifiers performance when trained on the
augmented data.
- Abstract(参考訳): オンラインユーザーの精神障害はソーシャルメディア投稿を用いて決定される。
このドメインにおける大きな課題は、ソーシャルメディアプラットフォームでユーザーが生成したテキストを使用する倫理的クリアランスを活用することである。
アカデミック・リサーチャーは、メンタルヘルス分類のための不十分でラベルのないデータの問題を特定した。
この問題に対処するため,我々は,メンタルヘルス分類のためのドメイン固有ユーザ生成テキストに対するデータ拡張手法の効果について検討した。
既存の高度に確立されたデータ拡張技術のうち,データ拡張 (eda) や条件付きbert,バック変換 (bt) は,分類器の性能を向上させるために追加テキストを生成する潜在的な技術である。
さらに、Random Forest(RF)、Support Vector Machine(SVM)、Logistic Regression(LR)の3つの異なる分類器を用いて、2つの公開ソーシャルメディアデータセットに対するデータ拡張の影響を分析する。
実験の結果, 拡張データを用いた学習では, 分類器の性能が有意に向上した。
関連論文リスト
- Reddit-Impacts: A Named Entity Recognition Dataset for Analyzing Clinical and Social Effects of Substance Use Derived from Social Media [6.138126219622993]
物質利用障害(SUD)は、データ駆動研究を通じて、問題とそのトレンドの理解を深める必要がある、世界的な関心事である。
ソーシャルメディアは、SUDに関するユニークな重要な情報源であり、特にそのような情報源のデータは、生きた経験を持つ人々によってしばしば生成されるためである。
本稿では,処方と違法なオピオイド,およびオピオイド使用障害の薬物に関する議論を専門とするサブレディットからキュレートされた,難解な名前付きエンティティ認識(NER)データセットであるReddit-Impactsを紹介する。
このデータセットは、研究の少ないが重要な、物質利用の側面に特に焦点を絞っている。
論文 参考訳(メタデータ) (2024-05-09T23:43:57Z) - Harnessing the Power of Hugging Face Transformers for Predicting Mental
Health Disorders in Social Networks [0.0]
本研究では、ユーザ生成データを用いて精神疾患の症状を予測する方法について検討する。
本研究は,Hugging Faceの4種類のBERTモデルと標準的な機械学習技術を比較した。
新しいモデルは、最大97%の精度で以前のアプローチより優れている。
論文 参考訳(メタデータ) (2023-06-29T12:25:19Z) - An Annotated Dataset for Explainable Interpersonal Risk Factors of
Mental Disturbance in Social Media Posts [0.0]
ソーシャルメディア上での精神障害に影響を及ぼす人為的リスクファクター(IRF)の分類と説明を伴う注釈付きデータセットの構築とリリースを行う。
我々は,TBeとPBuのパターンをユーザの歴史的ソーシャルメディアプロファイルの感情スペクトルで検出することにより,将来的な研究方向のベースラインモデルを構築し,リアルタイムなパーソナライズされたAIモデルを開発する。
論文 参考訳(メタデータ) (2023-05-30T04:08:40Z) - A Pretrainer's Guide to Training Data: Measuring the Effects of Data
Age, Domain Coverage, Quality, & Toxicity [84.6421260559093]
この研究は、テキスト事前学習に関する文書化されていない直観を検証、定量化、公開するための最大の実験である。
以上の結果から,トレーニングデータをフィルタリングする一大ソリューションが存在しないことが示唆された。
論文 参考訳(メタデータ) (2023-05-22T15:57:53Z) - Advanced Data Augmentation Approaches: A Comprehensive Survey and Future
directions [57.30984060215482]
データ拡張の背景、レビューされたデータ拡張技術の新しい包括的分類法、および各技術の強さと弱点(可能ならば)を提供する。
また、画像分類、オブジェクト検出、セマンティックセグメンテーションなどの3つの一般的なコンピュータビジョンタスクに対して、データ拡張効果の総合的な結果を提供する。
論文 参考訳(メタデータ) (2023-01-07T11:37:32Z) - Causal Categorization of Mental Health Posts using Transformers [0.0]
既存のメンタルヘルス分析研究は、ソーシャルメディアに対するユーザの意図を分類するために、横断的な研究を中心に展開されている。
詳細な分析では,因果分類の問題を解くために既存の分類器について検討する。
本研究では, トランスフォーマーモデルを用いて, トレーニング済みのトランスファー学習の有効性を「CAMS」データセット上で実証する。
論文 参考訳(メタデータ) (2023-01-06T16:37:48Z) - On-the-fly Denoising for Data Augmentation in Natural Language
Understanding [101.46848743193358]
よりクリーンなオリジナルデータに基づいて訓練された有機教師モデルによって提供されるソフトな拡張ラベルから学習する,データ拡張のためのオンザフライデノケーション手法を提案する。
本手法は,一般的な拡張手法に適用でき,テキスト分類と質問応答の両タスクの性能を一貫して向上させることができる。
論文 参考訳(メタデータ) (2022-12-20T18:58:33Z) - Semantic Similarity Models for Depression Severity Estimation [53.72188878602294]
本稿では、ソーシャルメディアの文章に基づいて、個人のうつ病の重症度を研究するための効率的なセマンティックパイプラインを提案する。
我々は,抑うつ症状と重度レベルに対応する代表訓練文の指標に対して意味的ランキングを生成するために,テストユーザ文を使用する。
本手法を2つのRedditベースのベンチマークで評価し,うつ病の重症度を指標として,最先端技術よりも30%改善した。
論文 参考訳(メタデータ) (2022-11-14T18:47:26Z) - Cluster-level pseudo-labelling for source-free cross-domain facial
expression recognition [94.56304526014875]
表情認識のためのSFUDA法を提案する。
本手法は,自己教師付き事前学習を利用して,対象データから優れた特徴表現を学習する。
提案手法の有効性を4つの適応方式で検証し,FERに適用した場合,既存のSFUDA法より一貫して優れていることを示す。
論文 参考訳(メタデータ) (2022-10-11T08:24:50Z) - Named Entity Recognition for Social Media Texts with Semantic
Augmentation [70.44281443975554]
名前付きエンティティ認識のための既存のアプローチは、短いテキストと非公式テキストで実行される場合、データ空間の問題に悩まされる。
そこで我々は,NER によるソーシャルメディアテキストに対するニューラルベースアプローチを提案し,ローカルテキストと拡張セマンティクスの両方を考慮に入れた。
論文 参考訳(メタデータ) (2020-10-29T10:06:46Z) - A little goes a long way: Improving toxic language classification
despite data scarcity [13.21611612938414]
いくつかの有害言語の検出は、ラベル付きトレーニングデータの極端な不足によって妨げられる。
データ拡張 - ラベル付きシードデータセットから新しい合成データを生成することで、助けになる。
本稿では,有毒な言語分類器間でのデータ拡張技術がパフォーマンスに与える影響について,最初の系統的研究を行う。
論文 参考訳(メタデータ) (2020-09-25T17:04:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。