論文の概要: Suicide Risk Assessment on Social Media with Semi-Supervised Learning
- arxiv url: http://arxiv.org/abs/2411.12767v1
- Date: Mon, 18 Nov 2024 02:43:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-21 16:13:05.594454
- Title: Suicide Risk Assessment on Social Media with Semi-Supervised Learning
- Title(参考訳): 半監督学習によるソーシャルメディアの自殺リスク評価
- Authors: Max Lovitt, Haotian Ma, Song Wang, Yifan Peng,
- Abstract要約: ラベル付きおよびラベルなしデータを活用する半教師付きフレームワークを提案する。
擬似ラベル生成の複数の試行において一括して予測されなかった擬似ラベルデータのサブセットを手動で検証する。
本研究は,一部検証済み擬似ラベル付きデータに加えて,地味ラベル付きデータを活用することで,ソーシャルメディア投稿から自殺リスクを評価する能力を大幅に向上する。
- 参考スコア(独自算出の注目度): 20.193174124912282
- License:
- Abstract: With social media communities increasingly becoming places where suicidal individuals post and congregate, natural language processing presents an exciting avenue for the development of automated suicide risk assessment systems. However, past efforts suffer from a lack of labeled data and class imbalances within the available labeled data. To accommodate this task's imperfect data landscape, we propose a semi-supervised framework that leverages labeled (n=500) and unlabeled (n=1,500) data and expands upon the self-training algorithm with a novel pseudo-label acquisition process designed to handle imbalanced datasets. To further ensure pseudo-label quality, we manually verify a subset of the pseudo-labeled data that was not predicted unanimously across multiple trials of pseudo-label generation. We test various models to serve as the backbone for this framework, ultimately deciding that RoBERTa performs the best. Ultimately, by leveraging partially validated pseudo-labeled data in addition to ground-truth labeled data, we substantially improve our model's ability to assess suicide risk from social media posts.
- Abstract(参考訳): ソーシャルメディアのコミュニティが自殺の個人が投稿し、集まる場所になりつつある中、自然言語処理は自動自殺リスク評価システムの開発にエキサイティングな道のりを呈している。
しかし、過去の努力はラベル付きデータの欠如と、利用可能なラベル付きデータ内のクラス不均衡に悩まされていた。
そこで本研究では,ラベル付き(n=500),ラベルなし(n=1500)データを活用する半教師付きフレームワークを提案する。
さらに擬似ラベルの品質を確保するため、擬似ラベル生成の複数の試行において一様に予測されなかった擬似ラベルデータのサブセットを手作業で検証する。
私たちは様々なモデルをテストして、このフレームワークのバックボーンとして機能させ、最終的にRoBERTaが最高であると判断した。
最終的に、部分的に検証された擬似ラベル付きデータに加えて、地味ラベル付きデータを活用することにより、ソーシャルメディア投稿から自殺リスクを評価する能力を大幅に改善する。
関連論文リスト
- Fair-OBNC: Correcting Label Noise for Fairer Datasets [9.427445881721814]
トレーニングデータのバイアスは ラベルノイズと関連しています
このようなバイアスデータに基づいてトレーニングされたモデルは、センシティブな情報に関してバイアスを永続的に、あるいは悪化させる可能性がある。
公平性を考慮したラベルノイズ補正法であるFair-OBNCを提案する。
論文 参考訳(メタデータ) (2024-10-08T17:18:18Z) - Soft Curriculum for Learning Conditional GANs with Noisy-Labeled and
Uncurated Unlabeled Data [70.25049762295193]
本稿では,トレーニング中にノイズラベル付きおよび未処理データを受け入れる条件付き画像生成フレームワークを提案する。
本稿では,ラベルのないデータに新たなラベルを割り当てながら,逆行訓練にインスタンスワイドを割り当てるソフトカリキュラム学習を提案する。
実験により,本手法は,定量および定性性能の両面において,既存の半教師付き・ラベル付きロバストな手法より優れていることが示された。
論文 参考訳(メタデータ) (2023-07-17T08:31:59Z) - Label Matching Semi-Supervised Object Detection [85.99282969977541]
半教師対象検出は,教師主導型自己学習の開発において大きな進歩を遂げている。
ラベルミスマッチ問題は、以前の研究でまだ完全に解明されていないため、自己学習中に重大な確証バイアスが生じる。
本稿では,2つの異なる相補的視点から,単純かつ効果的な LabelMatch フレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-14T05:59:41Z) - Construction of Large-Scale Misinformation Labeled Datasets from Social
Media Discourse using Label Refinement [16.754951815543006]
我々は、ソーシャルメディア投稿の弱いラベルとして、ニュースソースの信頼性ラベルを活用することを提案する。
このフレームワークは、投稿の社会的コンテキストを、関連ユーザのコミュニティの言葉で、不正確なラベルを提示する。
このアプローチは、新型コロナウイルスワクチンに関する大規模な誤情報データセットを提供するために実証されている。
論文 参考訳(メタデータ) (2022-02-24T23:10:29Z) - Debiased Learning from Naturally Imbalanced Pseudo-Labels for Zero-Shot
and Semi-Supervised Learning [27.770473405635585]
この研究は、疑似ラベルのバイアス問題を研究する。これは、広く起こるが、しばしば先行研究によって見落とされがちな自然現象である。
半教師付き学習モデルであるFixMatchは、ラベルなしデータを計算したとしても、ラベルなし集合上のラベルを予測したとき、重く長い尾の擬似ラベルを観察する。
介入なしに、トレーニングモデルは擬似ラベルからバイアスを継承し、最終的には準最適となる。
論文 参考訳(メタデータ) (2022-01-05T07:40:24Z) - Uncertainty-aware Mean Teacher for Source-free Unsupervised Domain
Adaptive 3D Object Detection [6.345037597566315]
擬似ラベルに基づく自己学習アプローチは、ソースフリーな教師なしドメイン適応の一般的な方法である。
本研究では,学習中に誤字を暗黙的にフィルタリングする不確実性認識型平均教師フレームワークを提案する。
論文 参考訳(メタデータ) (2021-09-29T18:17:09Z) - Boosting Semi-Supervised Face Recognition with Noise Robustness [54.342992887966616]
本稿では,自動ラベルによるラベル雑音に対して頑健な半教師付き顔認識に対する効果的な解法を提案する。
そこで我々は,gnが強化するロバストな学習能力に基づく,ノイズロバスト学習ラベリング(nroll)という,半教師付き顔認識ソリューションを開発した。
論文 参考訳(メタデータ) (2021-05-10T14:43:11Z) - Self-Tuning for Data-Efficient Deep Learning [75.34320911480008]
セルフチューニングは、データ効率のよいディープラーニングを可能にする新しいアプローチである。
ラベル付きおよびラベルなしデータの探索と事前訓練されたモデルの転送を統一する。
SSLとTLの5つのタスクをシャープなマージンで上回ります。
論文 参考訳(メタデータ) (2021-02-25T14:56:19Z) - Self-Supervised Noisy Label Learning for Source-Free Unsupervised Domain
Adaptation [87.60688582088194]
新規な自己監督雑音ラベル学習法を提案する。
本手法は最新の結果を容易に達成でき、他の手法を非常に大きなマージンで超えることができる。
論文 参考訳(メタデータ) (2021-02-23T10:51:45Z) - Semi-supervised Relation Extraction via Incremental Meta Self-Training [56.633441255756075]
半教師付き関係抽出法は,限られたサンプルからの学習に加え,ラベルのないデータを活用することを目的としている。
既存の自己学習手法は段階的なドリフト問題に悩まされ、未ラベルデータにノイズのある擬似ラベルが組み込まれている。
本稿では,リレーショナルラベル生成ネットワークが,メタオブジェクトとしてリレーショナル分類ネットワークを成功・失敗に導くことによって,擬似ラベルの品質評価を生成するメタSREという手法を提案する。
論文 参考訳(メタデータ) (2020-10-06T03:54:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。