論文の概要: Robin: A Novel Online Suicidal Text Corpus of Substantial Breadth and
Scale
- arxiv url: http://arxiv.org/abs/2209.05707v1
- Date: Tue, 13 Sep 2022 03:32:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-14 12:17:51.128270
- Title: Robin: A Novel Online Suicidal Text Corpus of Substantial Breadth and
Scale
- Title(参考訳): Robin: 静的ブレッドスとスケールの新しいオンライン自殺テキストコーパス
- Authors: Daniel DiPietro, Vivek Hazari, Soroush Vosoughi
- Abstract要約: これまでに1100万以上のオンラインフォーラム投稿からなる、最大規模の非キーワード生成自殺コーパスであるRobinを紹介します。
ロビンは、自殺の遺書やフリップパント参照など、自殺のテキストの様々なカテゴリを含むように特別に構築されている。
Robinデータセットを機械学習リソースとして公開し、次世代の自殺感情研究を推進する可能性を秘めています。
- 参考スコア(独自算出の注目度): 11.945854832533234
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Suicide is a major public health crisis. With more than 20,000,000 suicide
attempts each year, the early detection of suicidal intent has the potential to
save hundreds of thousands of lives. Traditional mental health screening
methods are time-consuming, costly, and often inaccessible to disadvantaged
populations; online detection of suicidal intent using machine learning offers
a viable alternative. Here we present Robin, the largest non-keyword generated
suicidal corpus to date, consisting of over 1.1 million online forum postings.
In addition to its unprecedented size, Robin is specially constructed to
include various categories of suicidal text, such as suicide bereavement and
flippant references, better enabling models trained on Robin to learn the
subtle nuances of text expressing suicidal ideation. Experimental results
achieve state-of-the-art performance for the classification of suicidal text,
both with traditional methods like logistic regression (F1=0.85), as well as
with large-scale pre-trained language models like BERT (F1=0.92). Finally, we
release the Robin dataset publicly as a machine learning resource with the
potential to drive the next generation of suicidal sentiment research.
- Abstract(参考訳): 自殺は主要な公衆衛生危機である。
毎年2万人以上の自殺未遂があり、自殺の意図を早期に検出することで数十万人の命を救える可能性がある。
伝統的なメンタルヘルススクリーニング手法は、時間を要するものであり、コストがかかり、しばしば不利な人口にアクセスできない。
ここでは、これまでで最大の非キーワード生成自殺コーパスであるRobinを紹介します。
前例のない大きさの他に、ロビンは自殺の遺書やフリップパント参照などの自殺のテキストの様々なカテゴリを含むように特別に構築されており、ロビンで訓練されたモデルは自殺の考えを表すテキストの微妙なニュアンスを学ぶことができる。
実験により,ロジスティック回帰 (F1=0.85) のような従来の手法とBERT (F1=0.92) のような大規模事前訓練された言語モデルの両方で,自殺テキストの分類における最先端の性能が得られた。
最後に、次世代の自殺感情研究を推進する可能性を持つマシンラーニングリソースとして、Robinデータセットを公開しています。
関連論文リスト
- Lexicography Saves Lives (LSL): Automatically Translating Suicide-Related Language [4.2185937778110825]
自殺は世界的な問題であり、自殺率を2030年までに引き下げることは国連の持続可能な開発目標の重要な目標の一つだ。
以前の研究では、他の利用可能なリソースが不足しているため、自殺に関連する英語辞書を使用して異なるターゲット言語に翻訳した。
この作業では、この問題に対処し、3つの異なるコントリビューションを行うために、'Lexicography Saves Lives Project'を導入している。
論文 参考訳(メタデータ) (2024-12-20T02:23:36Z) - An Exploratory Deep Learning Approach for Predicting Subsequent Suicidal Acts in Chinese Psychological Support Hotlines [13.59130559079134]
自殺リスク評価のためのスケールベースの予測手法の精度は、オペレーターの専門性によって大きく異なる可能性がある。
本研究は,中国における自殺リスクを予測するために,長期音声データにディープラーニングを適用した最初の事例である。
論文 参考訳(メタデータ) (2024-08-29T11:51:41Z) - Non-Invasive Suicide Risk Prediction Through Speech Analysis [74.8396086718266]
自動自殺リスク評価のための非侵襲的音声ベースアプローチを提案する。
我々は、wav2vec、解釈可能な音声・音響特徴、深層学習に基づくスペクトル表現の3つの特徴セットを抽出する。
我々の最も効果的な音声モデルは、6.6.2,%$のバランスの取れた精度を達成する。
論文 参考訳(メタデータ) (2024-04-18T12:33:57Z) - Navigating the OverKill in Large Language Models [84.62340510027042]
モデルがどのように処理し,クエリの安全性を判断するかを検討することで,過剰スキルの要因について検討する。
以上の結果から,モデル内にショートカットが存在することが明らかとなり,"キル"のような有害な単語が過剰に認識され,安全性が強調され,過度なスキルが増すことが示唆された。
我々は、この現象を緩和するために、トレーニングフリーでモデルに依存しないセルフコントラストデコーディング(Self-Contrastive Decoding、CD)を導入する。
論文 参考訳(メタデータ) (2024-01-31T07:26:47Z) - CautionSuicide: A Deep Learning Based Approach for Detecting Suicidal
Ideation in Real Time Chatbot Conversation [0.0]
自殺の早期発見は自殺の予防に役立つ。
本稿では,デジタルコンテンツにおける自殺的思考を検出するための,新しいシンプルな深層学習モデルを提案する。
論文 参考訳(メタデータ) (2024-01-02T04:14:16Z) - Understanding writing style in social media with a supervised
contrastively pre-trained transformer [57.48690310135374]
オンラインソーシャルネットワークは、ヘイトスピーチから偽情報の拡散まで、有害な行動の場として機能している。
本稿では, 4.5 x 106テキストの公開資料から得られた大規模コーパスに基づいて学習したStyle Transformer for Authorship Representations (STAR)を紹介する。
512個のトークンからなる8つのドキュメントからなるサポートベースを使用して、著者を最大1616人の著者のセットから、少なくとも80%の精度で識別することができる。
論文 参考訳(メタデータ) (2023-10-17T09:01:17Z) - An Automated Tool to Detect Suicidal Susceptibility from Social Media
Posts [0.0]
本研究は、ソーシャルメディアからの情報を用いて、誰かが自傷行為を考えているかどうかを判断する自動モデルを開発する。
ソーシャルメディア投稿のデータセットを収集し、それらを処理し、モデルをトレーニングし、修正しました。
このモデルは93%の精度で、F1スコアは0.93である。
論文 参考訳(メタデータ) (2023-10-09T18:06:12Z) - Am I No Good? Towards Detecting Perceived Burdensomeness and Thwarted
Belongingness from Suicide Notes [51.378225388679425]
本稿では,自殺ノートから知覚的バーデンサムネス(PB)とThwarted Belongingness(TB)を検出する新しい課題に対処するエンドツーエンドマルチタスクシステムを提案する。
また、ベンチマークCEASE-v2.0データセットに基づいて、手動で翻訳したコード混合自殺メモコーパス、CoMCEASE-v2.0を導入する。
自殺ノートの時間方向と感情情報を利用して全体のパフォーマンスを向上する。
論文 参考訳(メタデータ) (2022-05-20T06:31:08Z) - An ensemble deep learning technique for detecting suicidal ideation from
posts in social media platforms [0.0]
本稿ではLSTM-Attention-CNN複合モデルを提案する。
提案されたモデルは90.3%の精度、F1スコア92.6%の精度を示した。
論文 参考訳(メタデータ) (2021-12-17T15:34:03Z) - Detecting Perceived Emotions in Hurricane Disasters [62.760131661847986]
私たちはHurricaneEmoを紹介します。HurricaneEmoは、Harvey、Irma、Mariaの3つのハリケーンにまたがる15,000の英語ツイートの感情データセットです。
本稿では, きめ細かい感情を包括的に研究し, 粗い感情群を識別するための分類タスクを提案する。
論文 参考訳(メタデータ) (2020-04-29T16:17:49Z) - Suicidal Ideation and Mental Disorder Detection with Attentive Relation
Networks [43.2802002858859]
本稿では,語彙に基づく感情スコアと潜在トピックを用いたテキスト表現を強化する。
本研究は,自殺思考と精神障害を関連するリスク指標を用いて検出する関係ネットワークを提案する。
論文 参考訳(メタデータ) (2020-04-16T11:18:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。