論文の概要: Robin: A Novel Online Suicidal Text Corpus of Substantial Breadth and
Scale
- arxiv url: http://arxiv.org/abs/2209.05707v1
- Date: Tue, 13 Sep 2022 03:32:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-14 12:17:51.128270
- Title: Robin: A Novel Online Suicidal Text Corpus of Substantial Breadth and
Scale
- Title(参考訳): Robin: 静的ブレッドスとスケールの新しいオンライン自殺テキストコーパス
- Authors: Daniel DiPietro, Vivek Hazari, Soroush Vosoughi
- Abstract要約: これまでに1100万以上のオンラインフォーラム投稿からなる、最大規模の非キーワード生成自殺コーパスであるRobinを紹介します。
ロビンは、自殺の遺書やフリップパント参照など、自殺のテキストの様々なカテゴリを含むように特別に構築されている。
Robinデータセットを機械学習リソースとして公開し、次世代の自殺感情研究を推進する可能性を秘めています。
- 参考スコア(独自算出の注目度): 11.945854832533234
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Suicide is a major public health crisis. With more than 20,000,000 suicide
attempts each year, the early detection of suicidal intent has the potential to
save hundreds of thousands of lives. Traditional mental health screening
methods are time-consuming, costly, and often inaccessible to disadvantaged
populations; online detection of suicidal intent using machine learning offers
a viable alternative. Here we present Robin, the largest non-keyword generated
suicidal corpus to date, consisting of over 1.1 million online forum postings.
In addition to its unprecedented size, Robin is specially constructed to
include various categories of suicidal text, such as suicide bereavement and
flippant references, better enabling models trained on Robin to learn the
subtle nuances of text expressing suicidal ideation. Experimental results
achieve state-of-the-art performance for the classification of suicidal text,
both with traditional methods like logistic regression (F1=0.85), as well as
with large-scale pre-trained language models like BERT (F1=0.92). Finally, we
release the Robin dataset publicly as a machine learning resource with the
potential to drive the next generation of suicidal sentiment research.
- Abstract(参考訳): 自殺は主要な公衆衛生危機である。
毎年2万人以上の自殺未遂があり、自殺の意図を早期に検出することで数十万人の命を救える可能性がある。
伝統的なメンタルヘルススクリーニング手法は、時間を要するものであり、コストがかかり、しばしば不利な人口にアクセスできない。
ここでは、これまでで最大の非キーワード生成自殺コーパスであるRobinを紹介します。
前例のない大きさの他に、ロビンは自殺の遺書やフリップパント参照などの自殺のテキストの様々なカテゴリを含むように特別に構築されており、ロビンで訓練されたモデルは自殺の考えを表すテキストの微妙なニュアンスを学ぶことができる。
実験により,ロジスティック回帰 (F1=0.85) のような従来の手法とBERT (F1=0.92) のような大規模事前訓練された言語モデルの両方で,自殺テキストの分類における最先端の性能が得られた。
最後に、次世代の自殺感情研究を推進する可能性を持つマシンラーニングリソースとして、Robinデータセットを公開しています。
関連論文リスト
- Navigating the OverKill in Large Language Models [84.62340510027042]
モデルがどのように処理し,クエリの安全性を判断するかを検討することで,過剰スキルの要因について検討する。
以上の結果から,モデル内にショートカットが存在することが明らかとなり,"キル"のような有害な単語が過剰に認識され,安全性が強調され,過度なスキルが増すことが示唆された。
我々は、この現象を緩和するために、トレーニングフリーでモデルに依存しないセルフコントラストデコーディング(Self-Contrastive Decoding、CD)を導入する。
論文 参考訳(メタデータ) (2024-01-31T07:26:47Z) - CautionSuicide: A Deep Learning Based Approach for Detecting Suicidal
Ideation in Real Time Chatbot Conversation [0.0]
自殺の早期発見は自殺の予防に役立つ。
本稿では,デジタルコンテンツにおける自殺的思考を検出するための,新しいシンプルな深層学習モデルを提案する。
論文 参考訳(メタデータ) (2024-01-02T04:14:16Z) - Understanding writing style in social media with a supervised
contrastively pre-trained transformer [57.48690310135374]
オンラインソーシャルネットワークは、ヘイトスピーチから偽情報の拡散まで、有害な行動の場として機能している。
本稿では, 4.5 x 106テキストの公開資料から得られた大規模コーパスに基づいて学習したStyle Transformer for Authorship Representations (STAR)を紹介する。
512個のトークンからなる8つのドキュメントからなるサポートベースを使用して、著者を最大1616人の著者のセットから、少なくとも80%の精度で識別することができる。
論文 参考訳(メタデータ) (2023-10-17T09:01:17Z) - An Automated Tool to Detect Suicidal Susceptibility from Social Media
Posts [0.0]
本研究は、ソーシャルメディアからの情報を用いて、誰かが自傷行為を考えているかどうかを判断する自動モデルを開発する。
ソーシャルメディア投稿のデータセットを収集し、それらを処理し、モデルをトレーニングし、修正しました。
このモデルは93%の精度で、F1スコアは0.93である。
論文 参考訳(メタデータ) (2023-10-09T18:06:12Z) - Detecting Suicidality in Arabic Tweets Using Machine Learning and Deep
Learning Techniques [0.32885740436059047]
本研究は,Twitterからアラビアの自殺検知データセットを開発した。
これは、Twitterからアラビアの自殺検知データセットを開発した最初の研究である。
論文 参考訳(メタデータ) (2023-09-01T04:30:59Z) - SpellMapper: A non-autoregressive neural spellchecker for ASR
customization with candidate retrieval based on n-gram mappings [76.87664008338317]
文脈スペル補正モデルは、音声認識を改善するために浅い融合に代わるものである。
ミススペルn-gramマッピングに基づく候補探索のための新しいアルゴリズムを提案する。
Spoken Wikipediaの実験では、ベースラインのASRシステムに比べて21.4%のワードエラー率の改善が見られた。
論文 参考訳(メタデータ) (2023-06-04T10:00:12Z) - Am I No Good? Towards Detecting Perceived Burdensomeness and Thwarted
Belongingness from Suicide Notes [51.378225388679425]
本稿では,自殺ノートから知覚的バーデンサムネス(PB)とThwarted Belongingness(TB)を検出する新しい課題に対処するエンドツーエンドマルチタスクシステムを提案する。
また、ベンチマークCEASE-v2.0データセットに基づいて、手動で翻訳したコード混合自殺メモコーパス、CoMCEASE-v2.0を導入する。
自殺ノートの時間方向と感情情報を利用して全体のパフォーマンスを向上する。
論文 参考訳(メタデータ) (2022-05-20T06:31:08Z) - ScAN: Suicide Attempt and Ideation Events Dataset [4.905488376442885]
自殺未遂(SA)や自殺構想(SI)などの自殺行為は、自殺による死亡のリスク要因となっている。
このようなドキュメンテーションの正確な検出は、患者の自殺行為の監視と予測を改善するのに役立つかもしれない。
論文 参考訳(メタデータ) (2022-05-12T17:11:07Z) - An ensemble deep learning technique for detecting suicidal ideation from
posts in social media platforms [0.0]
本稿ではLSTM-Attention-CNN複合モデルを提案する。
提案されたモデルは90.3%の精度、F1スコア92.6%の精度を示した。
論文 参考訳(メタデータ) (2021-12-17T15:34:03Z) - Detecting Perceived Emotions in Hurricane Disasters [62.760131661847986]
私たちはHurricaneEmoを紹介します。HurricaneEmoは、Harvey、Irma、Mariaの3つのハリケーンにまたがる15,000の英語ツイートの感情データセットです。
本稿では, きめ細かい感情を包括的に研究し, 粗い感情群を識別するための分類タスクを提案する。
論文 参考訳(メタデータ) (2020-04-29T16:17:49Z) - Suicidal Ideation and Mental Disorder Detection with Attentive Relation
Networks [43.2802002858859]
本稿では,語彙に基づく感情スコアと潜在トピックを用いたテキスト表現を強化する。
本研究は,自殺思考と精神障害を関連するリスク指標を用いて検出する関係ネットワークを提案する。
論文 参考訳(メタデータ) (2020-04-16T11:18:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。