論文の概要: Mental Disorder Classification via Temporal Representation of Text
- arxiv url: http://arxiv.org/abs/2406.15470v2
- Date: Sun, 06 Oct 2024 06:27:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-08 13:42:08.235388
- Title: Mental Disorder Classification via Temporal Representation of Text
- Title(参考訳): テキストの時間表現による精神障害分類
- Authors: Raja Kumar, Kishan Maharaj, Ashita Saxena, Pushpak Bhattacharyya,
- Abstract要約: ソーシャルメディア投稿からの精神障害予測は、逐次テキストデータの複雑さのために困難である。
本稿では,時系列に順序付けられたソーシャルメディア投稿を一連の数に圧縮する新しいフレームワークを提案する。
我々は、現在のSOTAを3つの異なる精神条件で上回ることで、フレームワークの一般化能力を実証する。
- 参考スコア(独自算出の注目度): 33.47304614659701
- License:
- Abstract: Mental disorders pose a global challenge, aggravated by the shortage of qualified mental health professionals. Mental disorder prediction from social media posts by current LLMs is challenging due to the complexities of sequential text data and the limited context length of language models. Current language model-based approaches split a single data instance into multiple chunks to compensate for limited context size. The predictive model is then applied to each chunk individually, and the most voted output is selected as the final prediction. This results in the loss of inter-post dependencies and important time variant information, leading to poor performance. We propose a novel framework which first compresses the large sequence of chronologically ordered social media posts into a series of numbers. We then use this time variant representation for mental disorder classification. We demonstrate the generalization capabilities of our framework by outperforming the current SOTA in three different mental conditions: depression, self-harm, and anorexia, with an absolute improvement of 5% in the F1 score. We investigate the situation where current data instances fall within the context length of language models and present empirical results highlighting the importance of temporal properties of textual data. Furthermore, we utilize the proposed framework for a cross-domain study, exploring commonalities across disorders and the possibility of inter-domain data usage.
- Abstract(参考訳): メンタル障害は、資格のあるメンタルヘルス専門家の不足によって増大する、世界的な課題を引き起こす。
現在のLCMによるソーシャルメディア投稿からの精神障害予測は、逐次テキストデータの複雑さと言語モデルの限られた文脈長のために困難である。
現在の言語モデルベースのアプローチでは、単一のデータインスタンスを複数のチャンクに分割し、限られたコンテキストサイズを補う。
次に、予測モデルを各チャンクに個別に適用し、最も投票率の高い出力を最終予測として選択する。
これにより、ポスト間の依存関係が失われ、重要な時間変更情報が失われ、パフォーマンスが低下する。
本稿では,時系列に順序付けられたソーシャルメディア投稿を一連の数に圧縮する新しいフレームワークを提案する。
次に、この時間変化表現を精神障害分類に使用します。
我々は,うつ病,自傷病,食欲不振の3つの精神状態において,現在のSOTAよりも優れ,F1スコアの5%を絶対的に向上させることで,フレームワークの一般化能力を実証した。
本研究では,現在のデータインスタンスが言語モデルの文脈長内に収まる状況について検討し,テキストデータの時間的特性の重要性を明らかにする実験結果を示す。
さらに、提案したフレームワークをドメイン横断研究に利用し、障害間の共通点とドメイン間データ利用の可能性を探る。
関連論文リスト
- A BERT-Based Summarization approach for depression detection [1.7363112470483526]
うつ病は世界中で流行する精神疾患であり、対処されないと深刻な反感を引き起こす可能性がある。
機械学習と人工知能は、さまざまなデータソースからのうつ病指標を自律的に検出することができる。
本研究では,入力テキストの長さと複雑さを低減させる前処理手法として,テキスト要約を提案する。
論文 参考訳(メタデータ) (2024-09-13T02:14:34Z) - Improving Sampling Methods for Fine-tuning SentenceBERT in Text Streams [49.3179290313959]
本研究では,選択的な微調整言語モデルの設計した7つのテキストサンプリング手法の有効性について検討した。
これらの手法がSBERTモデルの微調整に与える影響を, 4つの異なる損失関数を用いて正確に評価する。
その結果,テキストストリームの分類にはソフトマックスの損失とバッチ・オール・トリプレットの損失が特に有効であることが示唆された。
論文 参考訳(メタデータ) (2024-03-18T23:41:52Z) - Multi-class Categorization of Reasons behind Mental Disturbance in Long
Texts [0.0]
我々はLongformerを用いて、自己報告されたテキストで精神疾患の背景にある因果指標を見つける問題に対処する。
実験によると、Longformerは62%のF1スコアを持つ公開データセットであるM-CAMSで、最先端の新たな結果を達成している。
我々の研究は、うつ病や自殺リスクの因果分析をソーシャルメディアデータ上で促進し、他の精神状態に適用する可能性を示していると信じている。
論文 参考訳(メタデータ) (2023-04-08T22:44:32Z) - Semantic Coherence Markers for the Early Diagnosis of the Alzheimer
Disease [0.0]
パープレキシティはもともと、与えられた言語モデルがテキストシーケンスを予測するのにどの程度適しているかを評価するための情報理論の尺度として考え出された。
我々は2グラムから5グラムまでのN-gramとトランスフォーマーベース言語モデルであるGPT-2を多種多様な言語モデルに適用した。
ベストパフォーマンスモデルでは、ADクラスと制御対象の両方から対象を分類する際に、完全精度とFスコア(精度/特異度とリコール/感度のそれぞれ1.00)を達成した。
論文 参考訳(メタデータ) (2023-02-02T11:40:16Z) - Learning to Exploit Temporal Structure for Biomedical Vision-Language
Processing [53.89917396428747]
視覚言語処理における自己教師あり学習は、画像とテキストのモダリティのセマンティックアライメントを利用する。
トレーニングと微調整の両方で利用できる場合、事前のイメージとレポートを明示的に説明します。
我々のアプローチはBioViL-Tと呼ばれ、テキストモデルと共同で訓練されたCNN-Transformerハイブリッドマルチイメージエンコーダを使用する。
論文 参考訳(メタデータ) (2023-01-11T16:35:33Z) - Practical Challenges in Differentially-Private Federated Survival
Analysis of Medical Data [57.19441629270029]
本稿では,ニューラルネットワークの本質的特性を活用し,生存分析モデルの訓練過程を関連づける。
小さな医療データセットと少数のデータセンターの現実的な設定では、このノイズはモデルを収束させるのが難しくなります。
DPFed-post は,私的フェデレート学習方式に後処理の段階を追加する。
論文 参考訳(メタデータ) (2022-02-08T10:03:24Z) - Selecting the suitable resampling strategy for imbalanced data
classification regarding dataset properties [62.997667081978825]
医学、情報検索、サイバーセキュリティ、ソーシャルメディアなどの多くのアプリケーションドメインでは、分類モデルの導入に使用されるデータセットは、各クラスのインスタンスの不平等な分布を持つことが多い。
この状況は不均衡データ分類と呼ばれ、少数民族の例では予測性能が低い。
オーバーサンプリングとアンダーサンプリングの技術は、各クラスの例の数とバランスをとることでこの問題に対処する、よく知られた戦略である。
論文 参考訳(メタデータ) (2021-12-15T18:56:39Z) - Interpretable Time-series Representation Learning With Multi-Level
Disentanglement [56.38489708031278]
Disentangle Time Series (DTS)は、シーケンシャルデータのための新しいDisentanglement Enhanceingフレームワークである。
DTSは時系列の解釈可能な表現として階層的意味概念を生成する。
DTSは、セマンティック概念の解釈性が高く、下流アプリケーションで優れたパフォーマンスを実現します。
論文 参考訳(メタデータ) (2021-05-17T22:02:24Z) - Neural Topic Models with Survival Supervision: Jointly Predicting Time-to-Event Outcomes and Learning How Clinical Features Relate [10.709447977149532]
本稿では,生存予測モデル学習のためのニューラルネットワークフレームワークを提案する。
特に、各主題を「トピック」の分布としてモデル化する。
トピックの存在は、特定の臨床特徴が被験者に現れる可能性が高くなることを意味する。
論文 参考訳(メタデータ) (2020-07-15T16:20:04Z) - Neural Data-to-Text Generation via Jointly Learning the Segmentation and
Correspondence [48.765579605145454]
対象のテキストを断片単位に明示的に分割し,それらのデータ対応と整合させることを提案する。
結果として生じるアーキテクチャは、ニューラルアテンションモデルと同じ表現力を維持している。
E2EとWebNLGのベンチマークでは、提案モデルがニューラルアテンションよりも一貫して優れていることを示す。
論文 参考訳(メタデータ) (2020-05-03T14:28:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。