論文の概要: Cognitive-Linguistic Indicators of Depression in Online Communities: Analysed by DistilBERT and Holographic Reduced Representation
- arxiv url: http://arxiv.org/abs/2606.00026v1
- Date: Wed, 15 Apr 2026 12:35:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-15 07:09:36.583826
- Title: Cognitive-Linguistic Indicators of Depression in Online Communities: Analysed by DistilBERT and Holographic Reduced Representation
- Title(参考訳): オンラインコミュニティにおける抑うつの認知言語的指標: DistilBERT とホログラフィーによる表現分析
- Authors: Brian Van Steen,
- Abstract要約: 本稿では,認知言語機能とトランスフォーマーを用いた埋め込みを組み合わせることで,オンラインテキストにおける抑うつの自動検出が向上するかどうかを考察する。
ベックの抑うつ認知理論(Cognitive Theory of Depression)を用いて、この研究は、うつ病とコントロールコミュニティのReddit投稿において、第一人称代名詞密度、絶対主義的な言葉、否定的な感情など、認知的歪みを測定可能な特徴として抽出する。
ハイブリッドDistilBERT HRRモデルは、TD-IDFベースラインで0.94と0.80のマクロF1スコアを達成し、5倍のクロスバリデーションF1を0.83から0.92に改善し、AUCを0.958から0.981に改善した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper investigates whether combining cognitively grounded linguistic features with transformer-based embeddings improves automated detection of depression in online text. Using Beck's Cognitive Theory of Depression, the study extracts cognitive distortions as measurable features, including first-person pronoun density, absolutist words, and negative emotion in Reddit posts from depression-related and control communities. Using a subset of the Kaggle Reddit Suicide and Depression Detection dataset, two classification pipelines are compared, a TF-IDF embedding with Naive Bayes as a baseline, and a hybrid model that concatenates DistilBERT sentence embeddings with Holographic Reduced Representation (HRR) vectors encoding the cognitive-linguistic features, followed by Logistic Regression. The hybrid DistilBERT HRR model achieves a macro F1 score of 0.94 versus 0.80 for the TD-IDF baseline, with 5-fold cross validation F1 improving from 0.83 to 0.92, and AUC from 0.958 to 0.981.
- Abstract(参考訳): 本稿では,認知的基盤言語特徴とトランスフォーマーを用いた埋め込みを組み合わせることで,オンラインテキストにおける抑うつの自動検出が向上するかどうかを考察する。
ベックの抑うつ認知理論(Cognitive Theory of Depression)を用いて、この研究は、うつ病とコントロールコミュニティのReddit投稿において、第一人称代名詞密度、絶対主義的な言葉、否定的な感情など、認知的歪みを測定可能な特徴として抽出する。
Kaggle Reddit Suicide and Depression Detectionデータセットのサブセットを使用して、2つの分類パイプラインを比較し、Naive Bayesをベースラインとして組み込み、DitilBERT文をホログラフィック還元表現(HRR)ベクターに埋め込むハイブリッドモデルと、ロジスティック回帰(Logistic Regression)が続く。
ハイブリッドDistilBERT HRRモデルは、TD-IDFベースラインで0.94と0.80のマクロF1スコアを達成し、5倍のクロスバリデーションF1を0.83から0.92に改善し、AUCを0.958から0.981に改善した。
関連論文リスト
- Amplifying, Not Learning: Fine-Tuned AI Text Detectors Amplify a Pretrained Direction [51.56484100374058]
テキスト検出器は、事前訓練された典型軸を増幅する。
タスク監督前の生エンコーダでは、3つのアーキテクチャでNYT-vs-HC3 AUROC 0.806/0.944/0.834を達成する。
RoBERTaベースでは、生のプロジェクションは微調整を超えるが、RoBERTaベースでは、フル微調整は、試験された流線型人口の双方で生よりも識別を小さくする。
論文 参考訳(メタデータ) (2026-05-20T19:08:38Z) - DepFlow: Disentangled Speech Generation to Mitigate Semantic Bias in Depression Detection [54.209716321122194]
抑うつ条件付きテキスト音声合成フレームワークであるDepFlowについて述べる。
抑うつ音響カモフラージュは、対向訓練を通じて話者と内容不変の抑うつ埋め込みを学習する。
フローマッチングTTSモデルとFiLM変調はこれらの埋め込みを合成に注入し、うつ病の重症度を制御する。
プロトタイプベースの重度マッピング機構は、うつ病連続体を滑らかかつ解釈可能な操作を提供する。
論文 参考訳(メタデータ) (2026-01-01T10:44:38Z) - MF-GCN: A Multi-Frequency Graph Convolutional Network for Tri-Modal Depression Detection Using Eye-Tracking, Facial, and Acoustic Features [2.957755315403663]
うつ病 (depression) は、過度の低気分とアンヘドニアを特徴とする、世界的なメンタルヘルス障害である。
臨床評価対象103名のゴールド・スタンダード・データセットをトリパーティイト・データ・アプローチで収集した。
眼球追跡データは、うつ病群で頻繁に観察される負刺激に対する注意バイアスを定量化する。
音声およびビデオデータは、うつ病の特徴である感情的平坦化と精神運動的遅滞を捉えている。
論文 参考訳(メタデータ) (2025-11-19T18:18:53Z) - ReDepress: A Cognitive Framework for Detecting Depression Relapse from Social Media [48.56586765769052]
ReDepressは、リラプスに焦点を当てた最初の臨床的に検証されたソーシャルメディアデータセットである。
我々の枠組みはうつ病の認知理論に基づいており、注意バイアス、解釈バイアス、記憶バイアス、反省などの構造を取り入れている。
本研究は, 実世界のテキストデータにおける心理学的理論を検証し, 早期再発検出のための認知インフォームド・コンピューティング手法の可能性を明らかにするものである。
論文 参考訳(メタデータ) (2025-09-22T16:33:59Z) - DepressLLM: Interpretable domain-adapted language model for depression detection from real-world narratives [6.1211540596331755]
本研究では,幸福と苦悩の両方を反映した3,699個の自伝的物語のコーパスをトレーニングし,評価したDepressLLMを紹介する。
DepressLLMは解釈可能な抑うつ予測を提供し、Score-guided Token Probability Summation (SToPS)モジュールを通じて、改善された分類性能と信頼性の高い信頼推定を提供する。
論文 参考訳(メタデータ) (2025-08-12T03:12:55Z) - The Relationship Between Speech Features Changes When You Get Depressed:
Feature Correlations for Improving Speed and Performance of Depression
Detection [69.88072583383085]
この研究は、抑うつが音声から抽出した特徴間の相関を変化させることを示す。
このような洞察を用いることで、SVMとLSTMに基づく抑うつ検出器のトレーニング速度と性能を向上させることができる。
論文 参考訳(メタデータ) (2023-07-06T09:54:35Z) - Depression detection in social media posts using affective and social
norm features [84.12658971655253]
ソーシャルメディア投稿からの抑うつ検出のための奥深いアーキテクチャを提案する。
我々は、後期融合方式を用いて、ポストとワードの敬称と道徳的特徴をアーキテクチャに組み込んだ。
提案された機能を含めると、両方の設定で最先端の結果が得られます。
論文 参考訳(メタデータ) (2023-03-24T21:26:27Z) - Prediction of Depression Severity Based on the Prosodic and Semantic
Features with Bidirectional LSTM and Time Distributed CNN [14.994852548758825]
抑うつ予測のための注意に基づくマルチモーダリティ音声とテキスト表現を提案する。
本モデルは,OzデータセットのDistress Analysis Interview Corpus-Wizardを用いて,参加者のうつ病重症度を推定するために訓練された。
実験では、過去の研究よりも統計的に有意な改善が見られた。
論文 参考訳(メタデータ) (2022-02-25T01:42:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。