論文の概要: Context Matters: Vision-Based Depression Detection Comparing Classical and Deep Approaches
- arxiv url: http://arxiv.org/abs/2604.10344v1
- Date: Sat, 11 Apr 2026 20:40:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:15.967741
- Title: Context Matters: Vision-Based Depression Detection Comparing Classical and Deep Approaches
- Title(参考訳): 文脈的問題:古典的アプローチと深層アプローチを比較した視覚的抑うつ検出
- Authors: Maneesh Bilalpur, Saurabh Hinduja, Sonish Sivarajkumar, Nicholas Allen, Yanshan Wang, Itir Onal Ertugrul, Jeffrey F. Cohn,
- Abstract要約: 視覚的モダリティにおける抑うつの検出に対する古典的アプローチと深いアプローチを比較した。
古典的なアプローチは両方の文脈で高い精度を実現した。
クロスコンテキストの一般化性は、どちらのアプローチにも最も適していた。
- 参考スコア(独自算出の注目度): 3.964469245507716
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The classical approach to detecting depression from vision emphasizes interpretable features, such as facial expression, and classifiers such as the Support Vector Machine (SVM). With the advent of deep learning, there has been a shift in feature representations and classification approaches. Contemporary approaches use learnt features from general-purpose vision models such as VGGNet to train machine learning models. Little is known about how classical and deep approaches compare in depression detection with respect to accuracy, fairness, and generalizability, especially across contexts. To address these questions, we compared classical and deep approaches to the detection of depression in the visual modality in two different contexts: Mother-child interactions in the TPOT database and patient-clinician interviews in the Pitt database. In the former, depression was operationalized as a history of depression per the DSM and current or recent clinically significant symptoms. In the latter, all participants met initial criteria for depression per DSM, and depression was reassessed over the course of treatment. The classical approach included handcrafted features with SVM classifiers. Learnt features were turn-level embeddings from the FMAE-IAT that were combined with Multi-Layer Perceptron classifiers. The classical approach achieved higher accuracy in both contexts. It was also significantly fairer than the deep approach in the patient-clinician context. Cross-context generalizability was modest at best for both approaches, which suggests that depression may be context-specific.
- Abstract(参考訳): 視覚からの抑うつを検出する古典的なアプローチは、表情やSVM(Support Vector Machine)のような分類器のような解釈可能な特徴を強調している。
ディープラーニングの出現に伴い、特徴表現と分類アプローチがシフトしてきた。
現代のアプローチでは、VGGNetのような汎用視覚モデルから学習した機能を使って機械学習モデルをトレーニングしている。
古典的アプローチと深いアプローチが、特に文脈において、正確性、公平性、一般化性に関してうつ病検出とどのように比較されているかは、ほとんど分かっていない。
これらの問題に対処するために, TPOTデータベースにおける母子間相互作用と, Pittデータベースにおける患者・クリニシアンインタビューの2つの文脈において, 視覚的モダリティにおける抑うつの検出に対する古典的アプローチと深いアプローチを比較した。
前者では、うつ病はDSMによるうつ病の既往と、現在または最近の臨床的に重要な症状として手術された。
後者では、全ての被験者がDSM当たりのうつ病の基準を満たし、治療期間中にうつ病を再評価した。
古典的なアプローチには、SVM分類器を使った手作りの機能が含まれていた。
学習機能はFMAE-IATのターンレベルの埋め込みであり、マルチ層パーセプトロン分類器と組み合わせられた。
古典的なアプローチは両方の文脈で高い精度を実現した。
また,患者・クリニックの文脈における深いアプローチよりもかなり公平であった。
クロスコンテクストの一般化性は、どちらのアプローチにも最も適しており、うつ病は文脈に特有である可能性が示唆された。
関連論文リスト
- Cognitive Pivot Points and Visual Anchoring: Unveiling and Rectifying Hallucinations in Multimodal Reasoning Models [65.57985131861399]
幻覚は、しばしば高いエントロピー状態を示す認知的分岐点と強く相関している。
本稿では,視覚的に認識可能な推論機能の内部化を目的とした,軽量で総合的なトレーニングパラダイムであるV-STARを提案する。
論文 参考訳(メタデータ) (2026-04-11T13:59:05Z) - DepFlow: Disentangled Speech Generation to Mitigate Semantic Bias in Depression Detection [54.209716321122194]
抑うつ条件付きテキスト音声合成フレームワークであるDepFlowについて述べる。
抑うつ音響カモフラージュは、対向訓練を通じて話者と内容不変の抑うつ埋め込みを学習する。
フローマッチングTTSモデルとFiLM変調はこれらの埋め込みを合成に注入し、うつ病の重症度を制御する。
プロトタイプベースの重度マッピング機構は、うつ病連続体を滑らかかつ解釈可能な操作を提供する。
論文 参考訳(メタデータ) (2026-01-01T10:44:38Z) - Interpretable Depression Detection from Social Media Text Using LLM-Derived Embeddings [0.44865923696339866]
ソーシャルメディアにおける抑うつ言語検出の精度と解釈は、精神状態の早期介入に有用である。
ソーシャルメディアデータを含む3つの分類課題に対して,大規模言語モデル(LLM)と従来の機械学習分類器の性能について検討した。
論文 参考訳(メタデータ) (2025-06-07T01:19:45Z) - Basic Category Usage in Vision Language Models [0.0]
2つの視覚言語モデル(VLM)の基本レベル分類について検討する。
Llama 3.2 Vision Instruct (11B) と Molmo 7B-D はどちらも人間の行動に整合した基本レベルの分類を好む。
また、専門家のプロンプト法が精度を低下させ、非専門家のプロンプト法が有効であることを示す。
論文 参考訳(メタデータ) (2025-03-16T14:50:54Z) - LlaMADRS: Prompting Large Language Models for Interview-Based Depression Assessment [75.44934940580112]
LlaMADRSは、オープンソースのLarge Language Models(LLM)を利用して、うつ病の重症度評価を自動化する新しいフレームワークである。
本研究は,クリニカルインタヴューの解釈・スコアリングにおけるモデル指導のために,慎重に設計された手がかりを用いたゼロショットプロンプト戦略を用いている。
実世界における236件のインタビューを対象とし,臨床評価と強い相関性を示した。
論文 参考訳(メタデータ) (2025-01-07T08:49:04Z) - Depression Detection on Social Media with Large Language Models [12.666554631713417]
ソーシャルメディアプラットフォームは、早期うつ病の診断に有用なデータソースを提供する。
大規模言語モデル(LLM)を利用したフレームワークであるDORISを提案する。
医療知識を統合するため、DORISはLSMを使用して、確立された診断基準に対してユーザテキストに注釈を付ける。
論文 参考訳(メタデータ) (2024-03-16T01:01:16Z) - Few-Shot Meta Learning for Recognizing Facial Phenotypes of Genetic
Disorders [55.41644538483948]
分類の自動化と類似性検索は、医師が可能な限り早期に遺伝状態の診断を行うための意思決定を支援する。
従来の研究は分類問題としてこの問題に対処し、深層学習法を用いてきた。
本研究では,健常人の大規模なコーパスで訓練した顔認識モデルを用いて,顔の表情認識に移行した。
論文 参考訳(メタデータ) (2022-10-23T11:52:57Z) - Speech based Depression Severity Level Classification Using a
Multi-Stage Dilated CNN-LSTM Model [5.419077350924331]
抑うつ分類タスクを重症度レベルの分類問題として定式化し、分類結果により粒度を提供する。
我々は,精神運動の減速によって生じる神経運動の調整の変化を捉えるために,調音コーディネート機能(ACF)を開発した。
論文 参考訳(メタデータ) (2021-04-09T05:10:08Z) - Deep Multi-task Learning for Depression Detection and Prediction in
Longitudinal Data [50.02223091927777]
うつ病は最も多い精神疾患の1つであり、世界中の年齢の何百万人もの人々に影響を与えている。
機械学習技術は、早期介入と治療のためのうつ病の自動検出と予測を可能にしている。
本稿では、この課題に対処するために、2つの補助的タスクでうつ病分類を共同最適化する、新しいディープマルチタスクリカレントニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2020-12-05T05:14:14Z) - Multimodal Depression Severity Prediction from medical bio-markers using
Machine Learning Tools and Technologies [0.0]
うつ病は世界中の精神疾患の主要な原因となっている。
近年,うつ病の診断とステージ予測の自動化に行動的手がかりが用いられている。
ラベル付き行動データセットの欠如と、膨大な量のバリエーションが、タスクを達成する上で大きな課題であることが証明されている。
論文 参考訳(メタデータ) (2020-09-11T20:44:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。