論文の概要: Early Linguistic Pattern of Anxiety from Social Media Using Interpretable Linguistic Features: A Multi-Faceted Validation Study with Author-Disjoint Evaluation
- arxiv url: http://arxiv.org/abs/2601.11758v1
- Date: Fri, 16 Jan 2026 20:22:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-21 22:47:22.311181
- Title: Early Linguistic Pattern of Anxiety from Social Media Using Interpretable Linguistic Features: A Multi-Faceted Validation Study with Author-Disjoint Evaluation
- Title(参考訳): 解釈可能な言語的特徴を用いたソーシャルメディアからの不安の早期言語学的パターン:著者間関係評価による多面的検証
- Authors: Arnab Das Utsa,
- Abstract要約: 不安は世界中で数億の個人に影響を与えるが、大規模なスクリーニングは依然として限られている。
本研究は,言語的に解釈可能な特徴基底モデリングとドメイン間検証により,ソーシャルメディアに基づく不安検出への透過的なアプローチを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Anxiety affects hundreds of millions of individuals globally, yet large-scale screening remains limited. Social media language provides an opportunity for scalable detection, but current models often lack interpretability, keyword-robustness validation, and rigorous user-level data integrity. This work presents a transparent approach to social media-based anxiety detection through linguistically interpretable feature-grounded modeling and cross-domain validation. Using a substantial dataset of Reddit posts, we trained a logistic regression classifier on carefully curated subreddits for training, validation, and test splits. Comprehensive evaluation included feature ablation, keyword masking experiments, and varying-density difference analyses comparing anxious and control groups, along with external validation using clinically interviewed participants with diagnosed anxiety disorders. The model achieved strong performance while maintaining high accuracy even after sentiment removal or keyword masking. Early detection using minimal post history significantly outperformed random classification, and cross-domain analysis demonstrated strong consistency with clinical interview data. Results indicate that transparent linguistic features can support reliable, generalizable, and keyword-robust anxiety detection. The proposed framework provides a reproducible baseline for interpretable mental health screening across diverse online contexts.
- Abstract(参考訳): 不安は世界中で数億の個人に影響を与えるが、大規模なスクリーニングは依然として限られている。
ソーシャルメディア言語は、スケーラブルな検出の機会を提供するが、現在のモデルは、解釈可能性、キーワードロバスト性検証、厳密なユーザレベルのデータの整合性を欠いていることが多い。
本研究は,言語的に解釈可能な特徴基底モデリングとドメイン間検証により,ソーシャルメディアに基づく不安検出への透過的なアプローチを示す。
Reddit投稿のかなりのデータセットを使用して、トレーニング、検証、テスト分割のために慎重にキュレートされたサブレディットに対してロジスティック回帰分類器をトレーニングしました。
包括的評価には, 機能改善, キーワードマスキング実験, 不安群とコントロール群を比較した多彩な密度差分析, 臨床検査で診断された不安障害患者を用いた外的検証などが含まれていた。
このモデルは感情除去やキーワードマスキングの後にも高い精度を維持しながら高い性能を実現した。
術後の早期発見は, ランダム分類よりも有意に優れ, クロスドメイン解析は臨床面接データと強い整合性を示した。
その結果、透明な言語的特徴は信頼性、一般化可能、およびキーワードロバストな不安検出をサポートできることが示唆された。
提案するフレームワークは、様々なオンラインコンテキストにまたがるメンタルヘルススクリーニングのための再現可能なベースラインを提供する。
関連論文リスト
- A multimodal Bayesian Network for symptom-level depression and anxiety prediction from voice and speech data [36.77792803657935]
ベイジアン・ネットワーク・モデリングを用いて,導入におけるいくつかの重要な障壁に対処できることを論じる。
大規模データセットにおける音声・音声特徴からの抑うつ・不安症状予測モデルの評価を行った。
論文 参考訳(メタデータ) (2025-12-08T17:28:09Z) - A Comprehensive Evaluation of Multilingual Chain-of-Thought Reasoning: Performance, Consistency, and Faithfulness Across Languages [48.68444770923683]
マルチリンガル・チェーン・オブ・ソート(CoT)推論の最初の包括的研究について述べる。
LRMがターゲット言語ですぐに考えることができる場合、言語コンプライアンス、解答精度、解答一貫性を計測する。
思考の痕跡の質と有効性は、素早い言語によって大きく異なることがわかった。
論文 参考訳(メタデータ) (2025-10-10T17:06:50Z) - Human Texts Are Outliers: Detecting LLM-generated Texts via Out-of-distribution Detection [71.59834293521074]
我々は,人間によるテキストと機械によるテキストを区別する枠組みを開発した。
提案手法は,DeepFakeデータセット上で98.3%のAUROCとAUPRを8.9%のFPR95で達成する。
コード、事前トレーニングされたウェイト、デモがリリースされる。
論文 参考訳(メタデータ) (2025-10-07T08:14:45Z) - Detecting anxiety and depression in dialogues: a multi-label and explainable approach [5.635300481123079]
不安と抑うつは世界中で最も一般的なメンタルヘルスの問題であり、人口の非無視的な部分に影響を及ぼす。
本研究では、不安と抑うつの多ラベル分類のための全く新しいシステムを提案する。
論文 参考訳(メタデータ) (2024-12-23T15:29:46Z) - Unsupervised Model Diagnosis [49.36194740479798]
本稿では,ユーザガイドを使わずに,意味論的対実的説明を生成するために,Unsupervised Model Diagnosis (UMO)を提案する。
提案手法は意味論における変化を特定し可視化し,その変化を広範囲なテキストソースの属性と照合する。
論文 参考訳(メタデータ) (2024-10-08T17:59:03Z) - Uncertainty-aware Medical Diagnostic Phrase Identification and Grounding [72.18719355481052]
MRG(Messical Report Grounding)と呼ばれる新しい課題について紹介する。
MRGは医療報告から診断フレーズとその対応する接地箱を直接エンドツーエンドで識別することを目的としている。
マルチモーダルな大規模言語モデルを用いて診断フレーズを予測する,堅牢で信頼性の高いフレームワークである uMedGround を提案する。
論文 参考訳(メタデータ) (2024-04-10T07:41:35Z) - Early stopping by correlating online indicators in neural networks [0.24578723416255746]
本稿では,学習者の学習において過度に適合する現象を識別する新しい手法を提案する。
提案手法は,オンライン指標の収集における時間的相関を利用したものである。
一つの基準に焦点をあてた従来のアプローチとは対照的に、独立性評価の助成を生かしている。
論文 参考訳(メタデータ) (2024-02-04T14:57:20Z) - Identification of Cognitive Decline from Spoken Language through Feature
Selection and the Bag of Acoustic Words Model [0.0]
記憶障害の症状の早期発見は、集団の健康確保に重要な役割を担っている。
臨床環境における標準化された音声テストの欠如は、自然音声言語を解析するための自動機械学習技術の開発にますます重点を置いている。
この研究は特徴選択に関するアプローチを示し、ジュネーブの最小音響パラメータセットと相対音声停止から診断に必要な重要な特徴を自動的に選択することを可能にする。
論文 参考訳(メタデータ) (2024-02-02T17:06:03Z) - A Simple and Flexible Modeling for Mental Disorder Detection by Learning
from Clinical Questionnaires [0.2580765958706853]
そこで本研究では,テキストから直接意味を抽出し,症状に関連する記述と比較する手法を提案する。
詳細な分析により,提案モデルがドメイン知識の活用,他の精神疾患への伝達,解釈可能な検出結果の提供に有効であることが示唆された。
論文 参考訳(メタデータ) (2023-06-05T15:23:55Z) - Learning Language and Multimodal Privacy-Preserving Markers of Mood from
Mobile Data [74.60507696087966]
精神状態は、先進医療に共通する国でも診断されていない。
人間の行動を監視するための有望なデータソースのひとつは、日々のスマートフォンの利用だ。
本研究では,自殺行動のリスクが高い青少年集団の移動行動のデータセットを用いて,日常生活の行動マーカーについて検討した。
論文 参考訳(メタデータ) (2021-06-24T17:46:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。