論文の概要: A Comprehensive Review of Datasets for Clinical Mental Health AI Systems
- arxiv url: http://arxiv.org/abs/2508.09809v2
- Date: Mon, 18 Aug 2025 15:27:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-19 12:43:44.895102
- Title: A Comprehensive Review of Datasets for Clinical Mental Health AI Systems
- Title(参考訳): 臨床メンタルヘルスAIシステムのためのデータセットの概観
- Authors: Aishik Mandal, Prottay Kumar Adhikary, Hiba Arnaout, Iryna Gurevych, Tanmoy Chakraborty,
- Abstract要約: 本稿では,AIを活用した臨床アシスタントの訓練・開発に関連する臨床精神保健データセットの総合的調査を行う。
本調査では, 縦断データの欠如, 文化・言語表現の制限, 一貫性のない収集・注釈基準, 合成データのモダリティの欠如など, 重要なギャップを明らかにした。
- 参考スコア(独自算出の注目度): 55.67299586253951
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Mental health disorders are rising worldwide. However, the availability of trained clinicians has not scaled proportionally, leaving many people without adequate or timely support. To bridge this gap, recent studies have shown the promise of Artificial Intelligence (AI) to assist mental health diagnosis, monitoring, and intervention. However, the development of efficient, reliable, and ethical AI to assist clinicians is heavily dependent on high-quality clinical training datasets. Despite growing interest in data curation for training clinical AI assistants, existing datasets largely remain scattered, under-documented, and often inaccessible, hindering the reproducibility, comparability, and generalizability of AI models developed for clinical mental health care. In this paper, we present the first comprehensive survey of clinical mental health datasets relevant to the training and development of AI-powered clinical assistants. We categorize these datasets by mental disorders (e.g., depression, schizophrenia), data modalities (e.g., text, speech, physiological signals), task types (e.g., diagnosis prediction, symptom severity estimation, intervention generation), accessibility (public, restricted or private), and sociocultural context (e.g., language and cultural background). Along with these, we also investigate synthetic clinical mental health datasets. Our survey identifies critical gaps such as a lack of longitudinal data, limited cultural and linguistic representation, inconsistent collection and annotation standards, and a lack of modalities in synthetic data. We conclude by outlining key challenges in curating and standardizing future datasets and provide actionable recommendations to facilitate the development of more robust, generalizable, and equitable mental health AI systems.
- Abstract(参考訳): メンタルヘルス障害は世界中で増加している。
しかし、訓練医の可用性は比例的に拡大せず、多くの人々が適切な支援やタイムリーな支援を受けていない。
このギャップを埋めるため、最近の研究では、メンタルヘルス診断、モニタリング、介入を支援する人工知能(AI)の約束が示されている。
しかし、臨床医を支援するための効率的で信頼性があり倫理的なAIの開発は、高品質な臨床訓練データセットに大きく依存している。
臨床AIアシスタントを訓練するためのデータキュレーションへの関心が高まっているが、既存のデータセットは散在し、文書化されていない、しばしばアクセスできないままであり、臨床精神医療のために開発されたAIモデルの再現性、可視性、一般化性を妨げている。
本稿では,AIを活用した臨床助手の訓練・開発に関連する臨床精神保健データセットについて,総合的な調査を行った。
これらのデータセットは、精神障害(うつ病、統合失調症)、データモダリティ(例えば、テキスト、スピーチ、生理的信号)、タスクタイプ(例えば、診断予測、症状重症度推定、介入生成)、アクセシビリティ(パブリック、制限、プライベート)、社会文化的背景(例えば、言語、文化的背景)によって分類される。
また,これらとともに,臨床精神保健の総合的データセットについても検討した。
本調査では, 縦断データの欠如, 文化・言語表現の制限, 一貫性のない収集・注釈基準, 合成データのモダリティの欠如など, 重要なギャップを明らかにした。
我々は、将来のデータセットのキュレーションと標準化における重要な課題を概説し、より堅牢で、一般化可能で、公平なメンタルヘルスAIシステムの開発を促進するために実行可能なレコメンデーションを提供する。
関連論文リスト
- Responsible Evaluation of AI for Mental Health [72.85175110624736]
メンタルヘルスケアにおけるAIツールの評価に対する現在のアプローチは、断片化されており、臨床実践、社会的コンテキスト、ファーストハンドのユーザエクスペリエンスと不整合である。
本稿では,臨床の健全性,社会的文脈,公平性を統合した学際的枠組みを導入することにより,責任ある評価を再考する。
論文 参考訳(メタデータ) (2026-01-20T12:55:10Z) - Position: AI Will Transform Neuropsychology Through Mental Health Digital Twins for Dynamic Mental Health Care, Especially for ADHD [5.844783557050257]
我々は、静的なメンタルヘルス診断アセスメントから、継続的人工知能(AI)によるアセスメントへの移行を提唱する。
本研究では,注意欠陥・多動性障害(ADHD)を事例として考察する。
本稿では、メンタルヘルス・デジタル・ツイン(MHDT)を、パーソナライズされたメンタルヘルスケアの変革的枠組みとして用いることを提案する。
論文 参考訳(メタデータ) (2025-10-08T18:06:15Z) - Medical Reasoning in the Era of LLMs: A Systematic Review of Enhancement Techniques and Applications [59.721265428780946]
医学における大きな言語モデル(LLM)は印象的な能力を実現しているが、体系的で透明で検証可能な推論を行う能力に重大なギャップが残っている。
本稿は、この新興分野に関する最初の体系的なレビューを提供する。
本稿では,学習時間戦略とテスト時間メカニズムに分類した推論強化手法の分類法を提案する。
論文 参考訳(メタデータ) (2025-08-01T14:41:31Z) - MoodAngels: A Retrieval-augmented Multi-agent Framework for Psychiatry Diagnosis [58.67342568632529]
MoodAngelsは、気分障害の診断のための最初の特殊なマルチエージェントフレームワークである。
MoodSynは、合成精神医学の1,173件のオープンソースデータセットである。
論文 参考訳(メタデータ) (2025-06-04T09:18:25Z) - Integrating Generative Artificial Intelligence in ADRD: A Roadmap for Streamlining Diagnosis and Care in Neurodegenerative Diseases [8.903189530397318]
医療システムは、特にアルツハイマー病と関連する認知症において、神経学的ケアの需要が増大するのに苦慮している。
LLMに基づく生成AIシステムは,ADRDケアにおける専門レベルの評価と意思決定に大規模にアプローチするために臨床能力を高めることができる。
論文 参考訳(メタデータ) (2025-02-06T19:09:11Z) - Multimodal Data-Driven Classification of Mental Disorders: A Comprehensive Approach to Diagnosing Depression, Anxiety, and Schizophrenia [0.9297614330263184]
本研究では、統合失調症、うつ病、不安などの精神疾患を診断するためのマルチモーダルデータ統合の可能性を検討する。
Apache Sparkと畳み込みニューラルネットワーク(CNN)を使用して、ビッグデータ環境のためのデータ駆動型分類パイプラインが開発された。
コヒーレンスの特徴の重要性は比較分析によって強調され、分類精度とロバスト性に大きな改善が見られた。
論文 参考訳(メタデータ) (2025-02-06T10:30:13Z) - Towards Privacy-aware Mental Health AI Models: Advances, Challenges, and Opportunities [61.633126163190724]
精神病は、社会的、個人的コストがかなり高い広範囲で不安定な状態である。
近年の人工知能(AI)の進歩は、うつ病、不安障害、双極性障害、統合失調症、外傷後ストレス障害などの病態を認識し、対処するための大きな可能性を秘めている。
データセットやトレーニング済みモデルからの機密データ漏洩のリスクを含むプライバシー上の懸念は、これらのAIシステムを実際の臨床環境にデプロイする上で、依然として重要な障壁である。
論文 参考訳(メタデータ) (2025-02-01T15:10:02Z) - Speaking the Same Language: Leveraging LLMs in Standardizing Clinical Data for AI [0.0]
本研究は、医療データの標準化など、特定の課題に対処するため、大規模言語モデルの採用を念頭においている。
この結果から,大規模言語モデルを用いることで手作業によるデータキュレーションの必要性が著しく低下することが示唆された。
提案手法は、医療におけるAIの統合を迅速化し、患者のケアの質を向上させるとともに、AIのためのデータ作成に必要な時間と資金を最小化する。
論文 参考訳(メタデータ) (2024-08-16T20:51:21Z) - TrialBench: Multi-Modal Artificial Intelligence-Ready Clinical Trial Datasets [54.98321887435557]
本稿では, マルチモーダル入力特徴と臨床治験設計における8つの重要な予測課題を網羅した, 精巧にキュレートされた23個のAI対応データセットについて述べる。
データセットのユーザビリティと信頼性を確保するため、各タスクに基本的な検証方法を提供する。
このようなオープンアクセスデータセットが利用可能になることは、臨床試験設計のための高度なAIアプローチの開発を促進することを期待する。
論文 参考訳(メタデータ) (2024-06-30T09:13:10Z) - Promoting the Responsible Development of Speech Datasets for Mental Health and Neurological Disorders Research [10.939564452457896]
我々は、メンタルヘルスや神経疾患のための音声データセットの展望をグラフ化する。
我々は、より責任ある研究を促進するために、倫理的な懸念に焦点を当てた実行可能なチェックリストにそれを蒸留する。
論文 参考訳(メタデータ) (2024-06-06T14:36:07Z) - From Classification to Clinical Insights: Towards Analyzing and Reasoning About Mobile and Behavioral Health Data With Large Language Models [21.427976533706737]
我々は,多センサデータから臨床的に有用な知見を合成するために,大規模言語モデルを活用する新しいアプローチを採っている。
うつ病や不安などの症状とデータの傾向がどのように関連しているかを,LSMを用いて推論する思考促進手法の連鎖を構築した。
GPT-4のようなモデルでは数値データの75%を正確に参照しており、臨床参加者は、この手法を用いて自己追跡データを解釈することへの強い関心を表明している。
論文 参考訳(メタデータ) (2023-11-21T23:53:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。