論文の概要: A Comprehensive Survey of Datasets for Clinical Mental Health AI Systems
- arxiv url: http://arxiv.org/abs/2508.09809v1
- Date: Wed, 13 Aug 2025 13:42:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-14 20:42:00.908132
- Title: A Comprehensive Survey of Datasets for Clinical Mental Health AI Systems
- Title(参考訳): クリニカルメンタルヘルスAIシステムのためのデータセットに関する総合的調査
- Authors: Aishik Mandal, Prottay Kumar Adhikary, Hiba Arnaout, Iryna Gurevych, Tanmoy Chakraborty,
- Abstract要約: 本稿では,AIを活用した臨床アシスタントの訓練・開発に関連する臨床精神保健データセットの総合的調査を行う。
本調査では, 縦断データの欠如, 文化・言語表現の制限, 一貫性のない収集・注釈基準, 合成データのモダリティの欠如など, 重要なギャップを明らかにした。
- 参考スコア(独自算出の注目度): 55.67299586253951
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Mental health disorders are rising worldwide. However, the availability of trained clinicians has not scaled proportionally, leaving many people without adequate or timely support. To bridge this gap, recent studies have shown the promise of Artificial Intelligence (AI) to assist mental health diagnosis, monitoring, and intervention. However, the development of efficient, reliable, and ethical AI to assist clinicians is heavily dependent on high-quality clinical training datasets. Despite growing interest in data curation for training clinical AI assistants, existing datasets largely remain scattered, under-documented, and often inaccessible, hindering the reproducibility, comparability, and generalizability of AI models developed for clinical mental health care. In this paper, we present the first comprehensive survey of clinical mental health datasets relevant to the training and development of AI-powered clinical assistants. We categorize these datasets by mental disorders (e.g., depression, schizophrenia), data modalities (e.g., text, speech, physiological signals), task types (e.g., diagnosis prediction, symptom severity estimation, intervention generation), accessibility (public, restricted or private), and sociocultural context (e.g., language and cultural background). Along with these, we also investigate synthetic clinical mental health datasets. Our survey identifies critical gaps such as a lack of longitudinal data, limited cultural and linguistic representation, inconsistent collection and annotation standards, and a lack of modalities in synthetic data. We conclude by outlining key challenges in curating and standardizing future datasets and provide actionable recommendations to facilitate the development of more robust, generalizable, and equitable mental health AI systems.
- Abstract(参考訳): メンタルヘルス障害は世界中で増加している。
しかし、訓練医の可用性は比例的に拡大せず、多くの人々が適切な支援やタイムリーな支援を受けていない。
このギャップを埋めるため、最近の研究では、メンタルヘルス診断、モニタリング、介入を支援する人工知能(AI)の約束が示されている。
しかし、臨床医を支援するための効率的で信頼性があり倫理的なAIの開発は、高品質な臨床訓練データセットに大きく依存している。
臨床AIアシスタントを訓練するためのデータキュレーションへの関心が高まっているが、既存のデータセットは散在し、文書化されていない、しばしばアクセスできないままであり、臨床精神医療のために開発されたAIモデルの再現性、可視性、一般化性を妨げている。
本稿では,AIを活用した臨床助手の訓練・開発に関連する臨床精神保健データセットについて,総合的な調査を行った。
これらのデータセットは、精神障害(うつ病、統合失調症)、データモダリティ(例えば、テキスト、スピーチ、生理的信号)、タスクタイプ(例えば、診断予測、症状重症度推定、介入生成)、アクセシビリティ(パブリック、制限、プライベート)、社会文化的背景(例えば、言語、文化的背景)によって分類される。
また,これらとともに,臨床精神保健の総合的データセットについても検討した。
本調査では, 縦断データの欠如, 文化・言語表現の制限, 一貫性のない収集・注釈基準, 合成データのモダリティの欠如など, 重要なギャップを明らかにした。
我々は、将来のデータセットのキュレーションと標準化における重要な課題を概説し、より堅牢で、一般化可能で、公平なメンタルヘルスAIシステムの開発を促進するために実行可能なレコメンデーションを提供する。
関連論文リスト
- Medical Reasoning in the Era of LLMs: A Systematic Review of Enhancement Techniques and Applications [59.721265428780946]
医学における大きな言語モデル(LLM)は印象的な能力を実現しているが、体系的で透明で検証可能な推論を行う能力に重大なギャップが残っている。
本稿は、この新興分野に関する最初の体系的なレビューを提供する。
本稿では,学習時間戦略とテスト時間メカニズムに分類した推論強化手法の分類法を提案する。
論文 参考訳(メタデータ) (2025-08-01T14:41:31Z) - Integrating Generative Artificial Intelligence in ADRD: A Roadmap for Streamlining Diagnosis and Care in Neurodegenerative Diseases [8.903189530397318]
医療システムは、特にアルツハイマー病と関連する認知症において、神経学的ケアの需要が増大するのに苦慮している。
LLMに基づく生成AIシステムは,ADRDケアにおける専門レベルの評価と意思決定に大規模にアプローチするために臨床能力を高めることができる。
論文 参考訳(メタデータ) (2025-02-06T19:09:11Z) - Towards Privacy-aware Mental Health AI Models: Advances, Challenges, and Opportunities [61.633126163190724]
精神病は、社会的、個人的コストがかなり高い広範囲で不安定な状態である。
近年の人工知能(AI)の進歩は、うつ病、不安障害、双極性障害、統合失調症、外傷後ストレス障害などの病態を認識し、対処するための大きな可能性を秘めている。
データセットやトレーニング済みモデルからの機密データ漏洩のリスクを含むプライバシー上の懸念は、これらのAIシステムを実際の臨床環境にデプロイする上で、依然として重要な障壁である。
論文 参考訳(メタデータ) (2025-02-01T15:10:02Z) - TrialBench: Multi-Modal Artificial Intelligence-Ready Clinical Trial Datasets [54.98321887435557]
本稿では, マルチモーダル入力特徴と臨床治験設計における8つの重要な予測課題を網羅した, 精巧にキュレートされた23個のAI対応データセットについて述べる。
データセットのユーザビリティと信頼性を確保するため、各タスクに基本的な検証方法を提供する。
このようなオープンアクセスデータセットが利用可能になることは、臨床試験設計のための高度なAIアプローチの開発を促進することを期待する。
論文 参考訳(メタデータ) (2024-06-30T09:13:10Z) - From Classification to Clinical Insights: Towards Analyzing and Reasoning About Mobile and Behavioral Health Data With Large Language Models [21.427976533706737]
我々は,多センサデータから臨床的に有用な知見を合成するために,大規模言語モデルを活用する新しいアプローチを採っている。
うつ病や不安などの症状とデータの傾向がどのように関連しているかを,LSMを用いて推論する思考促進手法の連鎖を構築した。
GPT-4のようなモデルでは数値データの75%を正確に参照しており、臨床参加者は、この手法を用いて自己追跡データを解釈することへの強い関心を表明している。
論文 参考訳(メタデータ) (2023-11-21T23:53:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。