論文の概要: Systematic FAIRness Assessment of Open Voice Biomarker Datasets for Mental Health and Neurodegenerative Diseases
- arxiv url: http://arxiv.org/abs/2508.14089v1
- Date: Thu, 14 Aug 2025 06:55:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-21 16:52:41.176764
- Title: Systematic FAIRness Assessment of Open Voice Biomarker Datasets for Mental Health and Neurodegenerative Diseases
- Title(参考訳): 精神保健・神経変性疾患に対する開声バイオマーカーデータセットの全身的機能評価
- Authors: Ishaan Mahapatra, Nihar R. Mahapatra,
- Abstract要約: 音声バイオマーカーは、メンタルヘルスと神経変性疾患の非侵襲的な検出とモニタリングのための有望なツールである。
本稿では,27種類の音声バイオマーカーデータセットについて,初めて体系的FAIR評価を行った。
メンタルヘルスデータセットは、FAIRスコアにおいてより多様性を示し、神経変性データセットはわずかに一貫性があった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Voice biomarkers--human-generated acoustic signals such as speech, coughing, and breathing--are promising tools for scalable, non-invasive detection and monitoring of mental health and neurodegenerative diseases. Yet, their clinical adoption remains constrained by inconsistent quality and limited usability of publicly available datasets. To address this gap, we present the first systematic FAIR (Findable, Accessible, Interoperable, Reusable) evaluation of 27 publicly available voice biomarker datasets focused on these disease areas. Using the FAIR Data Maturity Model and a structured, priority-weighted scoring method, we assessed FAIRness at subprinciple, principle, and composite levels. Our analysis revealed consistently high Findability but substantial variability and weaknesses in Accessibility, Interoperability, and Reusability. Mental health datasets exhibited greater variability in FAIR scores, while neurodegenerative datasets were slightly more consistent. Repository choice also significantly influenced FAIRness scores. To enhance dataset quality and clinical utility, we recommend adopting structured, domain-specific metadata standards, prioritizing FAIR-compliant repositories, and routinely applying structured FAIR evaluation frameworks. These findings provide actionable guidance to improve dataset interoperability and reuse, thereby accelerating the clinical translation of voice biomarker technologies.
- Abstract(参考訳): 音声バイオマーカー - 音声、うずく、呼吸などの人為的な音響信号 - は、スケーラブルで非侵襲的な検出と、メンタルヘルスや神経変性疾患のモニタリングのための有望なツールである。
しかし、彼らの臨床導入は、公開データセットの一貫性のない品質とユーザビリティの制限によって制限されている。
このギャップに対処するために、これらの疾患領域に焦点を当てた27の音声バイオマーカーデータセットについて、最初の体系的FAIR(Findable, Accessible, Interoperable, Reusable)の評価を行った。
FAIRデータ成熟度モデルと構造化された優先重み付きスコアリング手法を用いて, サブプリンシプル, 原理, 複合レベルでのFAIRネスを評価した。
分析の結果, アクセシビリティ, インターオペラビリティ, 再利用性において, 常に高いファインタビリティを示した。
メンタルヘルスデータセットは、FAIRスコアにおいてより多様性を示し、神経変性データセットはわずかに一貫性があった。
リポジトリの選択もFAIRnessスコアに大きく影響した。
データセットの品質と臨床的有用性を高めるため、構造化されたドメイン固有のメタデータ標準を採用し、FAIR準拠のリポジトリを優先順位付けし、構造化されたFAIR評価フレームワークを日常的に適用することを推奨する。
これらの知見は、データセットの相互運用性と再利用を改善するための実用的なガイダンスを提供し、それによって音声バイオマーカー技術の臨床的翻訳を加速させる。
関連論文リスト
- A Comprehensive Review of Datasets for Clinical Mental Health AI Systems [55.67299586253951]
本稿では,AIを活用した臨床アシスタントの訓練・開発に関連する臨床精神保健データセットの総合的調査を行う。
本調査では, 縦断データの欠如, 文化・言語表現の制限, 一貫性のない収集・注釈基準, 合成データのモダリティの欠如など, 重要なギャップを明らかにした。
論文 参考訳(メタデータ) (2025-08-13T13:42:35Z) - Detecting Dataset Bias in Medical AI: A Generalized and Modality-Agnostic Auditing Framework [8.017827642932746]
データセットに対する一般属性ユーティリティと検出可能性によるバイアステスト(G-AUDIT)は、モダリティに依存しないデータセット監査フレームワークである。
本手法は,患者属性を含むデータ特性とタスクレベルのアノテーションの関係について検討する。
G-AUDITは、従来の定性的手法で見過ごされる微妙な偏見をうまく識別する。
論文 参考訳(メタデータ) (2025-03-13T02:16:48Z) - Improving Multiple Sclerosis Lesion Segmentation Across Clinical Sites:
A Federated Learning Approach with Noise-Resilient Training [75.40980802817349]
深層学習モデルは、自動的にMS病変を分節する約束を示しているが、正確な注釈付きデータの不足は、この分野の進歩を妨げている。
我々は,MS病変の不均衡分布とファジィ境界を考慮したDecoupled Hard Label Correction(DHLC)戦略を導入する。
また,集約型中央モデルを利用したCELC(Centrally Enhanced Label Correction)戦略も導入した。
論文 参考訳(メタデータ) (2023-08-31T00:36:10Z) - TREEMENT: Interpretable Patient-Trial Matching via Personalized Dynamic
Tree-Based Memory Network [54.332862955411656]
臨床試験は薬物開発に不可欠であるが、しばしば高価で非効率な患者募集に苦しむ。
近年,患者と臨床試験を自動マッチングすることで患者採用を高速化する機械学習モデルが提案されている。
本稿では,TREement という名前の動的ツリーベースメモリネットワークモデルを導入する。
論文 参考訳(メタデータ) (2023-07-19T12:35:09Z) - Extrinsic Factors Affecting the Accuracy of Biomedical NER [0.1529342790344802]
バイオメディカル・ネーム・エンティティ・認識(NER)は、臨床テキスト中の構造化情報を特定することを目的とした批判的タスクである。
バイオメディカル領域のNERは、限られたデータ可用性のために困難である。
論文 参考訳(メタデータ) (2023-05-29T15:29:49Z) - Large Language Models for Healthcare Data Augmentation: An Example on
Patient-Trial Matching [49.78442796596806]
患者-心電図マッチング(LLM-PTM)のための革新的なプライバシ対応データ拡張手法を提案する。
本実験では, LLM-PTM法を用いて平均性能を7.32%向上させ, 新しいデータへの一般化性を12.12%向上させた。
論文 参考訳(メタデータ) (2023-03-24T03:14:00Z) - Key-Exchange Convolutional Auto-Encoder for Data Augmentation in Early Knee Osteoarthritis Detection [8.193689534916988]
Key-Exchange Convolutional Auto-Encoder (KECAE)は、初期のKOA分類のためのAIベースのデータ拡張戦略である。
我々のモデルは、合成画像を生成する新しいキー交換機構を備えた畳み込みオートエンコーダを用いる。
実験結果から,KECAEが生成したデータはKOA分類モデルの性能を大幅に向上することが示された。
論文 参考訳(メタデータ) (2023-02-26T15:45:19Z) - Quantifying the Reproducibility of Graph Neural Networks using
Multigraph Brain Data [0.0]
グラフニューラルネットワーク(GNN)は、コンピュータビジョン、コンピュータ支援診断、および関連分野におけるいくつかの問題に取り組む際に、前例のない増殖を目撃している。
これまでの研究では、モデルの精度の向上に焦点が当てられていたが、GNNによって特定される最も差別的な特徴を定量化することは、臨床応用における信頼性に関する懸念を生じさせる無傷の問題である。
異なるモデル間で共有される最も差別的な特徴(バイオマーカー)によるGNNアセスメントのためのフレームワークを初めて提案する。我々のフレームワークの健全性を確認するため、トレーニング戦略やトレーニング戦略などのさまざまな要因を取り入れている。
論文 参考訳(メタデータ) (2021-09-06T05:31:02Z) - The Medkit-Learn(ing) Environment: Medical Decision Modelling through
Simulation [81.72197368690031]
医用シーケンシャルな意思決定に特化して設計された新しいベンチマークスイートを提案する。
Medkit-Learn(ing) Environmentは、高忠実度合成医療データに簡単かつ簡単にアクセスできるPythonパッケージである。
論文 参考訳(メタデータ) (2021-06-08T10:38:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。