論文の概要: Beyond Classification: A Cough Regression Benchmark for Respiratory Acoustic Foundation Models
- arxiv url: http://arxiv.org/abs/2606.15436v1
- Date: Sat, 13 Jun 2026 18:58:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-16 16:21:33.572467
- Title: Beyond Classification: A Cough Regression Benchmark for Respiratory Acoustic Foundation Models
- Title(参考訳): 分類を超えて:呼吸音響基礎モデルのための粗回帰ベンチマーク
- Authors: Mayur Sanap, Prasanna Desikan, Edgar Lobaton,
- Abstract要約: 呼吸音響基礎モデル (FM) は, きず分類において優れる。
FMの音質から連続的な健康状態を予測できる能力はほとんど解明されていない。
マルチモデル・マルチターゲット・コーグ回帰ベンチマークを導入する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Respiratory acoustic foundation models (FMs) excel at cough classification, yet their ability to predict continuous health quantities from cough audio remains largely unexplored, despite the clinical value of passive age, BMI, and disease probability estimation in settings where physical measurements are unavailable. We introduce the multi-model, multi-target cough regression benchmark evaluating five FMs (OPERA-CT, OPERA-CE, OPERA-GT, HeAR, M2D+Resp) across six targets on three datasets under subject-disjoint protocols, comparing linear, MLP-small, and full MLP regression heads. MLP-small beats the mean-predictor baseline on all tasks and linear probing in 23 of 30 model x task cases, with full MLP overfitting on small clinical data but recovering on larger sets, revealing a dataset size x head-capacity trade-off. HeAR leads within-dataset age regression on Coswara (9.12 yr MAE); its CIDRZ result is excluded from headline claims owing to possible HeAR-CIDRZ pretraining overlap. OPERA-GT is favored over OPERA-CT on age in all three datasets, with the CIDRZ margin within seed variance, extending a generative-pretraining advantage from breath to cough. HeAR and M2D+Resp reach near-full performance at N = 50 samples while OPERA models require N = 400. Cross-dataset transfer is strongly asymmetric as large diverse data generalises to small clinical populations (CoughVID to CIDRZ: -0.17 yr) but not vice versa (CIDRZ to Coswara: +2.43 yr, +26.6%).
- Abstract(参考訳): 呼吸音響基礎モデル(FM)は, 物理的測定が不可能な環境では, 受動年齢, BMI, および疾患確率の臨床的価値にもかかわらず, コークスから連続的な健康状態を予測できる能力は, ほとんど未解明のままである。
我々は,5つのFM(OPERA-CT, OPERA-CE, OPERA-GT, HeAR, M2D+Resp)を主観解離プロトコル下での3つのデータセット上で比較し,線形, MLP-小, 完全MLP回帰ヘッドの比較を行った。
MLP-smallは、30のモデルxのタスクのうち23のモデルxのタスクに対して平均予測器ベースラインを上回り、小さな臨床データに完全にMLPオーバーフィットするが、より大きなセットで回復し、データセットサイズxの頭容量トレードオフを明らかにする。
HeARは、Coshara (9.12 yr MAE) 上でのデータセット内年齢の回帰を導くが、CIDRZの結果はHeAR-CIDRZの事前トレーニングオーバーラップの可能性があるため、ヘッドラインクレームから除外される。
OPERA-GTは3つのデータセットの年齢においてOPERA-CTよりも好まれており、CIDRZマージンは種子の分散の範囲内にあり、呼吸からうずまみまで生産的・予防的優位性を高めている。
HeARとM2D+Respは、N = 50サンプルでほぼフル性能に達し、OPERAモデルではN = 400が要求される。
CoughVID から CIDRZ へ -0.17 yr に一般化するが、その逆ではない(CIDRZ から Coshara へ +2.43 yr, +26.6%)。
関連論文リスト
- Serialisation Strategy Matters: How FHIR Data Format Affects LLM Medication Reconciliation [0.0]
5つのオープンウェイトモデル間での4つのFHIRシリアライゼーション戦略の最初の体系的比較を示す。
直列化戦略は,最大8Bパラメータのモデルの性能に大きく,統計的に有意な影響を及ぼすことがわかった。
より小さなモデルでは、約7~10の同時作用薬を投与し、多剤療法患者を残した。
論文 参考訳(メタデータ) (2026-04-22T20:39:35Z) - PRIME: Prototype-Driven Multimodal Pretraining for Cancer Prognosis with Missing Modalities [86.63247982275396]
PRIMEは、欠落を認識したマルチモーダルな自己教師型事前トレーニングフレームワークである。
部分的に観察されたコホートから頑健で伝達可能な表現を学ぶ。
The Cancer Genome AtlasのPRIMEを32種類の癌に対してラベルフリープレトレーニングで評価した。
論文 参考訳(メタデータ) (2026-04-05T21:14:27Z) - Multimodal Physical Activity Forecasting in Free-Living Clinical Settings: Hunting Opportunities for Just-in-Time Interventions [7.002143951776267]
本研究は,患者の活動行動を予測するライフスタイル介入システムであるMoveSenseを開発することを目的とする。
閉塞性睡眠時無呼吸症患者は, 58名, 60名であった。
論文 参考訳(メタデータ) (2024-10-12T20:44:00Z) - Brain Tumor Classification on MRI in Light of Molecular Markers [56.99710477905796]
1p/19q遺伝子の同時欠失は、低グレードグリオーマの臨床成績と関連している。
本研究の目的は,MRIを用いた畳み込みニューラルネットワークを脳がん検出に活用することである。
論文 参考訳(メタデータ) (2024-09-29T07:04:26Z) - Quantifying uncertainty in lung cancer segmentation with foundation models applied to mixed-domain datasets [6.712251433139412]
医用画像基盤モデルは、極小調整で臓器や腫瘍を分割する能力を示している。
これらのモデルは通常、タスク固有の分散(ID)データセットで評価される。
我々は、自己教師付き学習(SSL)で訓練された複数の基礎モデルの性能を評価するために、計算的に高速なメトリクスの包括的セットを導入する。
SMITは最も高いF1スコア(LRAD: 0.60, 5Rater: 0.64)と低いエントロピー(LRAD: 0.06, 5Rater: 0.12)を生成し、高い腫瘍検出率と確実なセグメンテーションを示した。
論文 参考訳(メタデータ) (2024-03-19T19:36:48Z) - The effect of data augmentation and 3D-CNN depth on Alzheimer's Disease
detection [51.697248252191265]
この研究は、データハンドリング、実験設計、モデル評価に関するベストプラクティスを要約し、厳密に観察する。
我々は、アルツハイマー病(AD)の検出に焦点を当て、医療における課題のパラダイム的な例として機能する。
このフレームワークでは,3つの異なるデータ拡張戦略と5つの異なる3D CNNアーキテクチャを考慮し,予測15モデルを訓練する。
論文 参考訳(メタデータ) (2023-09-13T10:40:41Z) - Federated Learning Enables Big Data for Rare Cancer Boundary Detection [98.5549882883963]
6大陸にわたる71の医療機関のデータを含む,これまでで最大のフェデレーテッドML研究の結果を報告する。
グリオ芽腫の稀な疾患に対する腫瘍境界自動検出装置を作製した。
当科では, 外科的に標的とした腫瘍の悪性度を高めるために, 33%の改善率を示し, 腫瘍全体に対する23%の改善率を示した。
論文 参考訳(メタデータ) (2022-04-22T17:27:00Z) - An Interpretable Web-based Glioblastoma Multiforme Prognosis Prediction
Tool using Random Forest Model [1.1024591739346292]
治療後1年間のGBM患者の健康状態を推定する予測モデルを提案する。
総計467名のGBM患者の臨床像を13の特徴と2つの経過日で比較検討した。
GBM患者生存の予後因子のトップ3はMGMT遺伝子プロモーター,切除範囲,年齢であった。
論文 参考訳(メタデータ) (2021-08-30T07:56:34Z) - Robust Finite Mixture Regression for Heterogeneous Targets [70.19798470463378]
本稿では,サンプルクラスタの探索と,複数の不完全な混合型ターゲットを同時にモデル化するFMRモデルを提案する。
我々は、高次元の学習フレームワークの下で、無症状のオラクルのパフォーマンス境界をモデルに提供します。
その結果,我々のモデルは最先端の性能を達成できることがわかった。
論文 参考訳(メタデータ) (2020-10-12T03:27:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。