Fugu-MT 論文翻訳(概要): PaPaGei: Open Foundation Models for Optical Physiological Signals

論文の概要: PaPaGei: Open Foundation Models for Optical Physiological Signals

arxiv url: http://arxiv.org/abs/2410.20542v1
Date: Sun, 27 Oct 2024 18:18:06 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:41.041698
Title: PaPaGei: Open Foundation Models for Optical Physiological Signals
Title（参考訳）: PaPaGei:光学生理信号の基礎モデル
Authors: Arvind Pillai, Dimitris Spathis, Fahim Kawsar, Mohammad Malekzadeh,
Abstract要約: 光胸腺撮影は生体信号と心臓血管の健康をモニタリングする最も広く用いられている非侵襲的手法である。 PPG信号に基づいてトレーニングされた現在の機械学習モデルは、主にタスク固有であり、一般化性に欠ける。 PPG信号のための最初のオープン基盤モデルPaPaGeiを紹介する。
参考スコア（独自算出の注目度）: 8.78925327256804
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Photoplethysmography (PPG) is the most widely used non-invasive technique for monitoring biosignals and cardiovascular health, with applications in both clinical settings and consumer health through wearable devices. Current machine learning models trained on PPG signals are mostly task-specific and lack generalizability. Previous works often used single-device datasets, did not explore out-of-domain generalization, or did not release their models, hindering reproducibility and further research. We introduce PaPaGei, the first open foundation model for PPG signals. PaPaGei is pre-trained on more than 57,000 hours of 20 million unlabeled segments of PPG signals using publicly available datasets exclusively. We evaluate against popular time-series foundation models and other benchmarks on 20 tasks of 10 diverse datasets spanning cardiovascular health, sleep disorders, pregnancy monitoring, and wellbeing assessment. Our architecture incorporates novel representation learning approaches that leverage differences in PPG signal morphology across individuals, enabling it to capture richer representations than traditional contrastive learning methods. Across 20 tasks, PaPaGei improves classification and regression performance by an average of 6.3% and 2.9%, respectively, compared to other competitive time-series foundation models in at least 14 tasks. PaPaGei is more data- and parameter-efficient than other foundation models or methods, as it outperforms 70x larger models. Beyond accuracy, we also investigate robustness against different skin tones, establishing a benchmark for bias evaluations of future models. Notably, PaPaGei can be used out of the box as both a feature extractor and an encoder for other multimodal models, opening up new opportunities for multimodal health monitoring
Abstract（参考訳）: Photoplethysmography (PPG) は、生体信号や心臓血管の健康をモニタリングするための最も広く使われている非侵襲的手法であり、臨床設定とウェアラブルデバイスによる消費者の健康の両方に応用されている。 PPG信号に基づいてトレーニングされた現在の機械学習モデルは、主にタスク固有であり、一般化性に欠ける。以前の研究では、単一デバイスデータセットを使用したり、ドメイン外の一般化を探索したり、モデルをリリースしなかったり、再現性やさらなる研究を妨げたりすることが多かった。 PPG信号のための最初のオープン基盤モデルPaPaGeiを紹介する。 PaPaGeiは、公開データセットのみを使用して、2000万のPSG信号のラベル付けされていないセグメントの57,000時間以上で事前トレーニングされている。心血管疾患,睡眠障害,妊娠モニタリング,健康評価を対象とする10の多様なデータセットの20のタスクに対して,一般的な時系列基礎モデルや他のベンチマークを評価した。我々のアーキテクチャは、個人間でのPSG信号形態の差異を利用する新しい表現学習手法を取り入れており、従来のコントラスト学習法よりも豊かな表現を捉えることができる。 20タスクにわたってPaPaGeiは、少なくとも14タスクの他の競争的時系列基盤モデルと比較して、それぞれ平均6.3%と2.9%の分類と回帰性能を改善している。 PaPaGeiは他の基盤モデルやメソッドよりもデータとパラメータ効率が良く、70倍のモデルより優れています。精度以外にも、異なる肌のトーンに対する堅牢性についても検討し、将来のモデルのバイアス評価のためのベンチマークを確立する。特にPaPaGeiは、機能抽出器と他のマルチモーダルモデルのためのエンコーダの両方としてすぐに使えるようになり、マルチモーダルヘルスモニタリングの新しい機会が開かれる。

関連論文リスト

AI-Assisted Colonoscopy: Polyp Detection and Segmentation using Foundation Models [0.10037949839020764]
大腸内視鏡検査では、Deep Learningモデルの助けを借りて、欠落したポリープの80%を検出できた。この課題に対処できるアルゴリズムの探索において、ファンデーションモデルは有望な候補として浮上する。ゼロショットまたは少数ショットの学習機能により、広範囲の微調整なしに、新しいデータやタスクへの一般化が容易になる。ポリプセグメンテーションの基礎モデルを総合的に評価し, 検出と分解の両面から評価した。
論文参考訳（メタデータ） (2025-03-31T14:20:53Z)
Continuous Cardiac Arrest Prediction in ICU using PPG Foundation Model [6.469423282286416]
急性の健康イベントの追跡と予測のための非侵襲的な患者モニタリングは、新たな研究分野である。深達度表現のみを用いたICU患者のIHCA予測結果について報告する。また,潜在空間における患者の健康軌道のアーキテクチャチューニングとPaCMAP可視化を通じて,モデル全体を包括的に分析する。
論文参考訳（メタデータ） (2025-02-12T18:01:04Z)
Finetuning and Quantization of EEG-Based Foundational BioSignal Models on ECG and PPG Data for Blood Pressure Estimation [53.2981100111204]
光胸腺撮影と心電図は、連続血圧モニタリング(BP)を可能にする可能性がある。しかし、データ品質と患者固有の要因の変化のため、正確で堅牢な機械学習(ML)モデルは依然として困難である。本研究では,1つのモータリティで事前学習したモデルを効果的に利用して,異なる信号タイプの精度を向上させる方法について検討する。本手法は, 拡張期BPの最先端精度を約1.5倍に向上し, 拡張期BPの精度を1.5倍に向上させる。
論文参考訳（メタデータ） (2025-02-10T13:33:12Z)
Pulse-PPG: An Open-Source Field-Trained PPG Foundation Model for Wearable Applications Across Lab and Field Settings [15.077834063212704]
光胸腺撮影に基づく基礎モデルは、様々な健康分野にまたがる一般化の可能性から、注目を集めている。既存のPSGファウンデーションモデルはオープンソースだが、臨床データやクローズドソースに基づいてトレーニングされており、現実の環境での適用性が制限されている。我々はPulseを紹介した。Pulseは、120人の参加者による100日間のフィールド調査で収集された生PSGデータに特化して訓練された、オープンソースのPulse基盤モデルである。
論文参考訳（メタデータ） (2025-02-03T06:56:40Z)
SMPLest-X: Ultimate Scaling for Expressive Human Pose and Shape Estimation [81.36747103102459]
表現的人間のポーズと形状推定(EHPS)は、身体、手、顔の動きを多数の応用で統合する。現在の最先端の手法は、限定されたデータセット上で革新的なアーキテクチャ設計を訓練することに焦点を当てている。本稿では,EHPSのスケールアップが一般基盤モデルのファミリに与える影響について検討する。
論文参考訳（メタデータ） (2025-01-16T18:59:46Z)
EnhancePPG: Improving PPG-based Heart Rate Estimation with Self-Supervision and Augmentation [17.617241860357407]
本稿では、自己教師付き学習とデータ拡張を統合することにより、最先端のモデルを強化する手法であるEnhanceを提案する。 U-Netのようなオートエンコーダアーキテクチャにインスパイアされた我々は、大量のラベルのないデータを利用して、教師なしPSG信号再構成を利用する。 PPG-DaLiAの4.03 Beats-Per-Minute(BPM)から3.54 BPMエラーまで、最高の人事推定を12.2%改善します。
論文参考訳（メタデータ） (2024-12-20T13:25:50Z)
SemiHVision: Enhancing Medical Multimodal Models with a Semi-Human Annotated Dataset and Fine-Tuned Instruction Generation [13.672776832197918]
MLLM(Multimodal large language model)は大きな進歩を遂げているが、専門知識が限られているため、医療分野の課題に直面している。データ収集やモデル微調整,評価など,エンドツーエンドの学習パイプラインのさまざまな段階において,このギャップに対処することを目指している。
論文参考訳（メタデータ） (2024-10-19T02:35:35Z)
Evaluating Computational Pathology Foundation Models for Prostate Cancer Grading under Distribution Shifts [3.2995359570845912]
UNI (10万枚以上) と CONCH (1100万枚以上) の2つの計算病理基盤モデルを評価する。 UNIとCONCHはベースラインとよく比較できるが、絶対的な性能は特定の設定ではあまり満足できない。
論文参考訳（メタデータ） (2024-10-09T09:45:53Z)
Phikon-v2, A large and public feature extractor for biomarker prediction [42.52549987351643]
我々は、DINOv2を用いて視覚変換器を訓練し、このモデルの1つのイテレーションを公開して、Phikon-v2と呼ばれるさらなる実験を行う。 Phikon-v2は、公開されている組織学のスライドをトレーニングしながら、以前リリースしたモデル(Phikon)を上回り、プロプライエタリなデータでトレーニングされた他の病理学基盤モデル(FM)と同等に動作します。
論文参考訳（メタデータ） (2024-09-13T20:12:29Z)
CanvOI, an Oncology Intelligence Foundation Model: Scaling FLOPS Differently [0.0]
本稿では,VT-g/10ベースの基盤モデルであるCanvOIについて述べる。より大きなタイルサイズ(380 x 380ピクセル)と小さなパッチサイズ(10 x 10ピクセル)を導入することで、モデルの性能を最適化することができた。
論文参考訳（メタデータ） (2024-09-04T17:15:44Z)
Synthesizing Multimodal Electronic Health Records via Predictive Diffusion Models [69.06149482021071]
EHRPDと呼ばれる新しいEHRデータ生成モデルを提案する。時間間隔推定を組み込んだ拡散モデルである。我々は2つの公開データセットで実験を行い、忠実さ、プライバシー、実用性の観点からEPHPDを評価する。
論文参考訳（メタデータ） (2024-06-20T02:20:23Z)
Using Pre-training and Interaction Modeling for ancestry-specific disease prediction in UK Biobank [69.90493129893112]
近年のゲノムワイド・アソシエーション(GWAS)研究は、複雑な形質の遺伝的基盤を明らかにしているが、非ヨーロッパ系個体の低発現を示している。そこで本研究では,マルチオミクスデータを用いて,多様な祖先間での疾患予測を改善することができるかを評価する。
論文参考訳（メタデータ） (2024-04-26T16:39:50Z)
Towards a clinically accessible radiology foundation model: open-access and lightweight, with automated evaluation [113.5002649181103]
オープンソースの小型マルチモーダルモデル(SMM)を訓練し、放射線学における未測定臨床ニーズに対する能力ギャップを埋める。トレーニングのために,697万以上の画像テキストペアからなる大規模なデータセットを組み立てる。評価のために,GPT-4に基づく実測値CheXpromptを提案する。 LlaVA-Radの推論は高速で、単一のV100 GPU上でプライベート設定で実行できる。
論文参考訳（メタデータ） (2024-03-12T18:12:02Z)
A Meta-GNN approach to personalized seizure detection and classification [53.906130332172324]
本稿では,特定の患者に限られた発作サンプルから迅速に適応できるパーソナライズされた発作検出・分類フレームワークを提案する。トレーニング患者の集合からグローバルモデルを学ぶメタGNNベースの分類器を訓練する。本手法は, 未確認患者20回に限って, 精度82.7%, F1スコア82.08%を達成し, ベースラインよりも優れていた。
論文参考訳（メタデータ） (2022-11-01T14:12:58Z)
Generalizing electrocardiogram delineation: training convolutional neural networks with synthetic data augmentation [63.51064808536065]
ECGのデライン化のための既存のデータベースは小さく、サイズやそれらが表す病態の配列に不足している。まず、原データベースから抽出した基本セグメントのプールを与えられたECGトレースを確率的に合成し、その整合性のある合成トレースに配置するための一連のルールを考案した。第二に、2つの新しいセグメンテーションに基づく損失関数が開発され、これは、正確な数の独立構造の予測を強制し、サンプル数の削減に焦点をあてて、より密接なセグメンテーション境界を創出することを目的としている。
論文参考訳（メタデータ） (2021-11-25T10:11:41Z)
A multi-stage machine learning model on diagnosis of esophageal manometry [50.591267188664666]
このフレームワークには、飲み込みレベルにおけるディープラーニングモデルと、学習レベルにおける機能ベースの機械学習モデルが含まれている。これは、生のマルチスワローデータからHRM研究のCC診断を自動的に予測する最初の人工知能モデルである。
論文参考訳（メタデータ） (2021-06-25T20:09:23Z)
Predicting Clinical Diagnosis from Patients Electronic Health Records Using BERT-based Neural Networks [62.9447303059342]
医療コミュニティにおけるこの問題の重要性を示す。本稿では,変換器 (BERT) モデルによる2方向表現の分類順序の変更について述べる。約400万人のユニークな患者訪問からなる、大規模なロシアのEHRデータセットを使用します。
論文参考訳（メタデータ） (2020-07-15T09:22:55Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。