論文の概要: HiRID-ICU-Benchmark -- A Comprehensive Machine Learning Benchmark on
High-resolution ICU Data
- arxiv url: http://arxiv.org/abs/2111.08536v3
- Date: Thu, 18 Nov 2021 09:00:45 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-19 12:09:51.483651
- Title: HiRID-ICU-Benchmark -- A Comprehensive Machine Learning Benchmark on
High-resolution ICU Data
- Title(参考訳): HiRID-ICU-Benchmark - 高解像度ICUデータの総合的機械学習ベンチマーク
- Authors: Hugo Y\`eche, Rita Kuznetsova, Marc Zimmermann, Matthias H\"user,
Xinrui Lyu, Martin Faltys, Gunnar R\"atsch
- Abstract要約: ICU関連タスクの幅広い範囲をカバーするベンチマークの提供を目指している。
HiRIDデータセットを用いて,臨床医とのコラボレーションによって開発された複数の臨床関連タスクを定義した。
我々は,このタイプのデータに対する深層学習アプローチのいくつかの制限を強調し,現在最先端のシーケンスモデリング手法を詳細に分析する。
- 参考スコア(独自算出の注目度): 0.8418021941792283
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The recent success of machine learning methods applied to time series
collected from Intensive Care Units (ICU) exposes the lack of standardized
machine learning benchmarks for developing and comparing such methods. While
raw datasets, such as MIMIC-IV or eICU, can be freely accessed on Physionet,
the choice of tasks and pre-processing is often chosen ad-hoc for each
publication, limiting comparability across publications. In this work, we aim
to improve this situation by providing a benchmark covering a large spectrum of
ICU-related tasks. Using the HiRID dataset, we define multiple clinically
relevant tasks developed in collaboration with clinicians. In addition, we
provide a reproducible end-to-end pipeline to construct both data and labels.
Finally, we provide an in-depth analysis of current state-of-the-art sequence
modeling methods, highlighting some limitations of deep learning approaches for
this type of data. With this benchmark, we hope to give the research community
the possibility of a fair comparison of their work.
- Abstract(参考訳): Intensive Care Units (ICU) から収集した時系列に適用される機械学習手法の最近の成功は、そのような手法の開発と比較のための標準化された機械学習ベンチマークの欠如を露呈している。
mimic-iv や eicu といった生のデータセットは physionet 上で自由にアクセスすることができるが、タスクの選択や前処理は各出版物に対して副次的に選択され、出版物間の互換性が制限される。
本研究では,ICU関連タスクの幅広い範囲をカバーするベンチマークを提供することで,この状況を改善することを目的とする。
HiRIDデータセットを用いて,臨床医とのコラボレーションによって開発された複数の臨床関連タスクを定義した。
さらに、再現可能なエンドツーエンドパイプラインを提供し、データとラベルの両方を構築する。
最後に,最先端のシーケンスモデリング手法の詳細な分析を行い,この種のデータに対するディープラーニングアプローチの限界を浮き彫りにする。
このベンチマークでは、研究コミュニティに彼らの成果を公正に比較できる可能性を与えたいと思っています。
関連論文リスト
- LESEN: Label-Efficient deep learning for Multi-parametric MRI-based
Visual Pathway Segmentation [5.726588626363204]
ラベル効率のよい自己認識型深層学習法(LESEN)を提案する。
LESENは教師なしと教師なしの損失を取り入れ、生徒と教師のモデルが相互に学習できるようにする。
ヒトコネクトームプロジェクト(HCP)のデータセットを用いた実験により,本手法の優れた性能が示された。
論文 参考訳(メタデータ) (2024-01-03T10:22:13Z) - On the Importance of Step-wise Embeddings for Heterogeneous Clinical
Time-Series [1.3285222309805063]
近年のシークエンス・モデリングの深層学習の進歩は、電子健康記録から時系列を扱うタスクに完全に移行していない。
特に、ICU(Intensive Care Unit)に関わる問題では、木に基づく手法で表形式でシーケンス分類に取り組むことが現状である。
論文 参考訳(メタデータ) (2023-11-15T12:18:15Z) - Yet Another ICU Benchmark: A Flexible Multi-Center Framework for Clinical ML [0.7982607013768545]
Another ICU Benchmark (YAIB) は、再現性と同等の臨床ML実験を定義するためのモジュラーフレームワークである。
YAIBは、ほとんどのオープンアクセスICUデータセット(MIMIC III/IV、eICU、HiRID、AUMCdb)をサポートし、将来のICUデータセットに容易に適応できる。
データセットの選択,コホート定義,前処理が予測性能に大きな影響を及ぼすことを示す。
論文 参考訳(メタデータ) (2023-06-08T11:16:20Z) - Time Associated Meta Learning for Clinical Prediction [78.99422473394029]
本稿では,時間関連メタラーニング(TAML)手法を提案する。
タスク分割後のスパーシリティ問題に対処するため、TAMLは時間情報共有戦略を採用し、正のサンプル数を増やす。
複数の臨床データセットに対するTAMLの有効性を示す。
論文 参考訳(メタデータ) (2023-03-05T03:54:54Z) - NEVIS'22: A Stream of 100 Tasks Sampled from 30 Years of Computer Vision
Research [96.53307645791179]
我々は,100以上の視覚的分類タスクのストリームからなるベンチマークであるNever-Ending VIsual-classification Stream (NEVIS'22)を紹介する。
分類に制限されているにもかかわらず、OCR、テクスチャ分析、シーン認識など、様々なタスクが生成される。
NEVIS'22は、タスクの規模と多様性のために、現在のシーケンシャルな学習アプローチに対して前例のない課題を提起している。
論文 参考訳(メタデータ) (2022-11-15T18:57:46Z) - An Extensive Data Processing Pipeline for MIMIC-IV [0.20326203100766121]
エンドツーエンドで完全にカスタマイズ可能なパイプラインを提供して、データの抽出、クリーン化、および前処理を行います。
ICUおよび非ICU関連臨床時系列予測タスクにおけるMIMICデータセットの第4版(MIMIC-IV)の予測と評価を行った。
論文 参考訳(メタデータ) (2022-04-29T01:09:38Z) - LifeLonger: A Benchmark for Continual Disease Classification [59.13735398630546]
MedMNISTコレクションの連続的な疾患分類のためのベンチマークであるLifeLongerを紹介する。
タスクとクラスでの病気の漸進的な学習は、モデルをスクラッチから再トレーニングすることなく、新しいサンプルを分類する問題に対処する。
クロスドメインインクリメンタル学習は、これまで得られた知識を維持しながら、異なる機関から派生したデータセットを扱う問題に対処する。
論文 参考訳(メタデータ) (2022-04-12T12:25:05Z) - Federated Cycling (FedCy): Semi-supervised Federated Learning of
Surgical Phases [57.90226879210227]
FedCyは、FLと自己教師付き学習を組み合わせた半教師付き学習(FSSL)手法で、ラベル付きビデオとラベルなしビデオの両方の分散データセットを利用する。
外科的段階の自動認識作業において,最先端のFSSL法よりも顕著な性能向上を示した。
論文 参考訳(メタデータ) (2022-03-14T17:44:53Z) - Continual Learning for Recurrent Neural Networks: a Review and Empirical
Evaluation [12.27992745065497]
リカレントニューラルネットワークによる連続学習は、受信データが定常的でない多数のアプリケーションへの道を開くことができる。
コントリビューションの分類とベンチマークのレビューを提供することで、シーケンシャルデータ処理のためのCLに関する文献を整理します。
我々は既存のデータセットに基づくシーケンシャルデータを持つclの新しいベンチマークを2つ提案する。
論文 参考訳(メタデータ) (2021-03-12T19:25:28Z) - A Meta-embedding-based Ensemble Approach for ICD Coding Prediction [64.42386426730695]
国際疾病分類 (icd) は、世界中で臨床コーディングに使われているデファクトコードである。
これらのコードにより、医療提供者は償還を請求し、診断情報の効率的な保管と検索を容易にします。
提案手法は,日常的な医学データと科学論文の外部知識を用いて,効果的に単語ベクトルを訓練することにより,神経モデルの性能を高める。
論文 参考訳(メタデータ) (2021-02-26T17:49:58Z) - Few-Shot Named Entity Recognition: A Comprehensive Study [92.40991050806544]
マルチショット設定のモデル一般化能力を向上させるための3つの手法を検討する。
ラベル付きデータの比率の異なる10の公開nerデータセットについて経験的比較を行う。
マルチショットとトレーニングフリーの両方の設定で最新の結果を作成します。
論文 参考訳(メタデータ) (2020-12-29T23:43:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。