論文の概要: Platform for generating medical datasets for machine learning in public
health
- arxiv url: http://arxiv.org/abs/2310.08532v1
- Date: Thu, 12 Oct 2023 17:23:52 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-14 08:35:33.388843
- Title: Platform for generating medical datasets for machine learning in public
health
- Title(参考訳): 公衆衛生における機械学習のための医療データセット作成プラットフォーム
- Authors: Anna Andreychenko, Viktoriia Korzhuk, Stanislav Kondratenko, Polina
Cheraneva
- Abstract要約: 本稿では,マルチモーダル医療データの品質と信頼性を持続的に生成するプラットフォームの概念を実証する。
異なる外部ソースからデータを収集し、特別なサービスを使用して調和させ、調和したデータを匿名化し、処理されたデータをラベル付けする。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Currently, there are many difficulties regarding the interoperability of
medical data and related population data sources. These complications get in
the way of the generation of high-quality data sets at city, region and
national levels. Moreover, the collection of datasets within large medical
centers is feasible due to own IT departments whereas the collection of raw
medical data from multiple organizations is a more complicated process. In
these circumstances, the most appropriate option is to develop digital products
based on microservice architecture. Because of this approach, it is possible to
ensure the multimodality of the system, the flexibility of the interface and
the internal system approach, when interconnected elements behave as a whole,
demonstrating behavior different from the behavior when working independently.
These conditions allow, in turn, to ensure the maximum number and
representativeness of the resulting data sets. This paper demonstrates a
concept of the platform for a sustainable generation of quality and reliable
sets of multimodal medical data. It collects data from different external
sources, harmonizes it using a special service, anonymizes harmonized data, and
labels processed data. The proposed system aims to be a promising solution to
the improvement of medical data quality for machine learning.
- Abstract(参考訳): 現在、医療データと関連する人口データソースの相互運用には多くの困難がある。
これらの複雑さは、都市、地域、国家レベルでの高品質なデータセットの生成の邪魔になる。
さらに、大規模な医療センター内のデータセットの収集は、it部門によって実現可能だが、複数の組織から生の医療データの収集は、より複雑なプロセスである。
このような状況において、最も適切な選択肢は、マイクロサービスアーキテクチャに基づいたディジタル製品を開発することだ。
このアプローチにより、相互接続された要素が全体として振る舞うとき、システムのマルチモーダル性、インターフェースの柔軟性、内部システムアプローチが保証され、独立して働くときの挙動とは異なる振る舞いを示すことができる。
これらの条件により、結果として得られるデータセットの最大数と代表性が保証される。
本稿では,マルチモーダル医療データの品質と信頼性を持続的に生成するプラットフォームの概念を実証する。
異なる外部ソースからデータを収集し、特別なサービスを使って調和させ、調和したデータを匿名化し、処理されたデータをラベル付けする。
提案システムは,機械学習のための医療データ品質向上のための,有望なソリューションである。
関連論文リスト
- Building Flexible, Scalable, and Machine Learning-ready Multimodal
Oncology Datasets [17.774341783844026]
本研究は、オンコロジーデータシステム(MINDS)のマルチモーダル統合を提案する。
MINDSはフレキシブルでスケーラブルで費用対効果の高いメタデータフレームワークで、公開ソースから異なるデータを効率的に分離する。
MINDSは、マルチモーダルデータを調和させることで、より分析能力の高い研究者を力づけることを目指している。
論文 参考訳(メタデータ) (2023-09-30T15:44:39Z) - UnitedHuman: Harnessing Multi-Source Data for High-Resolution Human
Generation [59.77275587857252]
総合的な人間のデータセットは、必然的に、局所的な部分についての不十分で低解像度な情報を持っている。
本稿では,高解像度な人為的生成モデルを共同で学習するために,様々な解像度画像を用いたマルチソースデータセットを提案する。
論文 参考訳(メタデータ) (2023-09-25T17:58:46Z) - Incomplete Multimodal Learning for Complex Brain Disorders Prediction [65.95783479249745]
本稿では,変換器と生成対向ネットワークを用いた不完全なマルチモーダルデータ統合手法を提案する。
アルツハイマー病神経画像イニシアチブコホートを用いたマルチモーダルイメージングによる認知変性と疾患予後の予測に本手法を適用した。
論文 参考訳(メタデータ) (2023-05-25T16:29:16Z) - Patchwork Learning: A Paradigm Towards Integrative Analysis across
Diverse Biomedical Data Sources [40.32772510980854]
パッチワーク学習(PL)とは、異なるデータモダリティからなる異なるデータセットからの情報を統合するパラダイムである。
PLはデータのプライバシを保持しながら、補完的なデータソースの同時利用を可能にする。
本稿では、パッチワーク学習の概念とその医療における実装について紹介し、潜在的な機会と適用可能なデータソースを探求する。
論文 参考訳(メタデータ) (2023-05-10T14:50:33Z) - Integrated multimodal artificial intelligence framework for healthcare
applications [3.6222901399459215]
我々は,マルチモーダル入力を利用するAIシステムの生成とテストを容易にするために,統合されたホリスティックAI in Medicineフレームワークを提案し,評価する。
このアプローチでは、一般化可能なデータ前処理と機械学習モデリングステージを使用し、医療環境における研究やデプロイメントに容易に適応できる。
このフレームワークは、さまざまなヘルスケアのデモンストレーションにおいて、同様のシングルソースアプローチを上回る、一貫して、堅牢にモデルを生成できることを示します。
論文 参考訳(メタデータ) (2022-02-25T22:08:09Z) - Practical Challenges in Differentially-Private Federated Survival
Analysis of Medical Data [57.19441629270029]
本稿では,ニューラルネットワークの本質的特性を活用し,生存分析モデルの訓練過程を関連づける。
小さな医療データセットと少数のデータセンターの現実的な設定では、このノイズはモデルを収束させるのが難しくなります。
DPFed-post は,私的フェデレート学習方式に後処理の段階を追加する。
論文 参考訳(メタデータ) (2022-02-08T10:03:24Z) - A Methodology for a Scalable, Collaborative, and Resource-Efficient
Platform to Facilitate Healthcare AI Research [0.0]
本稿では,データ取得,データセット開発と分析,AIモデル開発を高速化するシステムを提案する。
このシステムは、1時間に15,000人の患者記録を取り込み、各記録は何千もの測定値、テキストノート、高解像度のデータを表す。
論文 参考訳(メタデータ) (2021-12-13T18:39:10Z) - The Medkit-Learn(ing) Environment: Medical Decision Modelling through
Simulation [81.72197368690031]
医用シーケンシャルな意思決定に特化して設計された新しいベンチマークスイートを提案する。
Medkit-Learn(ing) Environmentは、高忠実度合成医療データに簡単かつ簡単にアクセスできるPythonパッケージである。
論文 参考訳(メタデータ) (2021-06-08T10:38:09Z) - Cross-Modal Information Maximization for Medical Imaging: CMIM [62.28852442561818]
病院では、同じ情報を異なるモダリティの下で利用できるようにする特定の情報システムにデータがサイロ化される。
これは、テスト時に常に利用できないかもしれない同じ情報の複数のビューを列車で取得し、使用するためのユニークな機会を提供する。
テスト時にモダリティの低下に耐性を持つマルチモーダル入力の優れた表現を学習することで、利用可能なデータを最大限活用する革新的なフレームワークを提案する。
論文 参考訳(メタデータ) (2020-10-20T20:05:35Z) - A Deep Learning Pipeline for Patient Diagnosis Prediction Using
Electronic Health Records [0.5672132510411464]
我々は、公衆衛生データセットを普遍的なフォーマットに容易に変換するPythonパッケージを開発し、公開する。
複数の診断を同時に予測する2つの新しいモデルアーキテクチャを提案する。
どちらのモデルも高い精度で複数の診断を同時に予測できる。
論文 参考訳(メタデータ) (2020-06-23T14:58:58Z) - MS-Net: Multi-Site Network for Improving Prostate Segmentation with
Heterogeneous MRI Data [75.73881040581767]
本稿では,ロバスト表現を学習し,前立腺のセグメンテーションを改善するための新しいマルチサイトネットワーク(MS-Net)を提案する。
当社のMS-Netは,すべてのデータセットのパフォーマンスを一貫して改善し,マルチサイト学習における最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2020-02-09T14:11:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。