論文の概要: Efficient Large Scale Medical Image Dataset Preparation for Machine
Learning Applications
- arxiv url: http://arxiv.org/abs/2309.17285v1
- Date: Fri, 29 Sep 2023 14:41:02 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-02 13:24:19.295003
- Title: Efficient Large Scale Medical Image Dataset Preparation for Machine
Learning Applications
- Title(参考訳): 機械学習応用のための効率的な大規模医用画像データセットの作成
- Authors: Stefan Denner, Jonas Scherer, Klaus Kades, Dimitrios Bounias, Philipp
Schader, Lisa Kausch, Markus Bujotzek, Andreas Michael Bucher, Tobias
Penzkofer, Klaus Maier-Hein
- Abstract要約: 本稿では,Kaapanaオープンソースツールキットの一部として開発された,革新的なデータキュレーションツールを紹介する。
このツールは、放射線学者や機械学習研究者のニーズに合わせたものだ。
高度な検索、自動アノテーション、データキュレーションの改善のための効率的なタグ付け機能を備えている。
- 参考スコア(独自算出の注目度): 0.08484806297945031
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In the rapidly evolving field of medical imaging, machine learning algorithms
have become indispensable for enhancing diagnostic accuracy. However, the
effectiveness of these algorithms is contingent upon the availability and
organization of high-quality medical imaging datasets. Traditional Digital
Imaging and Communications in Medicine (DICOM) data management systems are
inadequate for handling the scale and complexity of data required to be
facilitated in machine learning algorithms. This paper introduces an innovative
data curation tool, developed as part of the Kaapana open-source toolkit, aimed
at streamlining the organization, management, and processing of large-scale
medical imaging datasets. The tool is specifically tailored to meet the needs
of radiologists and machine learning researchers. It incorporates advanced
search, auto-annotation and efficient tagging functionalities for improved data
curation. Additionally, the tool facilitates quality control and review,
enabling researchers to validate image and segmentation quality in large
datasets. It also plays a critical role in uncovering potential biases in
datasets by aggregating and visualizing metadata, which is essential for
developing robust machine learning models. Furthermore, Kaapana is integrated
within the Radiological Cooperative Network (RACOON), a pioneering initiative
aimed at creating a comprehensive national infrastructure for the aggregation,
transmission, and consolidation of radiological data across all university
clinics throughout Germany. A supplementary video showcasing the tool's
functionalities can be accessed at https://bit.ly/MICCAI-DEMI2023.
- Abstract(参考訳): 急速に発展する医療画像の分野において、機械学習アルゴリズムは診断精度を高めるために不可欠である。
しかし、これらのアルゴリズムの有効性は、高品質な医用画像データセットの可用性と組織化に起因している。
従来のDigital Imaging and Communications in Medicine (DICOM) データ管理システムは、機械学習アルゴリズムで容易に行うために必要なデータのスケールと複雑さを扱うには不十分である。
本稿では,大規模医用画像データセットの組織,管理,処理の合理化を目的とした,Kaapanaオープンソースツールキットの一部として開発された革新的なデータキュレーションツールを紹介する。
このツールは、放射線学者や機械学習研究者のニーズに合わせたものだ。
高度な検索、自動アノテーション、データキュレーションの改善のための効率的なタグ付け機能を備えている。
さらに、このツールは品質管理とレビューを容易にするため、研究者は大規模なデータセットで画像とセグメンテーションの品質を検証できる。
また、堅牢な機械学習モデルを開発する上で不可欠なメタデータの集約と視覚化によって、データセットの潜在的なバイアスを明らかにする上でも重要な役割を果たす。
さらに、カパナは、ドイツの全大学クリニックにおける放射線データの集約、送信、統合のための総合的な国家インフラの構築を目的とした先駆的イニシアチブであるRadiological Cooperative Network(RACOON)に組み込まれている。
ツールの機能を示す補足ビデオはhttps://bit.ly/MICCAI-DEMI2023で見ることができる。
関連論文リスト
- Full-Scale Indexing and Semantic Annotation of CT Imaging: Boosting FAIRness [0.41942958779358674]
提案手法は, 検索性, アクセシビリティ, インターオペラビリティ, 再利用性を向上させるために, 臨床計算断層撮影(CT)画像シリーズの統合と向上に重点を置いている。
メタデータはHL7 FHIRリソースで標準化され、研究プロジェクト間の効率的なデータ認識とデータ交換を可能にする。
この研究は、UKSH MeDIC内で堅牢なプロセスを統合することに成功し、23万以上のCT画像シリーズと800万以上のSNOMED CTアノテーションのセマンティックエンリッチ化につながった。
論文 参考訳(メタデータ) (2024-06-21T17:55:22Z) - Radiology Report Generation Using Transformers Conditioned with
Non-imaging Data [55.17268696112258]
本稿では,胸部X線画像と関連する患者の人口統計情報を統合したマルチモーダルトランスフォーマーネットワークを提案する。
提案ネットワークは、畳み込みニューラルネットワークを用いて、CXRから視覚的特徴を抽出し、その視覚的特徴と患者の人口統計情報のセマンティックテキスト埋め込みを組み合わせたトランスフォーマーベースのエンコーダデコーダネットワークである。
論文 参考訳(メタデータ) (2023-11-18T14:52:26Z) - Building Flexible, Scalable, and Machine Learning-ready Multimodal
Oncology Datasets [17.774341783844026]
本研究は、オンコロジーデータシステム(MINDS)のマルチモーダル統合を提案する。
MINDSはフレキシブルでスケーラブルで費用対効果の高いメタデータフレームワークで、公開ソースから異なるデータを効率的に分離する。
MINDSは、マルチモーダルデータを調和させることで、より分析能力の高い研究者を力づけることを目指している。
論文 参考訳(メタデータ) (2023-09-30T15:44:39Z) - Building RadiologyNET: Unsupervised annotation of a large-scale
multimodal medical database [0.4915744683251151]
医学的診断と治療における機械学習の使用は、近年顕著な成長をみせている。
しかし、アノテーションのプロセスは時間がかかり、コストがかかるため、大きな注釈付き画像データセットが利用できることは大きな障害である。
本稿では, 医用放射線画像のデータベースに意味的類似性について, 自動的に注釈付けを行う方法について検討する。
論文 参考訳(メタデータ) (2023-07-27T13:00:33Z) - DeepMediX: A Deep Learning-Driven Resource-Efficient Medical Diagnosis
Across the Spectrum [15.382184404673389]
この作業では,この課題に大きく対処する,画期的な,リソース効率の高いモデルである textttDeepMediX が紹介されている。
MobileNetV2アーキテクチャ上に構築されたDeepMediXは、脳MRIスキャンと皮膚がん画像の分類に長けている。
DeepMediXの設計にはフェデレートラーニングの概念も含まれている。
論文 参考訳(メタデータ) (2023-07-01T12:30:58Z) - LVM-Med: Learning Large-Scale Self-Supervised Vision Models for Medical
Imaging via Second-order Graph Matching [59.01894976615714]
LVM-Medは、大規模医療データセットに基づいてトレーニングされた、最初のディープネットワークファミリーである。
55の公開データセットから約13万の医療画像を収集しました。
LVM-Medは、多くの最先端の教師付き、自己監督型、基礎モデルよりも経験的に優れている。
論文 参考訳(メタデータ) (2023-06-20T22:21:34Z) - Surgical tool classification and localization: results and methods from
the MICCAI 2022 SurgToolLoc challenge [69.91670788430162]
SurgLoc 2022 チャレンジの結果を示す。
目標は、ツール検出のためにトレーニングされた機械学習モデルにおいて、ツールの存在データを弱いラベルとして活用することだった。
これらの結果を機械学習と手術データ科学の幅広い文脈で論じることで結論付ける。
論文 参考訳(メタデータ) (2023-05-11T21:44:39Z) - When Accuracy Meets Privacy: Two-Stage Federated Transfer Learning
Framework in Classification of Medical Images on Limited Data: A COVID-19
Case Study [77.34726150561087]
新型コロナウイルスのパンデミックが急速に広がり、世界の医療資源が不足している。
CNNは医療画像の解析に広く利用され、検証されている。
論文 参考訳(メタデータ) (2022-03-24T02:09:41Z) - Therapeutics Data Commons: Machine Learning Datasets and Tasks for
Therapeutics [84.94299203422658]
Therapeutics Data Commonsは、治療の全範囲にわたる機械学習を体系的にアクセスし、評価するためのフレームワークです。
TDCは、アルゴリズムの革新をバイオメディカルおよび臨床実装に翻訳できる、キュレートされたデータセットと学習タスクのコレクションです。
tdcはまた、データ機能、体系的モデル評価のための戦略、有意義なデータ分割、データプロセッサ、分子生成オラクルを含む、ツール、ライブラリ、リーダーボード、コミュニティリソースのエコシステムを提供する。
論文 参考訳(メタデータ) (2021-02-18T18:50:31Z) - A Multisite, Report-Based, Centralized Infrastructure for Feedback and
Monitoring of Radiology AI/ML Development and Clinical Deployment [0.0]
インタラクティブな放射線学報告手法は、画像の視聴、予測、自然言語処理(NLP)、および画像発見とレポート間のハイパーリンクの生成を統合する。
これらのイメージとラベルは、クラウドベースのシステムでキャプチャして集中することができる。
本手法は, 市販後監視および外部データに対する規制要件に対処する。
論文 参考訳(メタデータ) (2020-08-31T17:59:04Z) - Self-Training with Improved Regularization for Sample-Efficient Chest
X-Ray Classification [80.00316465793702]
挑戦的なシナリオで堅牢なモデリングを可能にするディープラーニングフレームワークを提案する。
その結果,85%のラベル付きデータを用いて,大規模データ設定で学習した分類器の性能に適合する予測モデルを構築することができた。
論文 参考訳(メタデータ) (2020-05-03T02:36:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。