論文の概要: Towards Resource-Efficient Streaming of Large-Scale Medical Image Datasets for Deep Learning
- arxiv url: http://arxiv.org/abs/2307.00438v2
- Date: Sat, 01 Feb 2025 06:16:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-04 16:07:48.073687
- Title: Towards Resource-Efficient Streaming of Large-Scale Medical Image Datasets for Deep Learning
- Title(参考訳): ディープラーニングのための大規模医用画像データセットの資源効率向上に向けて
- Authors: Pranav Kulkarni, Adway Kanhere, Eliot Siegel, Paul H. Yi, Vishwa S. Parekh,
- Abstract要約: 医療画像ストリーミングツールキット(MIST)は、単一の高解像度コピーから異なる解像度とフォーマットで医療画像のストリーミングを可能にする。
MISTは、画像の品質に影響を与えることなく、データセットのホスティングとダウンロードに必要なストレージと帯域幅を削減する。
- 参考スコア(独自算出の注目度): 3.8129962526689702
- License:
- Abstract: Large-scale medical imaging datasets have accelerated deep learning (DL) for medical image analysis. However, the large scale of these datasets poses a challenge for researchers, resulting in increased storage and bandwidth requirements for hosting and accessing them. Since different researchers have different use cases and require different resolutions or formats for DL, it is neither feasible to anticipate every researcher's needs nor practical to store data in multiple resolutions and formats. To that end, we propose the Medical Image Streaming Toolkit (MIST), a format-agnostic database that enables streaming of medical images at different resolutions and formats from a single high-resolution copy. We evaluated MIST across eight popular, large-scale medical imaging datasets spanning different body parts, modalities, and formats. Our results showed that our framework reduced the storage and bandwidth requirements for hosting and downloading datasets without impacting image quality. We demonstrate that MIST addresses the challenges posed by large-scale medical imaging datasets by building a data-efficient and format-agnostic database to meet the diverse needs of researchers and reduce barriers to DL research in medical imaging.
- Abstract(参考訳): 大規模医療画像データセットは、医用画像解析のためのディープラーニング(DL)を加速している。
しかし、これらのデータセットの大規模化は研究者の課題となり、ストレージと帯域幅が増加し、ホスティングやアクセスが困難になる。
異なる研究者は異なるユースケースを持ち、DLの解像度やフォーマットを必要とするため、すべての研究者のニーズを予測したり、複数の解像度やフォーマットにデータを保存したりすることは不可能である。
そこで我々は,MIST (Malical Image Streaming Toolkit) を提案する。MISTは,単一の高解像度コピーから異なる解像度とフォーマットで医療画像のストリーミングを可能にするフォーマットに依存しないデータベースである。
我々は,MISTを,身体部位,モダリティ,フォーマットにまたがる8種類の大規模医用画像データセットで評価した。
我々のフレームワークは,画像品質に影響を与えることなく,データセットのホスティングとダウンロードに必要なストレージと帯域幅を削減した。
MISTは,データ効率とフォーマットに依存しないデータベースを構築し,研究者のニーズを満たすとともに,医用画像におけるDL研究の障壁を低減することで,大規模医用画像データセットがもたらす課題に対処することを実証した。
関連論文リスト
- Latent Drifting in Diffusion Models for Counterfactual Medical Image Synthesis [55.959002385347645]
大規模なデータセットのトレーニングによるスケーリングは、画像生成の品質と忠実度を高め、拡散モデルによる操作を可能にすることが示されている。
遅延ドリフトにより、医療画像に対して拡散モデルを条件付けし、反ファクト画像生成の複雑なタスクに適合させることができる。
本研究は,異なる微調整方式と組み合わせた場合,様々なシナリオにおいて顕著な性能向上を示すものである。
論文 参考訳(メタデータ) (2024-12-30T01:59:34Z) - UniMed-CLIP: Towards a Unified Image-Text Pretraining Paradigm for Diverse Medical Imaging Modalities [68.12889379702824]
対照的な学習によって訓練された視覚言語モデル(VLM)は、自然画像タスクにおいて顕著な成功を収めた。
UniMedは530万以上の画像テキストペアからなる、大規模でオープンソースのマルチモーダル医療データセットである。
我々は、6つのモダリティのための統一VLMであるUniMed-CLIPを訓練し、ゼロショット評価において顕著な利益を得た。
論文 参考訳(メタデータ) (2024-12-13T18:59:40Z) - BIMCV-R: A Landmark Dataset for 3D CT Text-Image Retrieval [44.92177279141073]
我々は,200万枚以上のスライスを含む8,069個の3次元CTボリュームのデータセットを,それぞれの放射線学的報告と組み合わせて提示する。
次に、大規模な言語モデルの可能性を活用した検索戦略であるMedFinderを構築します。
これは、テキスト・トゥ・イメージ、画像・トゥ・テキスト、キーワードベースの検索タスクを容易に行えるシステムを開発するための予備的なステップである。
論文 参考訳(メタデータ) (2024-03-24T03:10:07Z) - Building Universal Foundation Models for Medical Image Analysis with
Spatially Adaptive Networks [5.661631789478932]
医用画像解析のための普遍的基礎モデルを提案する。
55の公開医用画像データセット上のマスク画像モデリング(MIM)を用いて、空間適応型視覚トークンーザ(SPAD-VT)と空間適応型視覚変換器(SPAD-ViT)を事前訓練する。
下流の医用画像分類とセグメンテーションタスクの実験結果から,本モデルの性能とラベルの効率が向上したことを示す。
論文 参考訳(メタデータ) (2023-12-12T08:33:45Z) - LVM-Med: Learning Large-Scale Self-Supervised Vision Models for Medical
Imaging via Second-order Graph Matching [59.01894976615714]
LVM-Medは、大規模医療データセットに基づいてトレーニングされた、最初のディープネットワークファミリーである。
55の公開データセットから約13万の医療画像を収集しました。
LVM-Medは、多くの最先端の教師付き、自己監督型、基礎モデルよりも経験的に優れている。
論文 参考訳(メタデータ) (2023-06-20T22:21:34Z) - Advanced Medical Image Representation for Efficient Processing and
Transfer in Multisite Clouds [0.6091702876917281]
医療機関の人間の脳データベースは、年間数十テラバイトのデータを蓄積することができる。
医用画像に保持される情報を改善する複数のデータ構造に基づく新しい医用画像フォーマット表現を提案する。
論文 参考訳(メタデータ) (2023-04-29T18:09:17Z) - Engineering AI Tools for Systematic and Scalable Quality Assessment in
Magnetic Resonance Imaging [0.0]
大きなMRIデータリポジトリの構築には、プライバシ、データサイズ、DICOMフォーマット、ロジスティクス、非標準化イメージに関する複数の課題がある。
データリポジトリの構築は難しいだけでなく、リポジトリからプールされたデータを使用することも難しい。
本稿では,大規模なMRIデータレポジトリの構築と,それらのデータレポジトリからダウンロードされたデータの利用に関する課題について述べる。
論文 参考訳(メタデータ) (2021-12-02T22:47:16Z) - Generative Adversarial U-Net for Domain-free Medical Image Augmentation [49.72048151146307]
注釈付き医用画像の不足は、医用画像コンピューティングの分野における最大の課題の1つだ。
本稿では,生成逆U-Netという新しい生成手法を提案する。
当社の新しいモデルは、ドメインフリーで、さまざまな医療画像に汎用性があります。
論文 参考訳(メタデータ) (2021-01-12T23:02:26Z) - Cross-Modal Information Maximization for Medical Imaging: CMIM [62.28852442561818]
病院では、同じ情報を異なるモダリティの下で利用できるようにする特定の情報システムにデータがサイロ化される。
これは、テスト時に常に利用できないかもしれない同じ情報の複数のビューを列車で取得し、使用するためのユニークな機会を提供する。
テスト時にモダリティの低下に耐性を持つマルチモーダル入力の優れた表現を学習することで、利用可能なデータを最大限活用する革新的なフレームワークを提案する。
論文 参考訳(メタデータ) (2020-10-20T20:05:35Z) - Discriminative Cross-Modal Data Augmentation for Medical Imaging
Applications [24.06277026586584]
深層学習法は医用画像解析において大きな成功を収めており、訓練には多くの医用画像が必要である。
データプライバシの懸念と医療アノテータの有効性のため、モデルトレーニングのためにラベル付き医療画像を得るのは非常に困難であることが多い。
本稿では,画像のソースモダリティを目標モダリティに変換する画像対画像変換モデルを提案する。
論文 参考訳(メタデータ) (2020-10-07T15:07:00Z) - Universal Model for Multi-Domain Medical Image Retrieval [88.67940265012638]
医用画像検索(MIR)は、医師が類似した患者のデータを素早く見つけるのに役立つ。
MIRはデジタル画像モダリティの多用により、ますます役に立ちつつある。
しかし、病院における様々なデジタル画像モダリティの人気もまた、MIRにいくつかの課題をもたらしている。
論文 参考訳(メタデータ) (2020-07-14T23:22:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。