論文の概要: Sculpting Efficiency: Pruning Medical Imaging Models for On-Device
Inference
- arxiv url: http://arxiv.org/abs/2309.05090v2
- Date: Thu, 2 Nov 2023 00:15:19 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-03 16:42:04.286827
- Title: Sculpting Efficiency: Pruning Medical Imaging Models for On-Device
Inference
- Title(参考訳): 走査効率:オンデバイス推論のための医用イメージングモデルの作成
- Authors: Sudarshan Sreeram and Bernhard Kainz
- Abstract要約: 我々は、事前の作業から最適に設定されたMLモデルにおいて、過剰な運用上の複雑さを強調した。
その結果,圧縮速度は1148倍であり,品質の低下は最小限であった。
我々は、臨床研究者がより迅速に、よりリアルな使用に適したモデルを開発するための合理化の今後の研究の道を考える。
- 参考スコア(独自算出の注目度): 13.403419873964422
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Leveraging ML advancements to augment healthcare systems can improve patient
outcomes. Yet, uninformed engineering decisions in early-stage research
inadvertently hinder the feasibility of such solutions for high-throughput,
on-device inference, particularly in settings involving legacy hardware and
multi-modal gigapixel images. Through a preliminary case study concerning
segmentation in cardiology, we highlight the excess operational complexity in a
suboptimally configured ML model from prior work and demonstrate that it can be
sculpted away using pruning to meet deployment criteria. Our results show a
compression rate of 1148x with minimal loss in quality (~4%) and, at higher
rates, achieve faster inference on a CPU than the GPU baseline, stressing the
need to consider task complexity and architectural details when using
off-the-shelf models. With this, we consider avenues for future research in
streamlining workflows for clinical researchers to develop models quicker and
better suited for real-world use.
- Abstract(参考訳): 医療システムの強化にMLの進歩を活用することで、患者の成果が向上する。
しかし、初期段階の研究における未熟なエンジニアリング決定は、高スループット、オンデバイス推論、特にレガシーハードウェアとマルチモーダルギガピクセルイメージを含む設定におけるそのようなソリューションの実現を不注意に妨げている。
心臓学におけるセグメンテーションに関する予備的ケーススタディを通じて、先行作業から最適に設定されたMLモデルにおける過剰な運用複雑さを強調し、デプロイ基準を満たすためにプルーニングを用いてそれを彫刻できることを実証する。
その結果、圧縮速度は1148倍で、品質の損失が最小(〜4%)で、GPUベースラインよりも高速にCPU上での推論を実現し、オフザシェルフモデルを使用する場合のタスク複雑性やアーキテクチャの詳細を考慮する必要性を強調した。
これにより、臨床研究者がより迅速に、より現実の用途に適したモデルを開発するためのワークフローの合理化に向けた今後の研究の道のりを考察する。
関連論文リスト
- Structured Model Pruning for Efficient Inference in Computational Pathology [2.9687381456164004]
バイオメディカルイメージングにおいて広く使われているU-Netスタイルのアーキテクチャを解析する手法を開発した。
我々は,プルーニングが性能を低下させることなく,少なくとも70%圧縮できることを実証的に実証した。
論文 参考訳(メタデータ) (2024-04-12T22:05:01Z) - Towards a clinically accessible radiology foundation model: open-access and lightweight, with automated evaluation [113.5002649181103]
オープンソースの小型マルチモーダルモデル(SMM)を訓練し、放射線学における未測定臨床ニーズに対する能力ギャップを埋める。
トレーニングのために,697万以上の画像テキストペアからなる大規模なデータセットを組み立てる。
評価のために,GPT-4に基づく実測値CheXpromptを提案する。
LlaVA-Radの推論は高速で、単一のV100 GPU上でプライベート設定で実行できる。
論文 参考訳(メタデータ) (2024-03-12T18:12:02Z) - Performance Analysis of UNet and Variants for Medical Image Segmentation [1.5410557873153836]
本研究の目的は,深層学習モデル,特にUNetアーキテクチャとその変種に着目した医用画像セグメンテーションの応用を検討することである。
その結果,深層ネットワーク層で拡張された標準UNetは,有能な医用画像セグメンテーションモデルであることが判明した。
Res-UNetとAttention Res-UNetアーキテクチャは、特に細かな画像の詳細を扱う際に、よりスムーズな収束と優れたパフォーマンスを示す。
論文 参考訳(メタデータ) (2023-09-22T17:20:40Z) - Sparse learned kernels for interpretable and efficient medical time series processing [19.5212988158778]
ディープラーニングの手法は計算集約的で、解釈性に欠けていた。
医用時系列信号の解釈可能なアーキテクチャであるSmoLK(Sparse Mixture of Learned Kernels)を提案する。
SMoLKは、シングルレイヤスパースニューラルネットワークを形成する軽量なフレキシブルカーネルセットを学習する。
論文 参考訳(メタデータ) (2023-07-06T18:11:58Z) - Competence-based Multimodal Curriculum Learning for Medical Report
Generation [98.10763792453925]
本稿では,コンピテンスベースのマルチモーダルカリキュラム学習フレームワーク(CMCL)を提案する。
具体的には、CMCLは放射線学者の学習過程をシミュレートし、段階的にモデルを最適化する。
パブリックIU-XrayとMIMIC-CXRデータセットの実験は、CMCLを既存のモデルに組み込んでパフォーマンスを向上させることができることを示している。
論文 参考訳(メタデータ) (2022-06-24T08:16:01Z) - Robust and Efficient Medical Imaging with Self-Supervision [80.62711706785834]
医用画像AIの堅牢性とデータ効率を向上させるための統一表現学習戦略であるREMEDISを提案する。
様々な医療画像タスクを研究し, 振り返りデータを用いて3つの現実的な応用シナリオをシミュレートする。
論文 参考訳(メタデータ) (2022-05-19T17:34:18Z) - A comparative study of various Deep Learning techniques for
spatio-temporal Super-Resolution reconstruction of Forced Isotropic Turbulent
flows [0.45935798913942893]
本研究では,様々な最先端機械学習技術を用いて,空間的・時間的に乱流場の超解像解析を行う。
この研究で使用されるデータセットは、ジョンズ・ホプキンス乱流データベースの一部である「等方性1024粗い」データセットから抽出される。
論文 参考訳(メタデータ) (2021-07-07T17:16:55Z) - Interpretable Hyperspectral AI: When Non-Convex Modeling meets
Hyperspectral Remote Sensing [57.52865154829273]
ハイパースペクトルイメージング、別名画像分光法は、地球科学リモートセンシング(RS)におけるランドマーク技術です。
過去10年間で、主に熟練した専門家によってこれらのハイパースペクトル(HS)製品を分析するための取り組みが行われています。
このため、さまざまなHS RSアプリケーションのためのよりインテリジェントで自動的なアプローチを開発することが急務です。
論文 参考訳(メタデータ) (2021-03-02T03:32:10Z) - Hierarchical Amortized Training for Memory-efficient High Resolution 3D
GAN [52.851990439671475]
本稿では,高解像度な3D画像を生成することができる新しいエンドツーエンドGANアーキテクチャを提案する。
トレーニングと推論の異なる構成を使用することで、この目標を達成する。
3次元胸郭CTと脳MRIの実験により、我々のアプローチは画像生成における最先端技術より優れていることが示された。
論文 参考訳(メタデータ) (2020-08-05T02:33:04Z) - Searching for Efficient Architecture for Instrument Segmentation in
Robotic Surgery [58.63306322525082]
ほとんどのアプリケーションは、高解像度の外科画像の正確なリアルタイムセグメンテーションに依存している。
我々は,高解像度画像のリアルタイム推論を行うために調整された,軽量で高効率なディープ残差アーキテクチャを設計する。
論文 参考訳(メタデータ) (2020-07-08T21:38:29Z) - AP-MTL: Attention Pruned Multi-task Learning Model for Real-time
Instrument Detection and Segmentation in Robot-assisted Surgery [23.33984309289549]
高解像度画像の検出とセグメンテーションのためのリアルタイムロボットシステムの訓練は、限られた計算資源で難しい問題となる。
重み付きエンコーダとタスク認識検出とセグメンテーションデコーダを備えた,エンドツーエンドのトレーニング可能なリアルタイムマルチタスク学習モデルを開発した。
我々のモデルは最先端のセグメンテーションモデルや検出モデルよりも優れており、最も優れたモデルもその課題である。
論文 参考訳(メタデータ) (2020-03-10T14:24:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。