Fugu-MT 論文翻訳(概要): Foundational Models in Medical Imaging: A Comprehensive Survey and Future Vision

論文の概要: Foundational Models in Medical Imaging: A Comprehensive Survey and Future Vision

arxiv url: http://arxiv.org/abs/2310.18689v1
Date: Sat, 28 Oct 2023 12:08:12 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-31 17:07:18.297472
Title: Foundational Models in Medical Imaging: A Comprehensive Survey and Future Vision
Title（参考訳）: 医用画像の基礎モデル : 包括的調査と今後の展望
Authors: Bobby Azad, Reza Azad, Sania Eskandari, Afshin Bozorgpour, Amirhossein Kazerouni, Islem Rekik, Dorit Merhof
Abstract要約: ファンデーションモデルは、広範囲の下流タスクに適応した大規模で事前訓練されたディープラーニングモデルである。これらのモデルは、コンテキスト推論、一般化、テスト時の迅速な機能を促進する。コンピュータビジョンの進歩に乗じて、医療画像はこれらのモデルへの関心も高まっている。
参考スコア（独自算出の注目度）: 6.2847894163744105
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Foundation models, large-scale, pre-trained deep-learning models adapted to a wide range of downstream tasks have gained significant interest lately in various deep-learning problems undergoing a paradigm shift with the rise of these models. Trained on large-scale dataset to bridge the gap between different modalities, foundation models facilitate contextual reasoning, generalization, and prompt capabilities at test time. The predictions of these models can be adjusted for new tasks by augmenting the model input with task-specific hints called prompts without requiring extensive labeled data and retraining. Capitalizing on the advances in computer vision, medical imaging has also marked a growing interest in these models. To assist researchers in navigating this direction, this survey intends to provide a comprehensive overview of foundation models in the domain of medical imaging. Specifically, we initiate our exploration by providing an exposition of the fundamental concepts forming the basis of foundation models. Subsequently, we offer a methodical taxonomy of foundation models within the medical domain, proposing a classification system primarily structured around training strategies, while also incorporating additional facets such as application domains, imaging modalities, specific organs of interest, and the algorithms integral to these models. Furthermore, we emphasize the practical use case of some selected approaches and then discuss the opportunities, applications, and future directions of these large-scale pre-trained models, for analyzing medical images. In the same vein, we address the prevailing challenges and research pathways associated with foundational models in medical imaging. These encompass the areas of interpretability, data management, computational requirements, and the nuanced issue of contextual comprehension.
Abstract（参考訳）: 基盤モデル、幅広い下流タスクに適応した大規模で事前学習されたディープラーニングモデル、近年、これらのモデルの台頭に伴うパラダイムシフト中のさまざまなディープラーニング問題において、大きな関心を集めている。異なるモダリティ間のギャップを埋めるために、大規模なデータセットでトレーニングされた基礎モデルは、コンテキスト推論、一般化、テスト時の迅速な機能を促進する。これらのモデルの予測は、広範囲なラベル付きデータや再学習を必要とせず、プロンプトと呼ばれるタスク固有のヒントでモデル入力を増強することで、新しいタスクに対して調整することができる。コンピュータビジョンの進歩に乗じて、医療画像はこれらのモデルに対する関心も高まっている。本調査は, この方向を探索する研究者を支援するため, 医用画像領域における基礎モデルの概要を概観する。具体的には,基礎モデルの基礎となる基本概念を提示することによって,探索を開始する。その後,医学領域における基礎モデルの方法論的分類法を提案し,トレーニング戦略を中心に構築された分類体系を提案するとともに,応用領域,画像モダリティ,特定の臓器,これらのモデルに不可欠なアルゴリズムなどの追加のファセットを取り入れた。さらに,選択したアプローチの実践事例を強調し,これらの大規模事前学習モデルの機会,応用,今後の方向性について考察し,医用画像の解析を行う。また,医療画像における基礎モデルに関連する課題と研究経路についても考察した。これらは、解釈可能性、データ管理、計算要件、文脈理解の微妙な問題といった領域を包含している。

関連論文リスト

Multi-Modal Foundation Models for Computational Pathology: A Survey [32.25958653387204]
基礎モデルは、計算病理学(CPath)の強力なパラダイムとして登場した。我々は、32の最先端マルチモーダル基盤モデルを、視覚言語、視覚知識グラフ、視覚生成表現の3つの主要なパラダイムに分類する。病理学に適した28の利用可能なマルチモーダルデータセットを分析し、画像テキストペア、命令データセット、画像以外のモダリティペアにグループ化する。
論文参考訳（メタデータ） (2025-03-12T06:03:33Z)
Biomedical Foundation Model: A Survey [84.26268124754792]
ファンデーションモデルは、広範なラベルなしデータセットから学習する大規模な事前訓練モデルである。これらのモデルは、質問応答や視覚的理解といった様々な応用に適応することができる。本研究は,生物医学分野における基礎モデルの可能性を探るものである。
論文参考訳（メタデータ） (2025-03-03T22:42:00Z)
Rethinking Foundation Models for Medical Image Classification through a Benchmark Study on MedMNIST [7.017817009055001]
医用画像分類タスクにおける基礎モデルの有用性について,MedMNISTデータセットのベンチマークによる検討を行った。我々は畳み込みモデルからトランスフォーマーモデルまで様々な基礎モデルを採用し、すべての分類タスクに対してエンドツーエンドのトレーニングと線形探索の両方を実装している。
論文参考訳（メタデータ） (2025-01-24T18:01:07Z)
Foundation Models in Radiology: What, How, When, Why and Why Not [15.314933454351674]
人工知能の最近の進歩は、テキストデータと画像データの両方を解釈、生成できる大規模ディープラーニングモデルの出現を目撃している。ファウンデーションモデルは近年、学術、産業、規制機関から大きな注目を集めている。本論は,基礎モデルに関する標準化された用語を確立することを目的としている。
論文参考訳（メタデータ） (2024-11-27T20:13:01Z)
Towards Scalable Foundation Models for Digital Dermatology [35.62296620281727]
我々は、24万以上の皮膚画像のデータセット上で、自己教師付き学習(SSL)技術を用いてモデルを事前訓練する。以上の結果から,本研究で事前訓練したモデルは汎用モデルを上回るだけでなく,臨床関連診断タスクにおける50倍のモデルの性能にもアプローチすることが示唆された。
論文参考訳（メタデータ） (2024-11-08T12:19:20Z)
Medical Vision-Language Pre-Training for Brain Abnormalities [96.1408455065347]
本稿では,PubMedなどの公共リソースから,医用画像・テキスト・アライメントデータを自動的に収集する方法を示す。特に,まず大きな脳画像テキストデータセットを収集することにより,事前学習プロセスの合理化を図るパイプラインを提案する。また,医療領域におけるサブフィギュアをサブキャプションにマッピングするというユニークな課題についても検討した。
論文参考訳（メタデータ） (2024-04-27T05:03:42Z)
Beyond Pixel-Wise Supervision for Medical Image Segmentation: From Traditional Models to Foundation Models [7.987836953849249]
既存のセグメンテーションアルゴリズムは主に、トレーニング用のピクセル単位のアノテーションを備えた完全なアノテーション付きイメージの可用性に依存している。この課題を軽減するため、弱いアノテーションで深層モデルをトレーニングできるセグメンテーション手法の開発に注目が集まっている。視覚基盤モデルの出現、特にSAM(Segment Anything Model)は、弱いアノテーションを使ったセグメンテーションタスクの革新的な機能を導入した。
論文参考訳（メタデータ） (2024-04-20T02:40:49Z)
OpenMEDLab: An Open-source Platform for Multi-modality Foundation Models in Medicine [55.29668193415034]
マルチモダリティ基盤モデルのためのオープンソースプラットフォームであるOpenMEDLabについて紹介する。これは、最前線臨床および生体情報学応用のための大規模言語とビジョンモデルを刺激し、微調整する先駆的な試みの解決策をカプセル化する。様々な医用画像のモダリティ、臨床テキスト、タンパク質工学など、事前訓練された基礎モデル群へのアクセスが可能である。
論文参考訳（メタデータ） (2024-02-28T03:51:02Z)
Masked Modeling for Self-supervised Representation Learning on Vision and Beyond [69.64364187449773]
仮面モデリングは、トレーニング中に比例的にマスキングされる元のデータの一部を予測する、独特なアプローチとして現れてきた。マスクモデリングにおけるテクニックの詳細については,多様なマスキング戦略,ターゲット回復,ネットワークアーキテクチャなどについて詳述する。我々は、現在の手法の限界について議論し、マスクモデリング研究を進めるためのいくつかの道のりを指摘した。
論文参考訳（メタデータ） (2023-12-31T12:03:21Z)
Foundational Models Defining a New Era in Vision: A Survey and Outlook [151.49434496615427]
視覚シーンの構成的性質を観察し、推論する視覚システムは、我々の世界を理解するのに不可欠である。モデルは、このようなモダリティと大規模なトレーニングデータとのギャップを埋めることを学び、コンテキスト推論、一般化、テスト時の迅速な機能を容易にした。このようなモデルの出力は、例えば、バウンディングボックスを設けて特定のオブジェクトをセグメント化したり、画像や映像シーンについて質問したり、言語命令でロボットの動作を操作することで対話的な対話を行うなど、リトレーニングすることなく、人為的なプロンプトによって変更することができる。
論文参考訳（メタデータ） (2023-07-25T17:59:18Z)
Deep Learning Approaches for Data Augmentation in Medical Imaging: A Review [2.8145809047875066]
医用画像拡張のための3種類の深部生成モデル(変分オートエンコーダ、生成対向ネットワーク、拡散モデル)に焦点をあてる。本稿では,これらの各モデルにおける技術の現状について概説するとともに,分類,セグメンテーション,クロスモーダル翻訳など,医療画像における下流業務における活用の可能性について論じる。我々のゴールは、医用画像増倍のための深部生成モデルの使用に関する総合的なレビューを提供することであり、医用画像解析における深部学習アルゴリズムの性能向上のためのこれらのモデルの可能性を明らかにすることである。
論文参考訳（メタデータ） (2023-07-24T20:53:59Z)
Empirical Analysis of a Segmentation Foundation Model in Prostate Imaging [9.99042549094606]
医療画像セグメンテーションのための基盤モデルUniverSegについて考察する。本研究では,前立腺画像の文脈における経験的評価研究を行い,従来のタスク固有セグメンテーションモデルの訓練手法と比較する。
論文参考訳（メタデータ） (2023-07-06T20:00:52Z)
On the Challenges and Perspectives of Foundation Models for Medical Image Analysis [17.613533812925635]
医療基盤モデルは、幅広い下流タスクを解く上で大きな可能性を秘めている。それらは、正確で堅牢なモデルの開発を加速し、大量のラベル付きデータを削減し、患者のデータのプライバシと機密性を維持するのに役立つ。
論文参考訳（メタデータ） (2023-06-09T06:54:58Z)
Artificial General Intelligence for Medical Imaging Analysis [92.3940918983821]
大規模人工知能(AGI)モデルは、様々な汎用ドメインタスクにおいて前例のない成功を収めた。これらのモデルは、医学分野固有の複雑さとユニークな特徴から生じる顕著な課題に直面している。このレビューは、医療画像、医療などにおけるAGIの将来的な意味についての洞察を提供することを目的としている。
論文参考訳（メタデータ） (2023-06-08T18:04:13Z)
Domain Shift in Computer Vision models for MRI data analysis: An Overview [64.69150970967524]
機械学習とコンピュータビジョン手法は、医用画像解析において優れた性能を示している。しかし、現在臨床応用はごくわずかである。異なるソースや取得ドメインのデータへのモデルの不適切な転送性は、その理由の1つです。
論文参考訳（メタデータ） (2020-10-14T16:34:21Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。