Fugu-MT 論文翻訳(概要): One-Prompt to Segment All Medical Images

論文の概要: One-Prompt to Segment All Medical Images

arxiv url: http://arxiv.org/abs/2305.10300v5
Date: Wed, 17 Apr 2024 11:04:57 GMT
ステータス: 翻訳完了
システム内更新日: 2024-04-19 00:26:13.233245
Title: One-Prompt to Segment All Medical Images
Title（参考訳）: 全医用画像のワンプロンプト
Authors: Junde Wu, Jiayuan Zhu, Yueming Jin, Min Xu,
Abstract要約: 本稿では「ワン・プロンプト」と呼ばれる普遍的な医用画像セグメンテーションに向けた新しいパラダイムを紹介する。 One-Promptは、ワンショットとインタラクティブなメソッドの長所を組み合わせたものだ。推論の段階では、textbfoneがトリガーしたサンプルと組み合わせることで、1回のフォワードパスで目に見えないタスクを正確に処理することができる。以前にない14のデータセットでテストされたOne-Prompt Modelは、優れたゼロショットセグメンテーション機能を示し、幅広い関連するメソッドを上回っている。
参考スコア（独自算出の注目度）: 18.829371793411347
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Large foundation models, known for their strong zero-shot generalization, have excelled in visual and language applications. However, applying them to medical image segmentation, a domain with diverse imaging types and target labels, remains an open challenge. Current approaches, such as adapting interactive segmentation models like Segment Anything Model (SAM), require user prompts for each sample during inference. Alternatively, transfer learning methods like few/one-shot models demand labeled samples, leading to high costs. This paper introduces a new paradigm toward the universal medical image segmentation, termed 'One-Prompt Segmentation.' One-Prompt Segmentation combines the strengths of one-shot and interactive methods. In the inference stage, with just \textbf{one prompted sample}, it can adeptly handle the unseen task in a single forward pass. We train One-Prompt Model on 64 open-source medical datasets, accompanied by the collection of over 3,000 clinician-labeled prompts. Tested on 14 previously unseen datasets, the One-Prompt Model showcases superior zero-shot segmentation capabilities, outperforming a wide range of related methods. The code and data is released as https://github.com/KidsWithTokens/one-prompt.
Abstract（参考訳）: 強力なゼロショットの一般化で知られる大規模な基礎モデルは、視覚および言語応用に優れている。しかし、様々な画像タイプとターゲットラベルを持つ領域である医療画像セグメンテーションにそれらを適用することは、未解決の課題である。 SAM(Segment Anything Model)のようなインタラクティブセグメンテーションモデルの適用など、現在のアプローチでは、推論中に各サンプルに対してユーザプロンプトが必要になる。あるいは、少数/1ショットモデルのような転送学習手法では、ラベル付きサンプルが要求されるため、高いコストがかかる。本稿では「ワン・プロンプト・セグメンテーション」と呼ばれる普遍的な医用画像セグメンテーションに向けた新しいパラダイムを紹介する。ワン・プロンプト・セグメンテーションはワンショットとインタラクティブな手法の強みを組み合わせたものである。推論段階では、textbf{one prompt sample} だけで、単一のフォワードパスで目に見えないタスクを順応的に処理できる。私たちは64のオープンソース医療データセットでOne-Prompt Modelをトレーニングし、3,000以上のクリニックラベルのプロンプトを収集しています。以前にない14のデータセットでテストされたOne-Prompt Modelは、優れたゼロショットセグメンテーション機能を示し、幅広い関連するメソッドを上回っている。コードとデータはhttps://github.com/KidsWithTokens/one-promptとしてリリースされる。

関連論文リスト

AutoMiSeg: Automatic Medical Image Segmentation via Test-Time Adaptation of Foundation Models [7.382887784956608]
本稿では,視覚言語とセグメンテーション基礎モデルを組み合わせたゼロショット自動セグメンテーションパイプラインを提案する。適切な分解とテスト時間適応により、我々の完全自動パイプラインは、弱い確率で対話的な基礎モデルと競争的に機能する。
論文参考訳（メタデータ） (2025-05-23T14:07:21Z)
Towards Universal Text-driven CT Image Segmentation [4.76971404389011]
汎用テキスト駆動セグメンテーションのための大規模3次元CT画像を対象とした視覚言語モデルOpenVocabCTを提案する。診断報告を,多粒性コントラスト学習のための大規模言語モデルを用いて,微細な臓器レベルの記述に分解する。
論文参考訳（メタデータ） (2025-03-08T03:02:57Z)
Segment Anything for Histopathology [2.6579756198224347]
ビジョンファウンデーションモデル(VFM)は、自動的および対話的セグメンテーションのより堅牢な代替手段を提供する。本稿では,多種多様なデータセットを用いたSAMのトレーニングに基づく核セグメンテーションのためのVFMであるPathoSAMを紹介する。私たちのモデルはオープンソースで、データアノテーションの一般的なツールと互換性があります。
論文参考訳（メタデータ） (2025-02-01T11:59:04Z)
MedicoSAM: Towards foundation models for medical image segmentation [2.6579756198224347]
大規模で多様なデータセット上の様々な微調整戦略を比較することにより、医療画像のセグメンテーションを改善する方法を示す。対話型セグメンテーションでは,性能が向上することが確認できた。私たちのベストモデルであるMedicoSAMはhttps://github.com/computational-cell-analytics/medico-sam.comで公開されています。
論文参考訳（メタデータ） (2025-01-20T20:40:28Z)
MultiverSeg: Scalable Interactive Segmentation of Biomedical Imaging Datasets with In-Context Guidance [3.7015512365236907]
既存のラベル付きデータへのアクセスを必要とせずに、新しいデータセット全体を迅速にセグメント化するシステムを導入する。画像のセグメント化とともに、クリックやバウンディングボックス、スクリブルといったユーザインタラクションを入力として取り、セグメント化を予測する。我々は,MultiverSegによって,画像毎のインタラクション数を減らし,正確なセグメンテーションを実現することにより,対話的に新しいデータセットを効率的にセグメント化できることを実証した。
論文参考訳（メタデータ） (2024-12-19T17:06:53Z)
Automating MedSAM by Learning Prompts with Weak Few-Shot Supervision [10.609371657347806]
本研究は,入力プロンプトの条件付けを,画像埋め込みから直接プロンプト埋め込みを学習する軽量モジュールに置き換えることを提案する。本手法は,医療用画像に微調整したSAMのバージョンであるMedSAMを用いて検証した。
論文参考訳（メタデータ） (2024-09-30T13:53:01Z)
Prompting Segment Anything Model with Domain-Adaptive Prototype for Generalizable Medical Image Segmentation [49.5901368256326]
医用画像のセグメンテーションにおけるセグメンテーションモデル(DAPSAM)の微調整のための新しいドメイン適応型プロンプトフレームワークを提案する。 DAPSAMは,2つの医療画像分割タスクにおいて,異なるモダリティで最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (2024-09-19T07:28:33Z)
Curriculum Prompting Foundation Models for Medical Image Segmentation [17.33821260899367]
医療画像のセグメンテーションにSAMのような、訓練済みの大規模な基礎モデルを適用することは、依然として大きな課題である。過去の研究は各インスタンスの特定のタイプのプロンプトに大きく依存しており、理想的に正しいプロンプトのマニュアル入力を必要とする。本稿では,原画像から得られた異なる粒度のプロンプトを利用して,より広範な臨床所見を提供することを提案する。そこで我々は,異なるタイプのプロンプトを段階的に統合する,カリキュラムプロンプトと呼ばれる粗大な機構を設計した。
論文参考訳（メタデータ） (2024-09-01T11:00:18Z)
ProtoSAM: One-Shot Medical Image Segmentation With Foundational Models [29.781228739479893]
ProtoSAMは、ワンショットの医療画像セグメンテーションのための新しいフレームワークである。これは、数ショットセグメンテーションで知られているプロトタイプネットワークと、自然画像基盤モデルSAMの併用である。
論文参考訳（メタデータ） (2024-07-09T17:04:08Z)
Rethinking Interactive Image Segmentation with Low Latency, High Quality, and Diverse Prompts [68.86537322287474]
多様なプロンプトを持つ低レイテンシで高品質な対話的セグメンテーションは、スペシャリストやジェネラリストモデルでは難しい。我々は、低レイテンシ、高品質、多様なプロンプトサポートを提供する次世代インタラクティブセグメンテーションアプローチであるSegNextを提案する。本手法は,HQSeg-44KとDAVISにおいて,定量的かつ定性的に,最先端の手法より優れている。
論文参考訳（メタデータ） (2024-03-31T17:02:24Z)
Unsupervised Universal Image Segmentation [59.0383635597103]
本稿では,Unsupervised Universal Model (U2Seg) を提案する。 U2Segは、自己教師付きモデルを利用して、これらのセグメンテーションタスクの擬似意味ラベルを生成する。次に、これらの擬似意味ラベル上でモデルを自己学習し、かなりの性能向上をもたらす。
論文参考訳（メタデータ） (2023-12-28T18:59:04Z)
Self-Prompting Large Vision Models for Few-Shot Medical Image Segmentation [14.135249795318591]
本稿では,医療ビジョン応用における自己プロンプトの新たな視点を提案する。我々は、Segment Anything Modelの埋め込み空間を利用して、単純だが効果的な線形ピクセルワイド分類器を通して自身を誘導する。複数のデータセットで競合する結果を得る。
論文参考訳（メタデータ） (2023-08-15T08:20:07Z)
Diffusion Models for Open-Vocabulary Segmentation [79.02153797465324]
OVDiffは、教師なしオープン語彙セグメンテーションに生成テキストから画像への拡散モデルを利用する新しい手法である。トレーニング済みのコンポーネントのみに依存し、トレーニングなしで合成セグメンタを直接出力する。
論文参考訳（メタデータ） (2023-06-15T17:51:28Z)
Exploring Open-Vocabulary Semantic Segmentation without Human Labels [76.15862573035565]
我々は、既存の事前学習された視覚言語モデル(VL)を利用して意味的セグメンテーションモデルを訓練するZeroSegを提案する。 ZeroSegは、VLモデルで学んだ視覚概念をセグメントトークンの集合に蒸留することでこれを克服し、それぞれが対象画像の局所化領域を要約する。提案手法は,他のゼロショットセグメンテーション法と比較して,同じトレーニングデータを用いた場合と比較して,最先端性能を実現する。
論文参考訳（メタデータ） (2023-06-01T08:47:06Z)
Segment Everything Everywhere All at Once [124.90835636901096]
画像中のすべてのものを同時にセグメント化するための,迅速かつインタラクティブなモデルであるSEEMを提案する。そこで本研究では,あらゆるタイプのセグメンテーションタスクに対して,多様なプロンプトを可能にする新しい復号化機構を提案する。多様なセグメンテーションタスクにおけるSEEMの有効性を検証するための総合的な実証的研究を行った。
論文参考訳（メタデータ） (2023-04-13T17:59:40Z)
Segment Anything Model (SAM) for Digital Pathology: Assess Zero-shot Segmentation on Whole Slide Imaging [12.533476185972527]
画像セグメンテーションの基礎モデルとしてセグメンテーションモデル(SAM)がリリースされた。スライド画像全体(WSI)における代表セグメンテーションタスクにおけるSAMモデルのゼロショットセグメンテーション性能を評価する。その結果,0ショットSAMモデルは大きな連結オブジェクトに対して顕著なセグメンテーション性能を実現することが示唆された。
論文参考訳（メタデータ） (2023-04-09T04:06:59Z)
Prompt-Based Multi-Modal Image Segmentation [81.58378196535003]
テスト時に任意のプロンプトに基づいて画像セグメンテーションを生成するシステムを提案する。プロンプトはテキストかイメージのいずれかでもよい。私たちはCLIPモデルをバックボーンとして構築し、トランスフォーマーベースのデコーダで拡張します。
論文参考訳（メタデータ） (2021-12-18T21:27:19Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。