論文の概要: Prompt learning with bounding box constraints for medical image segmentation
- arxiv url: http://arxiv.org/abs/2507.02743v1
- Date: Thu, 03 Jul 2025 16:04:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-04 15:37:16.576584
- Title: Prompt learning with bounding box constraints for medical image segmentation
- Title(参考訳): 医用画像セグメンテーションのための境界ボックス制約によるプロンプト学習
- Authors: Mélanie Gaillochet, Mehrdad Noori, Sahar Dastani, Christian Desrosiers, Hervé Lombaert,
- Abstract要約: ビジョン基礎モデルは、最近ポイントやバウンディングボックスのようなプロンプトを提供する際に注目すべきセグメンテーション性能を示している。
本稿では,基盤モデルの表現力と弱教師付きセグメンテーションのアノテーション効率を組み合わせた新しいフレームワークを提案する。
提案手法は,Diceスコアの平均84.90%を制限されたデータ設定で達成し,既存の完全教師付きおよび弱教師付きアプローチよりも優れていた。
- 参考スコア(独自算出の注目度): 9.429796437031577
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Pixel-wise annotations are notoriously labourious and costly to obtain in the medical domain. To mitigate this burden, weakly supervised approaches based on bounding box annotations-much easier to acquire-offer a practical alternative. Vision foundation models have recently shown noteworthy segmentation performance when provided with prompts such as points or bounding boxes. Prompt learning exploits these models by adapting them to downstream tasks and automating segmentation, thereby reducing user intervention. However, existing prompt learning approaches depend on fully annotated segmentation masks. This paper proposes a novel framework that combines the representational power of foundation models with the annotation efficiency of weakly supervised segmentation. More specifically, our approach automates prompt generation for foundation models using only bounding box annotations. Our proposed optimization scheme integrates multiple constraints derived from box annotations with pseudo-labels generated by the prompted foundation model. Extensive experiments across multimodal datasets reveal that our weakly supervised method achieves an average Dice score of 84.90% in a limited data setting, outperforming existing fully-supervised and weakly-supervised approaches. The code is available at https://github.com/Minimel/box-prompt-learning-VFM.git
- Abstract(参考訳): ピクセル・ワイド・アノテーションは、医療分野では退屈で費用がかかることで悪名高い。
この負担を軽減するために、バウンディングボックスアノテーションに基づく弱い教師付きアプローチを実践的な代替手段として取得し易くする。
ビジョン基礎モデルは、最近ポイントやバウンディングボックスのようなプロンプトを提供する際に注目すべきセグメンテーション性能を示している。
Prompt Learningは、これらのモデルを下流のタスクに適応させ、セグメンテーションを自動化することで、ユーザの介入を減らす。
しかし、既存の素早い学習アプローチは、完全に注釈付きセグメンテーションマスクに依存している。
本稿では,基盤モデルの表現力と弱教師付きセグメンテーションのアノテーション効率を組み合わせた新しいフレームワークを提案する。
具体的には、バウンディングボックスアノテーションのみを使用して基礎モデルのプロンプト生成を自動化する。
提案手法は,ボックスアノテーションから派生した複数の制約を基本モデルから生成した擬似ラベルと統合する。
マルチモーダルデータセットにわたる大規模な実験により、我々の弱教師付き手法は、制限されたデータ設定で平均84.90%のDiceスコアを達成し、既存の完全教師付きアプローチと弱教師付きアプローチを上回る結果となった。
コードはhttps://github.com/Minimel/box-prompt-learning-VFM.gitで公開されている。
関連論文リスト
- Embarrassingly Simple Scribble Supervision for 3D Medical Segmentation [0.8391490466934672]
この課題の解決策として、スクリブル教師付き学習が登場し、大規模なデータセットを作成する際のアノテーションの労力の削減を約束する。
そこで本研究では,解剖学と病理学の多様さを網羅した7つのデータセットからなるベンチマークを提案する。
nnU-Netを用いた評価の結果,既存の手法の多くは一般化の欠如に悩まされているが,提案手法は一貫して最先端の性能を提供する。
論文 参考訳(メタデータ) (2024-03-19T15:41:16Z) - A Fixed-Point Approach to Unified Prompt-Based Counting [51.20608895374113]
本研究の目的は,ボックス,ポイント,テキストなど,さまざまなプロンプト型で示されるオブジェクトの密度マップを生成することができる包括的プロンプトベースのカウントフレームワークを確立することである。
本モデルは,クラスに依存しない顕著なデータセットに優れ,データセット間の適応タスクにおいて優れた性能を示す。
論文 参考訳(メタデータ) (2024-03-15T12:05:44Z) - One-bit Supervision for Image Classification: Problem, Solution, and
Beyond [114.95815360508395]
本稿では,ラベルの少ない新しい学習環境である,画像分類のための1ビット監督について述べる。
多段階学習パラダイムを提案し、負ラベル抑圧を半教師付き半教師付き学習アルゴリズムに組み込む。
複数のベンチマークにおいて、提案手法の学習効率は、フルビットの半教師付き監視手法よりも優れている。
論文 参考訳(メタデータ) (2023-11-26T07:39:00Z) - Learning Referring Video Object Segmentation from Weak Annotation [78.45828085350936]
RVOS(Referring Video Object segmentation)は、対象物を記述する文に基づいて、対象物をすべてのビデオフレームにセグメント化することを目的としたタスクである。
そこで本研究では, RVOS に対する十分な監視を提供しながら, アノテーションの労力を 8 倍に削減する新たなアノテーション方式を提案する。
私たちのスキームは、最初にオブジェクトが現れるフレームのマスクと、残りのフレームのバウンディングボックスのみを必要とする。
論文 参考訳(メタデータ) (2023-08-04T06:50:52Z) - Mask-free OVIS: Open-Vocabulary Instance Segmentation without Manual
Mask Annotations [86.47908754383198]
Open-Vocabulary (OV) 法は、大規模な画像キャプチャペアと視覚言語モデルを利用して、新しいカテゴリを学習する。
提案手法は,イメージキャプションペアに存在するオブジェクトに対して,事前学習された視覚言語モデルの局所化能力を活用することで,擬似マスクアノテーションを生成する。
擬似マスクを用いてトレーニングした手法は,MS-COCOデータセットとOpenImagesデータセットのmAPスコアを大幅に改善する。
論文 参考訳(メタデータ) (2023-03-29T17:58:39Z) - Point Cloud Instance Segmentation with Semi-supervised Bounding-Box
Mining [17.69745159912481]
ラベル付きおよび未ラベルのバウンディングボックスを監視として使用した,最初の半教師付きポイントクラウドインスタンスセグメンテーションフレームワーク(SPIB)を紹介した。
提案手法は,近年の完全教師付き手法と比較して,競争性能が向上する。
論文 参考訳(メタデータ) (2021-11-30T08:40:40Z) - Boosting Weakly Supervised Object Detection via Learning Bounding Box
Adjusters [76.36104006511684]
高価なインスタンスレベルのオブジェクトアノテーションを避けるため、WSOD(Weakly-supervised Object Detection)が最近の話題として登場した。
我々は、よく注釈付けされた補助データセットからバウンディングボックス回帰知識を活用することにより、ローカライズ性能を向上させるための問題設定を擁護する。
提案手法は,WSOD法と知識伝達モデルに対して,同様の問題設定で良好に機能する。
論文 参考訳(メタデータ) (2021-08-03T13:38:20Z) - Towards Using Count-level Weak Supervision for Crowd Counting [55.58468947486247]
本稿では,少数の位置レベルのアノテーション(十分に教師された)と大量のカウントレベルのアノテーション(弱教師付き)からモデルを学習する,弱教師付き群集カウントの問題について検討する。
我々は、生成した密度マップの自由を制限するための正規化を構築するために、単純なyet効果のトレーニング戦略、すなわちMultiple Auxiliary Tasks Training (MATT)を考案した。
論文 参考訳(メタデータ) (2020-02-29T02:58:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。