論文の概要: FlexICL: A Flexible Visual In-context Learning Framework for Elbow and Wrist Ultrasound Segmentation
- arxiv url: http://arxiv.org/abs/2510.26049v1
- Date: Thu, 30 Oct 2025 00:53:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-31 16:05:09.616759
- Title: FlexICL: A Flexible Visual In-context Learning Framework for Elbow and Wrist Ultrasound Segmentation
- Title(参考訳): FlexICL:ElbowとWrist Ultrasound Segmentationのためのフレキシブルなビジュアルインコンテキスト学習フレームワーク
- Authors: Yuyue Zhou, Jessica Knight, Shrimanti Ghosh, Banafshe Felfeliyan, Jacob L. Jaremko, Abhilash R. Hareendranathan,
- Abstract要約: 肘と手首の骨折は、小児で最も一般的な骨折である。
ディープラーニングはリアルタイムでフィードバックを提供し、重要な構造を強調し、軽量に訓練されたユーザーがより自信を持って試験を行うのに役立つ。
本稿では,米国画像中のボニー領域をセグメント化するための,フレキシブルでフレキシブルなインコンテキスト学習フレームワークFlexICLを提案する。
- 参考スコア(独自算出の注目度): 0.19395755884693813
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Elbow and wrist fractures are the most common fractures in pediatric populations. Automatic segmentation of musculoskeletal structures in ultrasound (US) can improve diagnostic accuracy and treatment planning. Fractures appear as cortical defects but require expert interpretation. Deep learning (DL) can provide real-time feedback and highlight key structures, helping lightly trained users perform exams more confidently. However, pixel-wise expert annotations for training remain time-consuming and costly. To address this challenge, we propose FlexICL, a novel and flexible in-context learning (ICL) framework for segmenting bony regions in US images. We apply it to an intra-video segmentation setting, where experts annotate only a small subset of frames, and the model segments unseen frames. We systematically investigate various image concatenation techniques and training strategies for visual ICL and introduce novel concatenation methods that significantly enhance model performance with limited labeled data. By integrating multiple augmentation strategies, FlexICL achieves robust segmentation performance across four wrist and elbow US datasets while requiring only 5% of the training images. It outperforms state-of-the-art visual ICL models like Painter, MAE-VQGAN, and conventional segmentation models like U-Net and TransUNet by 1-27% Dice coefficient on 1,252 US sweeps. These initial results highlight the potential of FlexICL as an efficient and scalable solution for US image segmentation well suited for medical imaging use cases where labeled data is scarce.
- Abstract(参考訳): 肘と手首の骨折は、小児で最も一般的な骨折である。
超音波(US)における筋骨格構造の自動セグメンテーションは、診断精度と治療計画を改善することができる。
骨折は皮質の欠陥として現れるが、専門的な解釈を必要とする。
ディープラーニング(DL)は、リアルタイムでフィードバックを提供し、重要な構造を強調し、軽量に訓練されたユーザーがより自信を持って試験を行うのに役立つ。
しかし、訓練のためのピクセル単位の専門家アノテーションは、時間と費用がかかるままである。
この課題に対処するために,米国画像中のボニー領域をセグメント化するための,新しい,フレキシブルなコンテキスト内学習(ICL)フレームワークであるFlexICLを提案する。
ビデオ内のセグメンテーション設定に適用し、専門家がアノテートするのは少数のフレームのみであり、モデルのセグメンテーションは見当たらないフレームである。
我々は,視覚的ICLのための様々な画像連結手法とトレーニング戦略を体系的に検討し,ラベル付きデータによるモデル性能を著しく向上する新しい結合手法を提案する。
複数の拡張戦略を統合することで、FlexICLはトレーニングイメージの5%しか必要とせず、4つの手首と肘USデータセット間で堅牢なセグメンテーションパフォーマンスを達成する。
PainterやMAE-VQGANといった最先端のビジュアルICLモデル、U-NetやTransUNetといった従来のセグメンテーションモデルよりも1,252USのスイープで1-27%優れています。
これらの最初の結果は、ラベル付きデータが不足している医療画像のユースケースに適した、米国イメージセグメンテーションのための効率的でスケーラブルなソリューションとしてFlexICLの可能性を浮き彫りにした。
関連論文リスト
- MS-CLR: Multi-Skeleton Contrastive Learning for Human Action Recognition [49.91188543847175]
Multi-Skeleton Contrastive Learning (MS-CLR)は、同じシーケンスから抽出された複数のスケルトン規則間でポーズ表現を整列するフレームワークである。
MS-CLRは、強いシングルスケルトンコントラスト学習ベースラインよりも一貫してパフォーマンスを向上する。
マルチスケルトンアンサンブルはパフォーマンスをさらに向上させ、両方のデータセットに新たな最先端結果を設定する。
論文 参考訳(メタデータ) (2025-08-20T17:58:03Z) - Partially Supervised Unpaired Multi-Modal Learning for Label-Efficient Medical Image Segmentation [53.723234136550055]
我々は、新しい学習パラダイムを部分教師付き無ペア型マルチモーダルラーニング(PSUMML)と呼ぶ。
そこで我々は,DEST (Ensembled Self-Training) フレームワークを用いた新しい部分クラス適応法を提案する。
我々のフレームワークは、部分的にラベル付けされていないマルチモーダルデータを用いて学習するためのモダリティ特定正規化層を持つコンパクトなセグメンテーションネットワークで構成されている。
論文 参考訳(メタデータ) (2025-03-07T07:22:42Z) - A Simple Framework Uniting Visual In-context Learning with Masked Image
Modeling to Improve Ultrasound Segmentation [0.6223528900192875]
ビジュアル・イン・コンテクスト・ラーニング(ICL)はコンピュータ・ビジョンの新しい研究分野である。
視覚的ICLペアリング画像とマスク画像モデリング(MIM)を組み合わせ,教師あり学習のための簡易な視覚的ICL手法SimICLを提案する。
SimICL は Dice coeffient (DC) が 0.96 で Jaccard Index (IoU) が 0.92 で、最先端のセグメンテーションとビジュアル ICL モデルを上回った。
論文 参考訳(メタデータ) (2024-02-22T05:34:22Z) - Shape Matters: Detecting Vertebral Fractures Using Differentiable
Point-Based Shape Decoding [51.38395069380457]
変性性脊椎疾患は高齢者に多い。
骨粗しょう性骨折やその他の変性変形性骨折のタイムリーな診断は、重度の腰痛や障害のリスクを軽減するための前向きな処置を促進する。
本研究では,脊椎動物に対する形状自動エンコーダの使用について検討する。
論文 参考訳(メタデータ) (2023-12-08T18:11:22Z) - Multi-scale Multi-site Renal Microvascular Structures Segmentation for
Whole Slide Imaging in Renal Pathology [4.743463035587953]
Omni-Segは,マルチサイト,マルチスケールのトレーニングデータを活用する新しい動的ネットワーク手法である。
我々は、HuBMAPとNEPTUNEという2つのデータセットの画像を用いて、特異なディープネットワークを訓練する。
提案手法は,腎微小血管構造の定量的解析のための強力な計算ツールを腎病理医に提供する。
論文 参考訳(メタデータ) (2023-08-10T16:26:03Z) - Disruptive Autoencoders: Leveraging Low-level features for 3D Medical
Image Pre-training [51.16994853817024]
本研究は、3Dラジオグラフィ画像のための効果的な事前学習フレームワークの設計に焦点をあてる。
ローカルマスキングと低レベルの摂動の組み合わせによって生成された破壊から、オリジナルのイメージを再構築しようとする事前トレーニングフレームワークであるDisruptive Autoencodersを紹介する。
提案する事前トレーニングフレームワークは、複数のダウンストリームタスクでテストされ、最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-07-31T17:59:42Z) - Vision-Language Modelling For Radiological Imaging and Reports In The
Low Data Regime [70.04389979779195]
本稿では,視覚および言語入力を共通空間に埋め込んだ医用視覚言語モデル(VLM)について検討する。
本稿では,新しい画像領域やテキスト領域への汎用事前学習モデルの適用など,低データ性能向上のためのいくつかの候補手法について検討する。
テキスト・ツー・イメージ検索をベンチマークとして,2つの胸部X線および放射線学的報告を用いた可変サイズのトレーニングデータセットを用いて,これらの手法の性能評価を行った。
論文 参考訳(メタデータ) (2023-03-30T18:20:00Z) - Pseudo-label Guided Cross-video Pixel Contrast for Robotic Surgical
Scene Segmentation with Limited Annotations [72.15956198507281]
シーンセグメンテーションを促進するために,新しい擬似ラベル付きクロスビデオコントラスト学習法であるPGV-CLを提案する。
本研究では,ロボット外科手術データセットEndoVis18と白内障手術データセットCaDISについて検討した。
論文 参考訳(メタデータ) (2022-07-20T05:42:19Z) - PoissonSeg: Semi-Supervised Few-Shot Medical Image Segmentation via
Poisson Learning [0.505645669728935]
Few-shot Semantic(FSS)は、ディープラーニングにおけるデッドロックを壊すための有望な戦略である。
FSSモデルは、オーバーフィッティングを避けるために十分なピクセルレベルのアノテートクラスを必要とする。
医用画像セグメンテーションのための新しい半教師付きFSSフレームワークを提案する。
論文 参考訳(メタデータ) (2021-08-26T10:24:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。