論文の概要: Assessing the generalization performance of SAM for ureteroscopy scene understanding
- arxiv url: http://arxiv.org/abs/2505.17210v1
- Date: Thu, 22 May 2025 18:35:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-26 18:08:33.652246
- Title: Assessing the generalization performance of SAM for ureteroscopy scene understanding
- Title(参考訳): 尿管鏡シーン理解のためのSAMの一般化性能の評価
- Authors: Martin Villagrana, Francisco Lopez-Tiro, Clement Larose, Gilberto Ochoa-Ruiz, Christian Daul,
- Abstract要約: 本研究は腎臓結石分節の自動化におけるSAM(Seegment Anything Model)の可能性について検討した。
SAMの性能は、U-Net、Residual U-Net、Atention U-Netなどの従来のモデルと比較して評価される。
SAMは分散データ上ではU-Netに匹敵する性能を発揮するが、分散データの一般化能力は大幅に向上している。
- 参考スコア(独自算出の注目度): 1.1417805445492082
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The segmentation of kidney stones is regarded as a critical preliminary step to enable the identification of urinary stone types through machine- or deep-learning-based approaches. In urology, manual segmentation is considered tedious and impractical due to the typically large scale of image databases and the continuous generation of new data. In this study, the potential of the Segment Anything Model (SAM) -- a state-of-the-art deep learning framework -- is investigated for the automation of kidney stone segmentation. The performance of SAM is evaluated in comparison to traditional models, including U-Net, Residual U-Net, and Attention U-Net, which, despite their efficiency, frequently exhibit limitations in generalizing to unseen datasets. The findings highlight SAM's superior adaptability and efficiency. While SAM achieves comparable performance to U-Net on in-distribution data (Accuracy: 97.68 + 3.04; Dice: 97.78 + 2.47; IoU: 95.76 + 4.18), it demonstrates significantly enhanced generalization capabilities on out-of-distribution data, surpassing all U-Net variants by margins of up to 23 percent.
- Abstract(参考訳): 腎臓結石のセグメンテーションは, 機械的, 深層学習的アプローチによる尿中石型の同定を可能にする重要な予備段階であると考えられている。
オーロロジーにおいて、手動セグメンテーションは、一般的に大規模な画像データベースと、新しいデータの連続的な生成のため、退屈で実用的ではないと考えられる。
本研究では,現在最先端のディープラーニングフレームワークであるSegment Anything Model (SAM) の可能性を,腎臓結石分割の自動化のために検討した。
SAMの性能は、U-Net、Residual U-Net、Atention U-Netなどの従来のモデルと比較して評価されている。
この結果はSAMの優れた適応性と効率性を浮き彫りにした。
SAMは分布内データ(精度:97.68 + 3.04; Dice:97.78 + 2.47; IoU:95.76 + 4.18; Dice:97.78 + 2.47; IoU:95.76 + 4.18)でU-Netに匹敵する性能を達成しているが、分布外データの一般化能力は最大で23%まで向上している。
関連論文リスト
- Performance Analysis of Deep Learning Models for Femur Segmentation in MRI Scan [5.5193366921929155]
我々は3つのCNNベースモデル(U-Net, Attention U-Net, U-KAN)と1つのトランスフォーマーベースモデルSAM 2の性能評価と比較を行った。
このデータセットは11,164個のMRIスキャンと大腿骨領域の詳細なアノテーションから構成されている。
注意点U-Netは全体のスコアが最も高く、U-KANは興味の少ない解剖学的領域において優れたパフォーマンスを示した。
論文 参考訳(メタデータ) (2025-04-05T05:47:56Z) - Semi-Supervised Medical Image Segmentation via Knowledge Mining from Large Models [7.470921455418383]
本研究では,小規模でローカルにホストされたディープラーニングモデルの性能向上を目的とした戦略的知識マイニング手法を提案する。
我々は、限定ラベル付きデータセット上でU-Net++モデルをトレーニングし、未ラベル画像に推論されたSAMの出力をプロンプトに変換することで、その能力を拡張した。
提案手法は,ベースラインの U-Net++ モデルに対して,Dice のセグメント化性能を 3% と 1% に向上させる。
論文 参考訳(メタデータ) (2025-03-10T00:43:45Z) - Adapting Segment Anything Model for Unseen Object Instance Segmentation [70.60171342436092]
Unseen Object Instance(UOIS)は、非構造環境で動作する自律ロボットにとって不可欠である。
UOISタスクのためのデータ効率のよいソリューションであるUOIS-SAMを提案する。
UOIS-SAMは、(i)HeatmapベースのPrompt Generator(HPG)と(ii)SAMのマスクデコーダに適応する階層識別ネットワーク(HDNet)の2つの重要なコンポーネントを統合する。
論文 参考訳(メタデータ) (2024-09-23T19:05:50Z) - Handling Geometric Domain Shifts in Semantic Segmentation of Surgical RGB and Hyperspectral Images [67.66644395272075]
本稿では,幾何学的アウト・オブ・ディストリビューションデータに直面する場合の,最先端のセマンティックセマンティックセマンティクスモデルの最初の解析を行う。
本稿では, 汎用性を高めるために, 有機移植(Organ Transplantation)と呼ばれる拡張技術を提案する。
我々の拡張技術は、RGBデータに対して最大67%、HSIデータに対して90%のSOAモデル性能を改善し、実際のOODテストデータに対して、分配内パフォーマンスのレベルでのパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-08-27T19:13:15Z) - Utilizing Weak-to-Strong Consistency for Semi-Supervised Glomeruli Segmentation [0.803784679671919]
本稿では,複数の実世界のデータセット上で検証された弱強整合性フレームワークに基づく,糸球体セグメンテーションのための半教師付き学習手法を提案する。
3つの独立したデータセットに対する実験結果は、既存の教師付きベースラインモデルと比較して、アプローチの優れた性能を示している。
論文 参考訳(メタデータ) (2024-05-30T10:19:21Z) - nnSAM: Plug-and-play Segment Anything Model Improves nnUNet Performance [12.169801149021566]
Segment Anything Model (SAM)は、特定のドメイントレーニングなしで画像セグメンテーションのための汎用ツールとして登場した。
nnUNetのような従来のモデルは推論中に自動セグメンテーションを実行するが、広範なドメイン固有のトレーニングが必要である。
提案するnnSAMは,SAMの頑健な特徴抽出とnnUNetの自動構成を統合し,小さなデータセットのセグメンテーション精度を向上させる。
論文 参考訳(メタデータ) (2023-09-29T04:26:25Z) - Cross-Modal Fine-Tuning: Align then Refine [83.37294254884446]
ORCAはクロスモーダルな微調整フレームワークであり、単一の大規模事前訓練モデルの適用範囲を様々に拡張する。
ORCAは12のモダリティから60以上のデータセットを含む3つのベンチマークで最先端の結果を得る。
論文 参考訳(メタデータ) (2023-02-11T16:32:28Z) - Improving Visual Grounding by Encouraging Consistent Gradient-based
Explanations [58.442103936918805]
注意マスク整合性は,従来の方法よりも優れた視覚的グラウンドリング結果が得られることを示す。
AMCは効率的で実装が容易であり、どんな視覚言語モデルでも採用できるため一般的である。
論文 参考訳(メタデータ) (2022-06-30T17:55:12Z) - On Generalisability of Machine Learning-based Network Intrusion
Detection Systems [0.0]
本稿では,4つのベンチマークNIDSデータセットを用いて,教師付き学習モデルと教師なし学習モデルの評価を行う。
我々の調査は、検討されたモデルのうちどのモデルもすべての研究されたデータセットを一般化できないことを示唆している。
また,本研究では,教師なし学習手法が,検討シナリオにおける教師付き学習モデルよりも一般化されていることも示唆した。
論文 参考訳(メタデータ) (2022-05-09T08:26:48Z) - Efficient Sharpness-aware Minimization for Improved Training of Neural
Networks [146.2011175973769]
本稿では,SAM s の効率を高コストで向上する高効率シャープネス認識最小化器 (M) を提案する。
Mには、Stochastic Weight PerturbationとSharpness-Sensitive Data Selectionという、2つの新しい効果的なトレーニング戦略が含まれている。
我々は、CIFARとImageNetデータセットの広範な実験を通して、ESAMはSAMよりも100%余分な計算を40%のvis-a-visベースに必要とせずに効率を向上させることを示した。
論文 参考訳(メタデータ) (2021-10-07T02:20:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。