論文の概要: SegSTRONG-C: Segmenting Surgical Tools Robustly On Non-adversarial Generated Corruptions -- An EndoVis'24 Challenge
- arxiv url: http://arxiv.org/abs/2407.11906v2
- Date: Mon, 07 Apr 2025 23:44:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-17 13:33:44.00019
- Title: SegSTRONG-C: Segmenting Surgical Tools Robustly On Non-adversarial Generated Corruptions -- An EndoVis'24 Challenge
- Title(参考訳): SegSTRONG-C:非敵対的発生的破壊にロバストに手術ツールを分割する - EndoVis'24 Challenge
- Authors: Hao Ding, Yuqian Zhang, Tuxun Lu, Ruixing Liang, Hongchao Shu, Lalithkumar Seenivasan, Yonghao Long, Qi Dou, Cong Gao, Yicheng Leng, Seok Bong Yoo, Eung-Joo Lee, Negin Ghamsarian, Klaus Schoeffmann, Raphael Sznitman, Zijian Wu, Yuxin Chen, Septimiu E. Salcudean, Samra Irshad, Shadi Albarqouni, Seong Tae Kim, Yueyi Sun, An Wang, Long Bai, Hongliang Ren, Ihsan Ullah, Ho-Gun Ha, Attaullah Khan, Hyunki Lee, Satoshi Kondo, Satoshi Kasai, Kousuke Hirasawa, Sita Tailor, Ricardo Sanchez-Matilla, Imanol Luengo, Tianhao Fu, Jun Ma, Bo Wang, Marcos Fernández-Rodríguez, Estevao Lima, João L. Vilaça, Mathias Unberath,
- Abstract要約: 外科データ科学専門のベンチマークと課題であるSegSTRONG-Cを紹介する。
我々は、予期せぬ不利な非敵対的な汚職の下でのモデル劣化をよりよく理解することを目指している。
挑戦者のパフォーマンスは平均0.9394 DSCと0.9301 NSDを達成し、刺激的な改善を示している。
- 参考スコア(独自算出の注目度): 35.28816926000958
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Surgical data science has seen rapid advancement due to the excellent performance of end-to-end deep neural networks (DNNs) for surgical video analysis. Despite their successes, end-to-end DNNs have been proven susceptible to even minor corruptions, substantially impairing the model's performance. This vulnerability has become a major concern for the translation of cutting-edge technology, especially for high-stakes decision-making in surgical data science. We introduce SegSTRONG-C, a benchmark and challenge in surgical data science dedicated, aiming to better understand model deterioration under unforeseen but plausible non-adversarial corruption and the capabilities of contemporary methods that seek to improve it. Through comprehensive baseline experiments and participating submissions from widespread community engagement, SegSTRONG-C reveals key themes for model failure and identifies promising directions for improving robustness. The performance of challenge winners, achieving an average 0.9394 DSC and 0.9301 NSD across the unreleased test sets with corruption types: bleeding, smoke, and low brightness, shows inspiring improvement of 0.1471 DSC and 0.2584 NSD in average comparing to strongest baseline methods with UNet architecture trained with AutoAugment. In conclusion, the SegSTRONG-C challenge has identified some practical approaches for enhancing model robustness, yet most approaches relied on conventional techniques that have known, and sometimes quite severe, limitations. Looking ahead, we advocate for expanding intellectual diversity and creativity in non-adversarial robustness beyond data augmentation or training scale, calling for new paradigms that enhance universal robustness to corruptions and may enable richer applications in surgical data science.
- Abstract(参考訳): 外科的データ科学は、外科的ビデオ解析のためのエンドツーエンドのディープニューラルネットワーク(DNN)の性能に優れていたため、急速に進歩している。
彼らの成功にもかかわらず、エンド・ツー・エンドのDNNは小さな腐敗さえも受け入れ難いことが証明され、モデルの性能が著しく損なわれている。
この脆弱性は最先端技術の翻訳、特に外科データ科学における高精度な意思決定にとって大きな関心事となっている。
本研究は, 手術データ科学専門のベンチマークおよび課題であるSegSTRONG-Cを紹介し, 予期せぬ, もっともらしい非敵対的な汚職下でのモデル劣化の理解と, 改善を目指す現代的手法の能力について紹介する。
SegSTRONG-Cは、総合的なベースライン実験と広範囲なコミュニティ参加からの参加を通じて、モデル失敗の鍵となるテーマを明らかにし、堅牢性を改善するための有望な方向を特定する。
挑戦者のパフォーマンスは、平均0.9394 DSCと0.9301 NSDを、出血、煙、低輝度の汚職タイプで達成し、AutoAugmentで訓練されたUNetアーキテクチャによる最強のベースライン手法と比較して、平均0.1471 DSCと0.2584 NSDを刺激的に改善したことを示している。
結論として、SegSTRONG-Cチャレンジは、モデルの堅牢性を高めるためのいくつかの実践的なアプローチを特定したが、ほとんどのアプローチは、既知の、時には非常に厳しい制限に頼っていた。
今後、我々は、データ拡張やトレーニングスケールを超えて、知的多様性と創造性を拡大し、汚職に対する普遍的な堅牢性を高め、よりリッチな手術データ科学の応用を可能にする新しいパラダイムを提唱する。
関連論文リスト
- A Study of Data Augmentation Techniques to Overcome Data Scarcity in Wound Classification using Deep Learning [0.0]
データ拡張により、最先端モデル上での分類性能、F1スコアが最大11%向上することを示す。
GANをベースとした拡張実験により, DE-GANを用いて創傷像をよりリッチに生成できることが証明された。
論文 参考訳(メタデータ) (2024-11-04T00:24:50Z) - MAPUNetR: A Hybrid Vision Transformer and U-Net Architecture for Efficient and Interpretable Medical Image Segmentation [0.0]
本稿では,医用画像セグメンテーションのためのU-Netフレームワークを用いて,トランスフォーマーモデルの強度を相乗化する新しいアーキテクチャMAPUNetRを紹介する。
本モデルでは,分解能保存課題に対処し,セグメンテーションされた領域に着目したアテンションマップを導入し,精度と解釈可能性を高める。
臨床実習における医用画像セグメンテーションの強力なツールとして,本モデルが安定した性能と可能性を維持していることを示す。
論文 参考訳(メタデータ) (2024-10-29T16:52:57Z) - Towards Robust Algorithms for Surgical Phase Recognition via Digital Twin-based Scene Representation [14.108636146958007]
ビデオから直接外科的フェーズを予測するエンドツーエンドのニューラルネットワークは、ベンチマークで優れたパフォーマンスを示している。
我々のゴールは、デジタルツイン(DT)パラダイムを活用して、手術ビデオの変動に対するモデルロバスト性を改善することである。
このアプローチは、信頼性の高い低レベルのシーン理解を保証する、最近のビジョン基盤モデルを活用する。
論文 参考訳(メタデータ) (2024-10-26T00:49:06Z) - Enhancing Training Data Attribution for Large Language Models with Fitting Error Consideration [74.09687562334682]
Debias and Denoise Attribution (DDA) と呼ばれる新しいトレーニングデータ属性法を導入する。
提案手法は既存のアプローチよりも優れており,平均91.64%のAUCを実現している。
DDAは、様々なソースとLLaMA2、QWEN2、Mistralのような異なるスケールのモデルに対して、強力な汎用性とスケーラビリティを示す。
論文 参考訳(メタデータ) (2024-10-02T07:14:26Z) - Weakly Supervised Intracranial Hemorrhage Segmentation with YOLO and an Uncertainty Rectified Segment Anything Model [0.5578116134031106]
頭蓋内出血(ICH)は、治療成績と生存率を改善するために、迅速かつ正確な診断を必要とする生命予後である。
近年, 教師付き深層学習の進歩により, 医用画像の解析が大幅に向上した。
大量の専門家準備セグメンテーションデータの必要性を軽減するため、我々は弱い教師付きICHセグメンテーション法を開発した。
論文 参考訳(メタデータ) (2024-07-29T23:40:13Z) - SINDER: Repairing the Singular Defects of DINOv2 [61.98878352956125]
大規模なデータセットでトレーニングされたビジョントランスフォーマーモデルは、抽出したパッチトークンにアーティファクトを表示することが多い。
本稿では,小さなデータセットのみを用いて構造欠陥を補正するスムーズなスムーズな正規化を提案する。
論文 参考訳(メタデータ) (2024-07-23T20:34:23Z) - Uncertainty modeling for fine-tuned implicit functions [10.902709236602536]
入射関数は、スパースビューから詳細な物体形状を再構成するコンピュータビジョンにおいて重要な役割を担っている。
暗黙関数における不確実性推定手法であるDropsemblesを導入する。
その結果,Dropsemblesは深層アンサンブルの精度とキャリブレーションレベルを達成するが,計算コストは著しく低いことがわかった。
論文 参考訳(メタデータ) (2024-06-17T20:46:18Z) - Applying Dimensionality Reduction as Precursor to LSTM-CNN Models for
Classifying Imagery and Motor Signals in ECoG-Based BCIs [0.0]
本研究は,脳-コンピュータインタフェース(BCI)内での運動画像分類アルゴリズムを最適化することにより,領域を拡大することを目的とする。
我々は、次元削減のための教師なし手法、すなわち、一様多様体近似と投影(UMAP)とK-Nearest Neighbors(KNN)を利用する。
また,Long Short-Term Memory (LSTM) やConvolutional Neural Networks (CNN) といった教師付き手法を,分類タスクに活用することの必要性も評価した。
論文 参考訳(メタデータ) (2023-11-22T16:34:06Z) - GCS-ICHNet: Assessment of Intracerebral Hemorrhage Prognosis using
Self-Attention with Domain Knowledge Integration [19.51978172091416]
脳内出血 (ICH) は脳血管破裂による重篤な病態である。
本稿では,マルチモーダル脳CTデータとGlasgow Coma Scaleスコアを統合した新しいディープラーニングアルゴリズムGCS-ICHNetを提案する。
論文 参考訳(メタデータ) (2023-11-08T15:51:12Z) - Assessing and Enhancing Robustness of Deep Learning Models with
Corruption Emulation in Digital Pathology [9.850335454350367]
我々は,病的ライフサイクル全体にわたるフルスタック汚職の物理的原因を分析した。
我々は3つのOmniCE崩壊ベンチマークデータセットをパッチレベルとスライドレベルの両方で構築する。
我々は,OmniCEの崩壊したデータセットをトレーニングや実験のために拡張データとして利用し,モデルの一般化能力が大幅に向上したことを確かめる。
論文 参考訳(メタデータ) (2023-10-31T12:59:36Z) - Automatic diagnosis of knee osteoarthritis severity using Swin
transformer [55.01037422579516]
変形性膝関節症 (KOA) は膝関節の慢性的な痛みと硬直を引き起こす疾患である。
我々は,Swin Transformer を用いて KOA の重大度を予測する自動手法を提案する。
論文 参考訳(メタデータ) (2023-07-10T09:49:30Z) - A Survey on the Robustness of Computer Vision Models against Common Corruptions [3.6486148851646063]
コンピュータビジョンモデルは、センサーエラーや極端な撮像環境に起因する入力画像の変化に影響を受けやすい。
これらの破損は、現実のシナリオにデプロイする際のモデルの信頼性を著しく損なう可能性がある。
本稿では,コンピュータビジョンモデルの汎用汚職に対する堅牢性を改善する手法について概観する。
論文 参考訳(メタデータ) (2023-05-10T10:19:31Z) - Enhancing Multiple Reliability Measures via Nuisance-extended
Information Bottleneck [77.37409441129995]
トレーニングデータに制限がある現実的なシナリオでは、データ内の多くの予測信号は、データ取得のバイアスからより多く得る。
我々は,相互情報制約の下で,より広い範囲の摂動をカバーできる敵の脅威モデルを考える。
そこで本研究では,その目的を実現するためのオートエンコーダベーストレーニングと,提案したハイブリッド識別世代学習を促進するための実用的なエンコーダ設計を提案する。
論文 参考訳(メタデータ) (2023-03-24T16:03:21Z) - Towards to Robust and Generalized Medical Image Segmentation Framework [17.24628770042803]
本稿では,ロバストな一般化セグメンテーションのための新しい2段階フレームワークを提案する。
特に、教師なしTile-wise AutoEncoder(T-AE)事前学習アーキテクチャは、意味のある表現を学ぶために作成される。
複数の胸部X線データセットに対する肺分画実験を行った。
論文 参考訳(メタデータ) (2021-08-09T05:58:49Z) - On the Robustness of Pretraining and Self-Supervision for a Deep
Learning-based Analysis of Diabetic Retinopathy [70.71457102672545]
糖尿病網膜症における訓練方法の違いによる影響を比較検討した。
本稿では,定量的性能,学習した特徴表現の統計,解釈可能性,画像歪みに対する頑健性など,さまざまな側面について検討する。
以上の結果から,ImageNet事前学習モデルでは,画像歪みに対する性能,一般化,堅牢性が著しく向上していることが示唆された。
論文 参考訳(メタデータ) (2021-06-25T08:32:45Z) - Non-Singular Adversarial Robustness of Neural Networks [58.731070632586594]
小さな入力摂動に対する過敏性のため、アドリヤルロバスト性はニューラルネットワークにとって新たな課題となっている。
我々は,データ入力とモデル重みの共振レンズを用いて,ニューラルネットワークの非特異な対角性の概念を定式化する。
論文 参考訳(メタデータ) (2021-02-23T20:59:30Z) - Firearm Detection via Convolutional Neural Networks: Comparing a
Semantic Segmentation Model Against End-to-End Solutions [68.8204255655161]
武器の脅威検出とライブビデオからの攻撃的な行動は、潜在的に致命的な事故の迅速検出と予防に使用できる。
これを実現する一つの方法は、人工知能と、特に画像分析のための機械学習を使用することです。
従来のモノリシックなエンド・ツー・エンドのディープラーニングモデルと、セマンティクスセグメンテーションによって火花を検知する単純なニューラルネットワークのアンサンブルに基づく前述したモデルを比較した。
論文 参考訳(メタデータ) (2020-12-17T15:19:29Z) - An Uncertainty-Driven GCN Refinement Strategy for Organ Segmentation [53.425900196763756]
本研究では,不確実性解析とグラフ畳み込みネットワークに基づくセグメンテーション改善手法を提案する。
半教師付きグラフ学習問題を定式化するために、特定の入力ボリュームにおける畳み込みネットワークの不確実性レベルを用いる。
本手法は膵臓で1%,脾臓で2%向上し,最先端のCRF改善法よりも優れていた。
論文 参考訳(メタデータ) (2020-12-06T18:55:07Z) - Towards Unsupervised Learning for Instrument Segmentation in Robotic
Surgery with Cycle-Consistent Adversarial Networks [54.00217496410142]
本稿では、入力された内視鏡画像と対応するアノテーションとのマッピングを学習することを目的として、未ペア画像から画像への変換を提案する。
当社のアプローチでは,高価なアノテーションを取得することなく,イメージセグメンテーションモデルをトレーニングすることが可能です。
提案手法をEndovis 2017チャレンジデータセットで検証し,教師付きセグメンテーション手法と競合することを示す。
論文 参考訳(メタデータ) (2020-07-09T01:39:39Z) - Towards Transferable Adversarial Attack against Deep Face Recognition [58.07786010689529]
ディープ畳み込みニューラルネットワーク(DCNN)は敵の例に弱いことが判明した。
転送可能な敵の例は、DCNNの堅牢性を著しく妨げます。
DFANetは畳み込み層で使用されるドロップアウトベースの手法であり,サロゲートモデルの多様性を高めることができる。
クエリなしで4つの商用APIをうまく攻撃できる新しい対向顔ペアを生成します。
論文 参考訳(メタデータ) (2020-04-13T06:44:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。