論文の概要: A Two-Stage Strategy for Mitosis Detection Using Improved YOLO11x Proposals and ConvNeXt Classification
- arxiv url: http://arxiv.org/abs/2509.02627v1
- Date: Mon, 01 Sep 2025 15:46:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 21:40:46.268222
- Title: A Two-Stage Strategy for Mitosis Detection Using Improved YOLO11x Proposals and ConvNeXt Classification
- Title(参考訳): 改良されたYOLO11x提案とConvNeXt分類を用いたミトコンドリア検出のための2段階戦略
- Authors: Jie Xiao, Mengye Lyu, Shaojun Liu,
- Abstract要約: MIDOG 2025 Track 1は、非腫瘍領域、炎症領域、壊死領域を含む全スライド画像(WSI)におけるミトーシス検出を必要とする。
複雑で異質な文脈と可能なアーティファクトのため、しばしば偽陽性と偽陰性が存在する。
高速なF1スコアを生成するための2段階フレームワークを提案する。
- 参考スコア(独自算出の注目度): 5.1547008655164195
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: MIDOG 2025 Track 1 requires mitosis detection in whole-slide images (WSIs) containing non-tumor, inflamed, and necrotic regions. Due to the complicated and heterogeneous context, as well as possible artifacts, there are often false positives and false negatives, thus degrading the detection F1-score. To address this problem, we propose a two-stage framework. Firstly, an improved YOLO11x, integrated with EMA attention and LSConv, is employed to generate mitosis candidates. We use a low confidence threshold to generate as many proposals as possible, ensuring the detection recall. Then, a ConvNeXt-Tiny classifier is employed to filter out the false positives, ensuring the detection precision. Consequently, the proposed two-stage framework can generate a high detection F1-score. Evaluated on a fused dataset comprising MIDOG++, MITOS_WSI_CCMCT, and MITOS_WSI_CMC, our framework achieves an F1-score of 0.882, which is 0.035 higher than the single-stage YOLO11x baseline. This performance gain is produced by a significant precision improvement, from 0.762 to 0.839, and a comparable recall. The code is available at https://github.com/xxiao0304/MIDOG-2025-Track-1-of-SZTU.
- Abstract(参考訳): MIDOG 2025 Track 1は、非腫瘍領域、炎症領域、壊死領域を含む全スライド画像(WSI)におけるミトーシス検出を必要とする。
複雑で異質な文脈と可能なアーティファクトのため、しばしば偽陽性と偽陰性が存在し、検出F1スコアが劣化する。
この問題に対処するため,我々は2段階のフレームワークを提案する。
まず、改良されたYOLO11xをEMAアテンションとLSConvに統合し、ミトーシス候補を生成する。
信頼性の低いしきい値を使用して、可能な限り多くの提案を生成し、検出リコールを確実にします。
次に、ConvNeXt-Tiny分類器を用いて偽陽性をフィルタリングし、検出精度を確保する。
これにより、提案した2段階のフレームワークは、高い検出F1スコアを生成することができる。
本フレームワークは,MIDOG++,MITOS_WSI_CCMCT,MITOS_WSI_CMCからなる融合データセットを用いて,単一ステージYOLO11xベースラインよりも0.035高い0.882のF1スコアを達成する。
この性能向上は、0.762から0.839までの大幅な精度向上と、同等のリコールによって実現されている。
コードはhttps://github.com/xxiao0304/MIDOG-2025-Track-1-of-SZTUで公開されている。
関連論文リスト
- RF-DETR for Robust Mitotic Figure Detection: A MIDOG 2025 Track 1 Approach [0.0]
本稿では,MIDOG 2025 チャレンジトラック 1 へのアプローチを,多様な組織学的文脈における堅牢な有糸分裂型人物検出に焦点をあてる。
RF-DETR (Roboflow Detection Transformer) を用いて,MIDOG++データセットをトレーニングした。
予備試験では,0.789点,0.839点,精度0.746点のF1値を得た。
論文 参考訳(メタデータ) (2025-08-29T16:04:50Z) - FedCVD++: Communication-Efficient Federated Learning for Cardiovascular Risk Prediction with Parametric and Non-Parametric Model Optimization [3.9750281362522237]
心臓血管疾患は毎年1700万人以上の死者を出している。
強化されたフェデレート学習フレームワークであるFedCVD++を紹介する。
FedCVD++は、冠状心疾患のリスク予測のためにパラメトリックモデル(論理回帰、SVM、ニューラルネットワーク)と非パラメトリックモデル(ランサムフォレスト、XGBoost)を統合する。
論文 参考訳(メタデータ) (2025-07-30T06:17:33Z) - RoBiS: Robust Binary Segmentation for High-Resolution Industrial Images [3.226330965024265]
現実シナリオにおける教師なし異常検出は重要な課題である。
現在の方法はMVTec AD 2ベンチマークで大幅に性能が低下している。
3つのコアモジュールからなる堅牢なフレームワークRoBiSを提案する。
論文 参考訳(メタデータ) (2025-05-27T13:04:48Z) - Model Inversion Attacks Through Target-Specific Conditional Diffusion Models [54.69008212790426]
モデル反転攻撃(MIA)は、ターゲット分類器のトレーニングセットからプライベートイメージを再構築することを目的としており、それによってAIアプリケーションにおけるプライバシー上の懸念が高まる。
従来のGANベースのMIAは、GANの固有の欠陥と潜伏空間における最適化の偏りにより、劣った遺伝子的忠実度に悩まされる傾向にある。
これらの問題を緩和するために拡散モデル反転(Diff-MI)攻撃を提案する。
論文 参考訳(メタデータ) (2024-07-16T06:38:49Z) - A novel dataset and a two-stage mitosis nuclei detection method based on
hybrid anchor branch [12.701748529240183]
有糸分裂検出のための2段階カスケードネットワークFoCasNetを提案する。
第1段階では、可能な限り多くのミトースを検出するために、M_detと呼ばれる検出ネットワークが提案されている。
第2段階では、第1段階の結果を洗練させるために分類ネットワークM_classを提案する。
論文 参考訳(メタデータ) (2023-01-18T16:11:09Z) - Improved techniques for deterministic l2 robustness [63.34032156196848]
畳み込みニューラルネットワーク(CNN)を$l_2$ノルムの下で厳密な1-Lipschitz制約で訓練することは、対向的堅牢性、解釈可能な勾配、安定した訓練に有用である。
我々は,最後の線形層を1重層に置き換えることで,1-Lipschitz CNNのロバスト性を証明する手法を提案する。
我々は,CIFAR-10およびCIFAR-100における標準および証明可能な堅牢な精度の最先端化を図る。
論文 参考訳(メタデータ) (2022-11-15T19:10:12Z) - A Large-scale Multiple-objective Method for Black-box Attack against
Object Detection [70.00150794625053]
我々は、真正の確率を最小化し、偽正の確率を最大化し、より多くの偽正の物体が新しい真正の有界箱を作らないようにする。
我々は、GARSDCと呼ばれるランダム・サブセット選択とディバイド・アンド・コンカーによる標準的な遺伝的アルゴリズムを拡張し、効率を大幅に改善する。
最先端攻撃法と比較して、GARSDCはmAPでは平均12.0、広範囲な実験ではクエリでは約1000倍減少する。
論文 参考訳(メタデータ) (2022-09-16T08:36:42Z) - MutexMatch: Semi-supervised Learning with Mutex-based Consistency
Regularization [36.019086181632005]
ミューテックスをベースとした整合性正規化(Mutex)を提案し,信頼性の低いサンプルを新しい方法で活用する。
MutexMatchは、CIFAR-10、CIFAR-100、SVHN、STL-10、mini-ImageNetなど、複数のベンチマークデータセットで優れたパフォーマンスを実現している。
論文 参考訳(メタデータ) (2022-03-27T14:28:16Z) - Sparse and Imperceptible Adversarial Attack via a Homotopy Algorithm [93.80082636284922]
少数の敵対的攻撃は、数ピクセルを摂動するだけでディープ・ネットワーク(DNN)を騙すことができる。
近年の取り組みは、他の等級のl_infty摂動と組み合わせている。
本稿では,空間的・神経的摂動に対処するホモトピーアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-06-10T20:11:36Z) - Boosting Continuous Sign Language Recognition via Cross Modality
Augmentation [135.30357113518127]
連続手話認識は不整合のビデオテキストペアを扱う。
クロスモーダル拡張を用いた新しいアーキテクチャを提案する。
提案するフレームワークは、既存のCTCベースの連続SLRアーキテクチャに容易に拡張できる。
論文 参考訳(メタデータ) (2020-10-11T15:07:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。