論文の概要: Adaptive Detector-Verifier Framework for Zero-Shot Polyp Detection in Open-World Settings
- arxiv url: http://arxiv.org/abs/2512.12492v2
- Date: Tue, 16 Dec 2025 04:40:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-17 14:48:05.9529
- Title: Adaptive Detector-Verifier Framework for Zero-Shot Polyp Detection in Open-World Settings
- Title(参考訳): オープンワールドにおけるゼロショットポリープ検出のための適応型検出器検証フレームワーク
- Authors: Shengkai Xu, Hsiang Lun Kao, Tianxiang Xu, Honghui Zhang, Junqiao Wang, Runmeng Ding, Guanyu Liu, Tianyu Shi, Zhenyu Yu, Guofeng Pan, Ziqian Bi, Yuqi Ouyang,
- Abstract要約: 既存のアプローチは、コントロールされた検査条件と臨床実践の間の領域ギャップに苦慮している。
本稿では、視覚言語モデル(VLM)検証器を備えたYOLOv11検出器からなる新しい2段階検出器検証フレームワークであるAdaptiveDetectorを提案する。
この適応しきい値とコスト感受性強化学習の組み合わせは、臨床的に整合したオープンワールドポリープ検出を実現し、偽陰性は極めて少ない。
- 参考スコア(独自算出の注目度): 7.768426131383283
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Polyp detectors trained on clean datasets often underperform in real-world endoscopy, where illumination changes, motion blur, and occlusions degrade image quality. Existing approaches struggle with the domain gap between controlled laboratory conditions and clinical practice, where adverse imaging conditions are prevalent. In this work, we propose AdaptiveDetector, a novel two-stage detector-verifier framework comprising a YOLOv11 detector with a vision-language model (VLM) verifier. The detector adaptively adjusts per-frame confidence thresholds under VLM guidance, while the verifier is fine-tuned with Group Relative Policy Optimization (GRPO) using an asymmetric, cost-sensitive reward function specifically designed to discourage missed detections -- a critical clinical requirement. To enable realistic assessment under challenging conditions, we construct a comprehensive synthetic testbed by systematically degrading clean datasets with adverse conditions commonly encountered in clinical practice, providing a rigorous benchmark for zero-shot evaluation. Extensive zero-shot evaluation on synthetically degraded CVC-ClinicDB and Kvasir-SEG images demonstrates that our approach improves recall by 14 to 22 percentage points over YOLO alone, while precision remains within 0.7 points below to 1.7 points above the baseline. This combination of adaptive thresholding and cost-sensitive reinforcement learning achieves clinically aligned, open-world polyp detection with substantially fewer false negatives, thereby reducing the risk of missed precancerous polyps and improving patient outcomes.
- Abstract(参考訳): クリーンなデータセットでトレーニングされたポリプ検出器は、照明の変化、動きのぼかし、オクルージョンが画質を劣化させるような現実世界の内視鏡では、しばしば性能が劣る。
既存のアプローチは、コントロールされた検査条件と、悪質な撮像条件が一般的である臨床実践の間の領域ギャップに苦慮している。
本稿では、視覚言語モデル(VLM)検証器を備えたYOLOv11検出器からなる新しい2段階検出器検証フレームワークであるAdaptiveDetectorを提案する。
検出器はVLMガイダンスの下でフレーム単位の信頼性閾値を適応的に調整し、検証器は非対称でコストに敏感な報酬関数を用いてグループ相対ポリシー最適化(GRPO)で微調整される。
課題のある条件下での現実的な評価を実現するため,臨床現場でよく見られる有害な条件でクリーンデータセットを体系的に分解し,ゼロショット評価のための厳密なベンチマークを提供する総合的な総合的なテストベッドを構築した。
合成劣化したCVC-ClinicDBおよびKvasir-SEG画像の広範囲なゼロショット評価により,本手法はYOLO単独で14~22ポイント改善され,精度は0.7ポイントから1.7ポイントに抑えられた。
この適応しきい値学習とコスト感受性強化学習の組み合わせは、臨床的に整合したオープンワールドポリープ検出を極めて少ない偽陰性で達成し、欠落した前立腺ポリープのリスクを低減し、患者の結果を改善する。
関連論文リスト
- A Dual-Use Framework for Clinical Gait Analysis: Attention-Based Sensor Optimization and Automated Dataset Auditing [0.0]
本稿では,センサと自動データ監査器の両方として機能するマルチストリームアテンションに基づくディープラーニングフレームワークを提案する。
Voisard et al. (2025) によるマルチコホート歩行データセットの適用により、モデルの注意機構は、深刻なデータセットの衝突を定量的に検出した。
論文 参考訳(メタデータ) (2025-11-03T20:29:03Z) - Conformal Lesion Segmentation for 3D Medical Images [82.92159832699583]
本稿では,データ駆動しきい値の校正をコンフォーマル化することで,テスト時間FNRが目標許容値以下であることを保証する,リスク制約付きフレームワークを提案する。
5つのバックボーンモデルにまたがる6つの3D-LSデータセット上でのCLSの統計的健全性と予測性能を検証し,臨床実践におけるリスク認識セグメンテーションの展開に関する実用的な知見を得た。
論文 参考訳(メタデータ) (2025-10-19T08:21:00Z) - PolypSeg-GradCAM: Towards Explainable Computer-Aided Gastrointestinal Disease Detection Using U-Net Based Segmentation and Grad-CAM Visualization on the Kvasir Dataset [7.02937797539818]
大腸癌(CRC)は、世界中のがん関連死亡率と死亡率の主要な原因の1つである。
深層学習法は自動ポリープ解析の強力な可能性を示しているが、その限定的な解釈性は臨床応用の障壁である。
本稿では,U-NetアーキテクチャとGradient-weighted Class Activation Mapping (Grad-CAM)を統合し,透過的なPolypセグメンテーションを実現するフレームワークであるPolypSeg-GradCAMを提案する。
論文 参考訳(メタデータ) (2025-09-17T02:57:33Z) - A Fully Automatic Framework for Intracranial Pressure Grading: Integrating Keyframe Identification, ONSD Measurement and Clinical Data [3.6652537579778106]
頭蓋内圧(ICP)上昇は脳機能に深刻な脅威をもたらし、時間的介入の監視を必要とする。
OnSD測定と臨床データを統合したICPグレーティングのための完全自動2段階フレームワークを提案する。
評価精度は0.845 pm 0.071$, 独立試験精度0.786であり, 従来のしきい値法よりも優れていた。
論文 参考訳(メタデータ) (2025-09-11T11:37:48Z) - Dual-Mode Deep Anomaly Detection for Medical Manufacturing: Structural Similarity and Feature Distance [2.467339701756281]
本稿では,2つの注意誘導型オートエンコーダアーキテクチャを提案する。
1つ目は、軽量でリアルタイムな欠陥検出を可能にする構造的類似性に基づくスコアリングアプローチである。
第二に、Mahalanobis を用いた特徴距離ベースの戦略を、遅延特性の低減に応用する。
論文 参考訳(メタデータ) (2025-09-06T18:17:40Z) - Crane: Context-Guided Prompt Learning and Attention Refinement for Zero-Shot Anomaly Detection [50.343419243749054]
異常検出は、医学診断や工業的欠陥検出などの分野において重要である。
CLIPの粗粒化画像テキストアライメントは、微粒化異常に対する局所化と検出性能を制限する。
クレーンは最先端のZSADを2%から28%に改善し、画像レベルとピクセルレベルの両方で、推論速度では競争力を維持している。
論文 参考訳(メタデータ) (2025-04-15T10:42:25Z) - Machine Learning for ALSFRS-R Score Prediction: Making Sense of the Sensor Data [44.99833362998488]
筋萎縮性側索硬化症(Amyotrophic Lateral Sclerosis、ALS)は、急速に進行する神経変性疾患である。
iDPP@CLEF 2024チャレンジを先導した今回の調査は,アプリから得られるセンサデータを活用することに焦点を当てている。
論文 参考訳(メタデータ) (2024-07-10T19:17:23Z) - Hierarchical Semi-Supervised Contrastive Learning for
Contamination-Resistant Anomaly Detection [81.07346419422605]
異常検出は、通常のデータ分布から逸脱したサンプルを特定することを目的としている。
コントラスト学習は、異常の効果的な識別を可能にする表現のサンプル化に成功している。
汚染耐性異常検出のための新しい階層型半教師付きコントラスト学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-24T18:49:26Z) - Controlling False Positive/Negative Rates for Deep-Learning-Based
Prostate Cancer Detection on Multiparametric MR images [58.85481248101611]
そこで本研究では,病変からスライスまでのマッピング機能に基づく,病変レベルのコスト感受性損失と付加的なスライスレベルの損失を組み込んだ新しいPCa検出ネットワークを提案する。
1) 病変レベルFNRを0.19から0.10に, 病変レベルFPRを1.03から0.66に減らした。
論文 参考訳(メタデータ) (2021-06-04T09:51:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。