論文の概要: The unreasonable effectiveness of AI CADe polyp detectors to generalize
to new countries
- arxiv url: http://arxiv.org/abs/2312.06833v1
- Date: Mon, 11 Dec 2023 20:54:59 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-13 18:11:20.242568
- Title: The unreasonable effectiveness of AI CADe polyp detectors to generalize
to new countries
- Title(参考訳): 新しい国に一般化するAI CADeポリプ検出器の理にかなわない効果
- Authors: Joel Shor, Hiro-o Yamano, Daisuke Tsurumaru, Yotami Intrator, Hiroki
Kayama, Joe Ledsam, Atsushi Hamabe, Koji Ando, Mitsuhiko Ota, Haruei Ogino,
Hiroshi Nakase, Kaho Kobayashi, Eiji Oki, Roman Goldenberg, Ehud Rivlin,
Ichiro Takemasa
- Abstract要約: ポリープ検出にはCAD(Computer-Aided Detection)が一般的に用いられるが、臨床現場で見られるデータはモデルトレーニングとは異なる場合がある。
CADe検出器が訓練中に見られない国々の大腸でどれだけ効果があるかを評価する研究はほとんどない。
イスラエルの大腸内視鏡ビデオ(5004本,1106時間)でCADeポリープ検出装置を訓練し,TPR(True Positive Rate)とFAPM(False alarms per minute)を測定し,日本のビデオ(354本,128時間)で評価した。
- 参考スコア(独自算出の注目度): 6.8996762273831145
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: $\textbf{Background and aims}$: Artificial Intelligence (AI) Computer-Aided
Detection (CADe) is commonly used for polyp detection, but data seen in
clinical settings can differ from model training. Few studies evaluate how well
CADe detectors perform on colonoscopies from countries not seen during
training, and none are able to evaluate performance without collecting
expensive and time-intensive labels.
$\textbf{Methods}$: We trained a CADe polyp detector on Israeli colonoscopy
videos (5004 videos, 1106 hours) and evaluated on Japanese videos (354 videos,
128 hours) by measuring the True Positive Rate (TPR) versus false alarms per
minute (FAPM). We introduce a colonoscopy dissimilarity measure called "MAsked
mediCal Embedding Distance" (MACE) to quantify differences between
colonoscopies, without labels. We evaluated CADe on all Japan videos and on
those with the highest MACE.
$\textbf{Results}$: MACE correctly quantifies that narrow-band imaging (NBI)
and chromoendoscopy (CE) frames are less similar to Israel data than Japan
whitelight (bootstrapped z-test, |z| > 690, p < $10^{-8}$ for both). Despite
differences in the data, CADe performance on Japan colonoscopies was
non-inferior to Israel ones without additional training (TPR at 0.5 FAPM: 0.957
and 0.972 for Israel and Japan; TPR at 1.0 FAPM: 0.972 and 0.989 for Israel and
Japan; superiority test t > 45.2, p < $10^{-8}$). Despite not being trained on
NBI or CE, TPR on those subsets were non-inferior to Japan overall
(non-inferiority test t > 47.3, p < $10^{-8}$, $\delta$ = 1.5% for both).
$\textbf{Conclusion}$: Differences that prevent CADe detectors from
performing well in non-medical settings do not degrade the performance of our
AI CADe polyp detector when applied to data from a new country. MACE can help
medical AI models internationalize by identifying the most "dissimilar" data on
which to evaluate models.
- Abstract(参考訳): $\textbf{Background and aim}$: Artificial Intelligence (AI) Computer-Aided Detection (CADe) は一般的にポリープ検出に使用されるが、臨床設定で見られるデータはモデルトレーニングとは異なる場合がある。
CADe検出器がトレーニング中に見られていない国々の大腸内視鏡にどの程度効果があるかを評価する研究はほとんどなく、高価で時間を要するラベルを収集することなく性能を評価することはできない。
イスラエルの大腸内視鏡ビデオ(5004本、1106時間)でCADeポリープ検出装置を訓練し、日本の動画(354本、128時間)で1分あたりの真陽性率(TPR)と偽アラーム(FAPM)を測定した。
大腸内視鏡検査の異同度尺度であるmace(masked medical embedded distance)を施行し,大腸内視鏡検査を施行した。
本研究は,全日本動画および最も高いMACE動画でCADeを評価した。
$\textbf{Results}$: MACEは、狭帯域イメージング(NBI)とクロモエンドスコープ(CE)フレームが日本のホワイトライト(bootstrapped z-test, |z| > 690, p < 10^{-8}$)よりもイスラエルのデータに似ていないことを正確に定量化する。
このデータの違いにもかかわらず、日本におけるコロンコピーのCADの成績は、追加訓練を伴わないイスラエルの成績(0.5 FAPM:0.957と0.972、1.0 FAPM:0.972と0.989、優越試験 t > 45.2, p < 10^{-8}$)には劣っていた。
NBIやCEで訓練を受けていないにもかかわらず、これらのサブセットのTPRは日本全体の非劣等試験である(非劣等試験 t > 47.3, p < 10^{-8}$, $\delta$ = 1.5%)。
$\textbf{Conclusion}$: 医療的でない環境でCADe検出器が正常に動作することを防ぐ差異は、新しい国のデータに適用した場合、私たちのAI CADeポリプ検出器のパフォーマンスを低下させません。
MACEは、モデルを評価する上で最も「異なる」データを特定することで、医療AIモデルを国際化するのに役立つ。
関連論文リスト
- Predicting Generalization of AI Colonoscopy Models to Unseen Data [6.595978165877695]
見えないデータ中の現象を識別する「マスケシームズネットワーク」(MSN)。
MSNはラベルなしでポリプ画像のマスキング領域を予測する訓練を行った。
論文 参考訳(メタデータ) (2024-03-14T23:41:00Z) - Problems and shortcuts in deep learning for screening mammography [2.9033848132822726]
この研究は、ディープラーニングモデルの性能と一般化性に関する未解明の課題を明らかにする。
私たちは2008年から2017年にかけて取得された120,112の米国立試験(3,467のがん)の振り返りデータセットに基づいて、がんを分類するAIモデルを訓練した。
11,593人(がん102人,女性7,594人,女性57.1人,女性11.0人),英国1,880人(がん590人,女性1,745人,女性63.3人,女性7.2人)を対象に検診を行った。
論文 参考訳(メタデータ) (2023-03-29T02:50:59Z) - Building Brains: Subvolume Recombination for Data Augmentation in Large
Vessel Occlusion Detection [56.67577446132946]
この戦略をデータから学ぶためには、標準的なディープラーニングベースのモデルに対して、大規模なトレーニングデータセットが必要である。
そこで本研究では, 異なる患者から血管木セグメントを組換えることで, 人工的なトレーニングサンプルを生成する方法を提案する。
拡張スキームに則って,タスク固有の入力を入力した3D-DenseNetを用いて,半球間の比較を行う。
論文 参考訳(メタデータ) (2022-05-05T10:31:57Z) - In Defense of Kalman Filtering for Polyp Tracking from Colonoscopy
Videos [15.377310026794854]
大腸内視鏡画像からのポリープのリアルタイムかつ堅牢な自動検出は、この試験における医師のパフォーマンス向上に不可欠である。
この分野の現在の焦点は、リアルタイムの応用が不可能な正確だが非効率な検出器の開発である。
本稿では,実時間ポリプ検出器の実装を実現するために,強力だが効率的な検出器と協調して動作するカルマンフィルタトラッカーを提案する。
論文 参考訳(メタデータ) (2022-01-27T11:25:58Z) - Osteoporosis Prescreening using Panoramic Radiographs through a Deep
Convolutional Neural Network with Attention Mechanism [65.70943212672023]
注意モジュールを持つディープ畳み込みニューラルネットワーク(CNN)はパノラマX線写真上で骨粗しょう症を検出することができる。
49歳から60歳までの70種類のパノラマX線写真(PR)のデータセットを用いて検討した。
論文 参考訳(メタデータ) (2021-10-19T00:03:57Z) - Self-Supervised U-Net for Segmenting Flat and Sessile Polyps [63.62764375279861]
大腸ポリープの発達は、がんの最も初期の兆候の1つである。
ポリープの早期検出と切除は生存率を90%に大きく向上させる。
大腸内視鏡画像の処理によりポリープを検出するコンピュータ支援診断システム(CADx)が提案されている。
論文 参考訳(メタデータ) (2021-10-17T09:31:20Z) - Deep learning-based COVID-19 pneumonia classification using chest CT
images: model generalizability [54.86482395312936]
深層学習(DL)分類モデルは、異なる国の3DCTデータセット上で、COVID-19陽性患者を特定するために訓練された。
我々は、データセットと72%の列車、8%の検証、20%のテストデータを組み合わせたDLベースの9つの同一分類モデルを訓練した。
複数のデータセットでトレーニングされ、トレーニングに使用されるデータセットの1つからテストセットで評価されたモデルは、よりよいパフォーマンスを示した。
論文 参考訳(メタデータ) (2021-02-18T21:14:52Z) - End-to-end Prostate Cancer Detection in bpMRI via 3D CNNs: Effect of
Attention Mechanisms, Clinical Priori and Decoupled False Positive Reduction [0.0]
本研究では、Bi-parametric MR Imaging (bpMRI) における臨床的に重要な前立腺癌(csa)の自動局在化のための新しい3Dコンピュータ支援診断モデルを提案する。
ディープアテンションメカニズムはその検出ネットワークを駆動し、多解像度で健全な構造と高度に識別可能な特徴次元をターゲットにしている。
CNNベースのモデルは、独立コホートにおける生検で確認された悪性腫瘍を検出するために訓練することができる。
論文 参考訳(メタデータ) (2021-01-08T22:59:30Z) - Colonoscopy Polyp Detection: Domain Adaptation From Medical Report
Images to Real-time Videos [76.37907640271806]
大腸内視鏡画像と実時間映像の領域間ギャップに対処する画像-ビデオ結合型ポリープ検出ネットワーク(Ivy-Net)を提案する。
収集したデータセットの実験は、Ivy-Netが大腸内視鏡ビデオで最先端の結果を達成することを示した。
論文 参考訳(メタデータ) (2020-12-31T10:33:09Z) - DDANet: Dual Decoder Attention Network for Automatic Polyp Segmentation [0.3734402152170273]
本稿では,デュアルデコーダアテンションネットワークに基づくDDANet'という新しいアーキテクチャを提案する。
実験では、Kvasir-SEGデータセットで訓練され、見えないデータセットでテストされたモデルは、0.7874のダイス係数、0.7010のmIoU、0.7987のリコール、0.8577の精度を達成した。
論文 参考訳(メタデータ) (2020-12-30T17:52:35Z) - Automatic sleep stage classification with deep residual networks in a
mixed-cohort setting [63.52264764099532]
我々は,大規模コホートの一般化性を評価するために,新しいディープニューラルネットワークモデルを開発した。
総合的な分類精度はトレーニングデータの分数を増やして向上した。
論文 参考訳(メタデータ) (2020-08-21T10:48:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。