論文の概要: Predicting Generalization of AI Colonoscopy Models to Unseen Data
- arxiv url: http://arxiv.org/abs/2403.09920v1
- Date: Thu, 14 Mar 2024 23:41:00 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-18 20:56:05.874120
- Title: Predicting Generalization of AI Colonoscopy Models to Unseen Data
- Title(参考訳): 見えないデータに対するAI大腸内視鏡モデルの一般化予測
- Authors: Joel Shor, Carson McNeil, Yotam Intrator, Joseph R Ledsam, Hiro-o Yamano, Daisuke Tsurumaru, Hiroki Kayama, Atsushi Hamabe, Koji Ando, Mitsuhiko Ota, Haruei Ogino, Hiroshi Nakase, Kaho Kobayashi, Masaaki Miyo, Eiji Oki, Ichiro Takemasa, Ehud Rivlin, Roman Goldenberg,
- Abstract要約: 見えないデータ中の現象を識別する「マスケシームズネットワーク」(MSN)。
MSNはラベルなしでポリプ画像のマスキング領域を予測する訓練を行った。
- 参考スコア(独自算出の注目度): 6.595978165877695
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Background and aims Generalizability of AI colonoscopy algorithms is important for wider adoption in clinical practice. However, current techniques for evaluating performance on unseen data require expensive and time-intensive labels. Methods We use a "Masked Siamese Network" (MSN) to identify novel phenomena in unseen data and predict polyp detector performance. MSN is trained to predict masked out regions of polyp images, without any labels. We test MSN's ability to be trained on data only from Israel and detect unseen techniques, narrow-band imaging (NBI) and chromendoscoy (CE), on colonoscopes from Japan (354 videos, 128 hours). We also test MSN's ability to predict performance of Computer Aided Detection (CADe) of polyps on colonoscopies from both countries, even though MSN is not trained on data from Japan. Results MSN correctly identifies NBI and CE as less similar to Israel whitelight than Japan whitelight (bootstrapped z-test, |z| > 496, p < 10-8 for both) using the label-free Frechet distance. MSN detects NBI with 99% accuracy, predicts CE better than our heuristic (90% vs 79% accuracy) despite being trained only on whitelight, and is the only method that is robust to noisy labels. MSN predicts CADe polyp detector performance on in-domain Israel and out-of-domain Japan colonoscopies (r=0.79, 0.37 respectively). With few examples of Japan detector performance to train on, MSN prediction of Japan performance improves (r=0.56). Conclusion Our technique can identify distribution shifts in clinical data and can predict CADe detector performance on unseen data, without labels. Our self-supervised approach can aid in detecting when data in practice is different from training, such as between hospitals or data has meaningfully shifted from training. MSN has potential for application to medical image domains beyond colonoscopy.
- Abstract(参考訳): AI大腸内視鏡アルゴリズムの一般化の背景と目的は、臨床実践において広く採用される上で重要である。
しかし、現在、目に見えないデータのパフォーマンスを評価する技術は、高価で時間集約的なラベルを必要とする。
提案手法は"Masked Siamese Network" (MSN) を用いて、見えないデータにおける新しい現象を識別し、ポリプ検出器の性能を予測する。
MSNは、ラベルなしでポリプ画像のマスクされた領域を予測するように訓練されている。
本研究は,日本からの大腸内視鏡(354本,128時間)において,イスラエルからのデータのみを用いてMSNを訓練し,未確認技術,狭帯域画像(NBI)およびクロマトエンドスコープ(CE)を検出する能力をテストする。
また,MSNは日本からのデータに基づいて訓練を受けていないものの,両国の大腸粘膜におけるポリープのCAD(Computer Aided Detection)の性能を予測する能力についても検証した。
結果,NBI と CE は日本白色光 (bootstrapped z-test, |z| > 496, p < 10-8 for both) よりイスラエル白色光に似ていない。
MSNは99%の精度でNBIを検出し、ホワイトライトでのみトレーニングされているにもかかわらず、CEが我々のヒューリスティック(90%対79%の精度)より優れていると予測し、ノイズの多いラベルに対して堅牢な唯一の方法である。
MSNは、イスラエル内および日本の植民地内におけるCADポリプ検出性能(それぞれr=0.79、0.37)を予測している。
日本における検出性能の訓練例は少ないが、MSNによる日本の性能予測は改善されている(r=0.56)。
結語 臨床データにおける分布変化を同定し, ラベルなしでCADe検出性能を予測できる。
当社の自己監督型アプローチは、病院やデータがトレーニングから有意義に移行したなど、実際のデータとトレーニングの違いを検出するのに役立ちます。
MSNは大腸内視鏡以外の医療画像領域にも応用できる可能性がある。
関連論文リスト
- The unreasonable effectiveness of AI CADe polyp detectors to generalize
to new countries [6.8996762273831145]
ポリープ検出にはCAD(Computer-Aided Detection)が一般的に用いられるが、臨床現場で見られるデータはモデルトレーニングとは異なる場合がある。
CADe検出器が訓練中に見られない国々の大腸でどれだけ効果があるかを評価する研究はほとんどない。
イスラエルの大腸内視鏡ビデオ(5004本,1106時間)でCADeポリープ検出装置を訓練し,TPR(True Positive Rate)とFAPM(False alarms per minute)を測定し,日本のビデオ(354本,128時間)で評価した。
論文 参考訳(メタデータ) (2023-12-11T20:54:59Z) - Unmasking the Chameleons: A Benchmark for Out-of-Distribution Detection
in Medical Tabular Data [1.161962828740753]
我々は,近距離OODと遠距離OODを含む一連のテストに対して,異なる手法を比較するベンチマークを提案する。
以上の結果から,この問題は遠方のOODでは解決されるが,近方のOODでは未解決であることが明らかとなった。
トランスフォーマーアーキテクチャは、ResNetやResNetと比べてはるかに信頼性が低い。
論文 参考訳(メタデータ) (2023-09-28T07:52:01Z) - Unleashing Mask: Explore the Intrinsic Out-of-Distribution Detection
Capability [70.72426887518517]
Out-of-Distribution(OOD)検出は、機械学習モデルを現実世界のアプリケーションにデプロイする際に、セキュアAIの必須の側面である。
本稿では,IDデータを用いた学習モデルのOOD識別能力を復元する新しい手法であるUnleashing Maskを提案する。
本手法では, マスクを用いて記憶した非定型サンプルを抽出し, モデルを微調整するか, 導入したマスクでプルーする。
論文 参考訳(メタデータ) (2023-06-06T14:23:34Z) - Machine Learning Force Fields with Data Cost Aware Training [94.78998399180519]
分子動力学(MD)シミュレーションを加速するために機械学習力場(MLFF)が提案されている。
最もデータ効率のよいMLFFであっても、化学精度に達するには数百フレームの力とエネルギーのラベルが必要になる。
我々は、安価な不正確なデータと高価な正確なデータの組み合わせを利用して、MLFFのデータコストを下げる多段階計算フレームワークASTEROIDを提案する。
論文 参考訳(メタデータ) (2023-06-05T04:34:54Z) - Efficient Testing of Deep Neural Networks via Decision Boundary Analysis [28.868479656437145]
我々は、新しいラベルのないデータに基づいてDNNの性能を推定できるAriesという新しい手法を提案する。
Aries による推定精度は 0.03% -- 2.60% (平均 0.61%) しか真の精度から外れていない。
論文 参考訳(メタデータ) (2022-07-22T08:39:10Z) - Unsupervised pre-training of graph transformers on patient population
graphs [48.02011627390706]
異種臨床データを扱うグラフ変換器を用いたネットワークを提案する。
自己教師型, 移動学習環境において, 事前学習方式の利点を示す。
論文 参考訳(メタデータ) (2022-07-21T16:59:09Z) - Semi-Supervised Generative Adversarial Network for Stress Detection
Using Partially Labeled Physiological Data [0.0]
半スーパービジョンアルゴリズムは、安価な感情状態検出システムのための実行可能な方法である。
本稿では, ストレス検出のための WESAD (Wearable Stress and Affect Detection) データセット上で, 完全教師付きアルゴリズムとSSLを比較した。
論文 参考訳(メタデータ) (2022-06-30T01:58:33Z) - Self-Supervised U-Net for Segmenting Flat and Sessile Polyps [63.62764375279861]
大腸ポリープの発達は、がんの最も初期の兆候の1つである。
ポリープの早期検出と切除は生存率を90%に大きく向上させる。
大腸内視鏡画像の処理によりポリープを検出するコンピュータ支援診断システム(CADx)が提案されている。
論文 参考訳(メタデータ) (2021-10-17T09:31:20Z) - A Real Use Case of Semi-Supervised Learning for Mammogram Classification
in a Local Clinic of Costa Rica [0.5541644538483946]
ディープラーニングモデルのトレーニングには、かなりの量のラベル付きイメージが必要です。
多くの公開データセットが、さまざまな病院や診療所のデータで構築されている。
ラベルなしデータを利用した半教師付き深層学習手法であるMixMatchを提案し評価した。
論文 参考訳(メタデータ) (2021-07-24T22:26:50Z) - Exploring Unsupervised Pretraining Objectives for Machine Translation [99.5441395624651]
教師なし言語間事前訓練は、ニューラルマシン翻訳(NMT)の強力な結果を得た
ほとんどのアプローチは、入力の一部をマスキングしてデコーダで再構成することで、シーケンス・ツー・シーケンスアーキテクチャにマスク付き言語モデリング(MLM)を適用する。
マスキングと、実際の(完全な)文に似た入力を生成する代替目的を、文脈に基づいて単語を並べ替えて置き換えることにより比較する。
論文 参考訳(メタデータ) (2021-06-10T10:18:23Z) - Does BERT Pretrained on Clinical Notes Reveal Sensitive Data? [70.3631443249802]
我々は、トレーニングされたBERTからPersonal Health Informationを復元するためのアプローチのバッテリーを設計する。
具体的には,患者の名前と関連した状態の回復を試みている。
簡単な探索法では,MIMIC-IIIコーパス上で訓練されたBERTから機密情報を有意に抽出できないことがわかった。
論文 参考訳(メタデータ) (2021-04-15T20:40:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。