論文の概要: Gall Bladder Cancer Detection from US Images with Only Image Level
Labels
- arxiv url: http://arxiv.org/abs/2309.05261v1
- Date: Mon, 11 Sep 2023 06:37:12 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-12 13:37:26.272663
- Title: Gall Bladder Cancer Detection from US Images with Only Image Level
Labels
- Title(参考訳): 画像レベルラベルのみを用いたus画像からの胆嚢癌検出
- Authors: Soumen Basu, Ashish Papanai, Mayank Gupta, Pankaj Gupta, Chetan Arora
- Abstract要約: 画像レベルラベルのみを用いた胆嚢癌(GBC)の検出に着目する。
GBC検出のための標準画像分類モデルを訓練することは困難である。
トレーニング用にバウンディングボックスアノテーションは使用できないため、弱い教師付きオブジェクト検出として問題に対処する。
- 参考スコア(独自算出の注目度): 7.89876701812201
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Automated detection of Gallbladder Cancer (GBC) from Ultrasound (US) images
is an important problem, which has drawn increased interest from researchers.
However, most of these works use difficult-to-acquire information such as
bounding box annotations or additional US videos. In this paper, we focus on
GBC detection using only image-level labels. Such annotation is usually
available based on the diagnostic report of a patient, and do not require
additional annotation effort from the physicians. However, our analysis reveals
that it is difficult to train a standard image classification model for GBC
detection. This is due to the low inter-class variance (a malignant region
usually occupies only a small portion of a US image), high intra-class variance
(due to the US sensor capturing a 2D slice of a 3D object leading to large
viewpoint variations), and low training data availability. We posit that even
when we have only the image level label, still formulating the problem as
object detection (with bounding box output) helps a deep neural network (DNN)
model focus on the relevant region of interest. Since no bounding box
annotations is available for training, we pose the problem as weakly supervised
object detection (WSOD). Motivated by the recent success of transformer models
in object detection, we train one such model, DETR, using
multi-instance-learning (MIL) with self-supervised instance selection to suit
the WSOD task. Our proposed method demonstrates an improvement of AP and
detection sensitivity over the SOTA transformer-based and CNN-based WSOD
methods. Project page is at https://gbc-iitd.github.io/wsod-gbc
- Abstract(参考訳): 超音波(US)画像からの胆嚢癌(GBC)の自動検出は重要な問題であり、研究者の関心が高まっている。
しかし、これらの作品の多くは、バウンディングボックスアノテーションや追加のUSビデオなどの入手困難な情報を使っている。
本稿では,画像レベルラベルのみを用いたgbc検出に注目する。
このようなアノテーションは通常、患者の診断レポートに基づいて利用可能であり、医師からの追加のアノテーションは不要である。
しかし,本解析により,gbc検出のための標準画像分類モデルの訓練が困難であることが判明した。
これは、低いクラス間分散(通常、悪性領域は米国の画像のごく一部しか占めていない)、高いクラス内分散(アメリカのセンサーが3Dオブジェクトの2Dスライスをキャプチャしたため、大きな視点の変化につながる)、低いトレーニングデータ可用性による。
画像レベルのラベルしか持たない場合でも、オブジェクト検出(バウンディングボックス出力)として問題を定式化することは、ディープニューラルネットワーク(DNN)モデルが関心のある領域にフォーカスするのに役立つと仮定する。
トレーニングにはバウンディングボックスアノテーションが利用できないため、弱い教師付きオブジェクト検出(WSOD)として問題を提起する。
オブジェクト検出におけるトランスフォーマーモデルの成功により、WSODタスクに適した自己教師型インスタンス選択を備えたマルチインスタンス学習(MIL)を用いて、そのようなモデルであるDETRをトレーニングする。
提案手法は,SOTAトランスおよびCNNベースのWSOD法に対して,APと検出感度の改善を示す。
プロジェクトページはhttps://gbc-iitd.github.io/wsod-gbc
関連論文リスト
- Shelf-Supervised Cross-Modal Pre-Training for 3D Object Detection [52.66283064389691]
最先端の3Dオブジェクト検出器は、しばしば大量のラベル付きデータセットで訓練される。
近年の研究では、ラベル付きデータによる自己教師付き事前学習が、ラベル付きラベルによる検出精度を向上させることが示されている。
組合わせRGBとLiDARデータからゼロショット3Dバウンディングボックスを生成するためのシェルフ制御手法を提案する。
論文 参考訳(メタデータ) (2024-06-14T15:21:57Z) - Adapting Visual-Language Models for Generalizable Anomaly Detection in Medical Images [68.42215385041114]
本稿では,CLIPモデルを用いた医用異常検出のための軽量な多レベル適応と比較フレームワークを提案する。
提案手法では,複数の残像アダプタを事前学習した視覚エンコーダに統合し,視覚的特徴の段階的向上を実現する。
医学的異常検出ベンチマーク実験により,本手法が現在の最先端モデルを大幅に上回っていることが示された。
論文 参考訳(メタデータ) (2024-03-19T09:28:19Z) - FocusMAE: Gallbladder Cancer Detection from Ultrasound Videos with Focused Masked Autoencoders [7.76606060260265]
本研究は,ビデオベース検出へのパラダイムシフトを提唱する。
高情報領域からのマスキングトークンの選択を体系的にバイアスするFocusMAEという新しい設計を提案する。
我々は,現在の画像ベースSOTA-RadFormerで84%,ビデオベースSOTA-AdaMAEで94.7%,GBC検出問題で96.4%の最先端(SOTA)精度を報告した。
論文 参考訳(メタデータ) (2024-03-13T16:57:04Z) - Augment and Criticize: Exploring Informative Samples for Semi-Supervised
Monocular 3D Object Detection [64.65563422852568]
我々は、一般的な半教師付きフレームワークを用いて、難解な単分子3次元物体検出問題を改善する。
我々は、ラベルのないデータから豊富な情報的サンプルを探索する、新しい、シンプルで効果的なAugment and Criticize'フレームワークを紹介します。
3DSeMo_DLEと3DSeMo_FLEXと呼ばれる2つの新しい検出器は、KITTIのAP_3D/BEV(Easy)を3.5%以上改善した。
論文 参考訳(メタデータ) (2023-03-20T16:28:15Z) - Detecting tiny objects in aerial images: A normalized Wasserstein
distance and a new benchmark [45.10513110142015]
本稿では, 正規化ワッサースタイン距離 (NWD) と呼ばれる新しい評価基準と, 小型物体検出のためのRanKing-based Assigning (RKA) 戦略を提案する。
提案したNWD-RKA戦略は、標準のIoUしきい値に基づくものを置き換えるために、あらゆる種類のアンカーベースの検出器に容易に組み込むことができる。
4つのデータセットでテストされたNWD-RKAは、大きなマージンで小さなオブジェクト検出性能を継続的に改善することができる。
論文 参考訳(メタデータ) (2022-06-28T13:33:06Z) - Embracing Single Stride 3D Object Detector with Sparse Transformer [63.179720817019096]
自律走行のためのLiDARを用いた3次元物体検出では、物体サイズと入力シーンサイズとの比が2次元検出の場合に比べて有意に小さい。
多くの3D検出器は2D検出器の一般的な慣習に従っており、点雲の定量化後も特徴マップを分解する。
本稿では,SST(Single-stride Sparse Transformer)を提案する。
論文 参考訳(メタデータ) (2021-12-13T02:12:02Z) - Self-supervised Pseudo Multi-class Pre-training for Unsupervised Anomaly
Detection and Segmentation in Medical Images [31.676609117780114]
教師なし異常検出(UAD)法は、正常な(または健康な)画像のみを用いて訓練されるが、テスト中は正常な(または正常な)画像と異常な画像を分類することができる。
コントラスト学習(PMSACL)によるPseudo Multi-class Strong Augmentation(Pseudo Multi-class Strong Augmentation)という,MIA UADアプリケーションのための自己指導型事前学習手法を提案する。
論文 参考訳(メタデータ) (2021-09-03T04:25:57Z) - DAAIN: Detection of Anomalous and Adversarial Input using Normalizing
Flows [52.31831255787147]
我々は、アウト・オブ・ディストリビューション(OOD)インプットと敵攻撃(AA)を検出する新しい手法であるDAINを導入する。
本手法は,ニューラルネットワークの内部動作を監視し,活性化分布の密度推定器を学習する。
当社のモデルは,特別なアクセラレータを必要とせずに,効率的な計算とデプロイが可能な単一のGPUでトレーニングすることが可能です。
論文 参考訳(メタデータ) (2021-05-30T22:07:13Z) - Constrained Contrastive Distribution Learning for Unsupervised Anomaly
Detection and Localisation in Medical Images [23.79184121052212]
UAD(Unsupervised Anomaly Detection)は、通常の(すなわち健康的な)画像でのみ1クラスの分類器を学習する。
異常検出のための制約コントラスト分布学習(Constrained Contrastive Distribution Learning for Anomaly Detection, CCD)を提案する。
本手法は,3種類の大腸内視鏡および底部検診データセットにおいて,最先端のUADアプローチよりも優れている。
論文 参考訳(メタデータ) (2021-03-05T01:56:58Z) - Dense Label Encoding for Boundary Discontinuity Free Rotation Detection [69.75559390700887]
本稿では,分類に基づく比較的研究の少ない方法論について検討する。
我々は2つの側面でフロンティアを推し進めるための新しい手法を提案する。
航空画像のための大規模公開データセットの実験と視覚解析は,我々のアプローチの有効性を示している。
論文 参考訳(メタデータ) (2020-11-19T05:42:02Z) - Pseudo-Labeling for Small Lesion Detection on Diabetic Retinopathy
Images [12.49381528673824]
糖尿病網膜症(英: Diabetic retinopathy、DR)は、世界の勤労者の視覚障害の主要な原因である。
糖尿病患者の約300~400万人は、DRのために視力を失います。
色眼底画像によるDRの診断は、そのような問題を緩和するための一般的なアプローチである。
論文 参考訳(メタデータ) (2020-03-26T17:13:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。