論文の概要: ClassifyViStA:WCE Classification with Visual understanding through Segmentation and Attention
- arxiv url: http://arxiv.org/abs/2412.18591v1
- Date: Tue, 24 Dec 2024 18:45:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-25 15:54:50.312117
- Title: ClassifyViStA:WCE Classification with Visual understanding through Segmentation and Attention
- Title(参考訳): セグメンテーションと注意による視覚的理解を用いたクラス化ViStA:WCE分類
- Authors: S. Balasubramanian, Ammu Abhishek, Yedu Krishna, Darshan Gera,
- Abstract要約: We propose ClassifyViStA, a AI-based framework designed for automated detection and classification of bleeding and non-bleeding frames from WCE video。
このモデルは、分類性能を高めるためにResNet18とVGG16アーキテクチャのアンサンブル上に構築されている。
我々のアプローチは、GI出血の検出を自動化するだけでなく、医療専門家の負担を軽減するための解釈可能なソリューションも提供します。
- 参考スコア(独自算出の注目度): 3.887356044145916
- License:
- Abstract: Gastrointestinal (GI) bleeding is a serious medical condition that presents significant diagnostic challenges, particularly in settings with limited access to healthcare resources. Wireless Capsule Endoscopy (WCE) has emerged as a powerful diagnostic tool for visualizing the GI tract, but it requires time-consuming manual analysis by experienced gastroenterologists, which is prone to human error and inefficient given the increasing number of patients.To address this challenge, we propose ClassifyViStA, an AI-based framework designed for the automated detection and classification of bleeding and non-bleeding frames from WCE videos. The model consists of a standard classification path, augmented by two specialized branches: an implicit attention branch and a segmentation branch.The attention branch focuses on the bleeding regions, while the segmentation branch generates accurate segmentation masks, which are used for classification and interpretability. The model is built upon an ensemble of ResNet18 and VGG16 architectures to enhance classification performance. For the bleeding region detection, we implement a Soft Non-Maximum Suppression (Soft NMS) approach with YOLOv8, which improves the handling of overlapping bounding boxes, resulting in more accurate and nuanced detections.The system's interpretability is enhanced by using the segmentation masks to explain the classification results, offering insights into the decision-making process similar to the way a gastroenterologist identifies bleeding regions. Our approach not only automates the detection of GI bleeding but also provides an interpretable solution that can ease the burden on healthcare professionals and improve diagnostic efficiency. Our code is available at ClassifyViStA.
- Abstract(参考訳): 消化器出血は重篤な疾患であり、特に医療資源へのアクセスが制限された状況において重要な診断上の課題を呈する。
WCE(Wireless Capsule Endoscopy)は、GI領域を視覚化するための強力な診断ツールとして登場したが、経験豊富な消化器科医による手作業による分析を必要とする。これは、患者数の増加に伴い、ヒューマンエラーや非効率性が低いためである。この課題に対処するために、WCEビデオからの出血と非出血フレームの自動検出と分類を目的としたAIベースのフレームワークであるClassifyViStAを提案する。
本モデルは,2つの専門分野(暗黙の注意枝と分節枝)で強化された標準的な分類経路から成り,注意枝は出血部位に焦点を当て,分節枝は正確な分節マスクを生成し,分類と解釈性に使用される。
このモデルは、分類性能を高めるためにResNet18とVGG16アーキテクチャのアンサンブル上に構築されている。
出血領域検出のために, YOLOv8を用いたソフト非最大抑制 (Soft Non-Maximum Suppression (Soft NMS) アプローチを導入し, オーバーラップしたバウンディングボックスのハンドリングを改善し, より正確でニュアンスな検出を可能にした。
我々のアプローチは、GI出血の検出を自動化するだけでなく、医療従事者の負担を軽減し、診断効率を向上させるための解釈可能なソリューションも提供します。
私たちのコードはClassifyViStAで利用可能です。
関連論文リスト
- Divide and Conquer: Grounding a Bleeding Areas in Gastrointestinal Image with Two-Stage Model [7.1083241462091165]
本研究では,従来のマルチタスク学習モデルが生み出す課題に対処するために,分類と接地を分離する2段階の枠組みを提案する。
実験結果から,分類精度とセグメンテーション精度が有意に向上した。
論文 参考訳(メタデータ) (2024-12-21T18:18:12Z) - Agent Aggregator with Mask Denoise Mechanism for Histopathology Whole Slide Image Analysis [6.708196053187949]
病理組織学的解析は, 臨床診断における金の基準である。スライディング画像全体(WSI)と関心領域(ROI)の正確な分類は, 病理医の診断に有効である。
弱教師付き学習では、多重インスタンス学習(MIL)がWSI分類に有望なアプローチを示す。
マスク認知機構を有するエージェントアグリゲータであるAMD-MILを提案する。
論文 参考訳(メタデータ) (2024-09-18T03:02:19Z) - Multi-task Explainable Skin Lesion Classification [54.76511683427566]
少ないラベル付きデータでよく一般化する皮膚病変に対する数発のショットベースアプローチを提案する。
提案手法は,アテンションモジュールや分類ネットワークとして機能するセグメンテーションネットワークの融合を含む。
論文 参考訳(メタデータ) (2023-10-11T05:49:47Z) - Class Attention to Regions of Lesion for Imbalanced Medical Image
Recognition [59.28732531600606]
データ不均衡問題に対処するため,textbfClass textbfAttention to textbfRegions of the lesion (CARE)を提案する。
CAREフレームワークは、まれな疾患の病変領域を表すために、バウンディングボックスを必要とする。
その結果,自動バウンディングボックス生成によるCARE変種は,オリジナルのCAREフレームワークに匹敵することがわかった。
論文 参考訳(メタデータ) (2023-07-19T15:19:02Z) - Weakly Supervised Intracranial Hemorrhage Segmentation using Head-Wise
Gradient-Infused Self-Attention Maps from a Swin Transformer in Categorical
Learning [0.6269243524465492]
頭蓋内出血(ICH、Intracranial hemorrhage)は、タイムリーな診断と正確な治療を必要とする救命救急疾患である。
深層学習技術は、医用画像解析と処理の先駆的なアプローチとして現れてきた。
ICH分類タスクで訓練されたSwin変換器と分類ラベルを併用した,新しいICHセグメンテーション手法を提案する。
論文 参考訳(メタデータ) (2023-04-11T00:17:34Z) - Interpretable Diabetic Retinopathy Diagnosis based on Biomarker
Activation Map [2.6170980960630037]
生成的対角学習に基づく新しいバイオマーカー活性化マップ(BAM)フレームワークを提案する。
456個の黄斑スキャンを含むデータセットを、現在の臨床基準に基づいて非参照型または参照型DRとして評価した。
生成したBAMは非灌流領域や網膜液を含む既知の病態の特徴を強調した。
論文 参考訳(メタデータ) (2022-12-13T00:45:46Z) - Fuzzy Attention Neural Network to Tackle Discontinuity in Airway
Segmentation [67.19443246236048]
気道セグメンテーションは肺疾患の検査、診断、予後に重要である。
いくつかの小型の気道支線(気管支や終端など)は自動セグメンテーションの難しさを著しく増す。
本稿では,新しいファジィアテンションニューラルネットワークと包括的損失関数を備える,気道セグメンテーションの効率的な手法を提案する。
論文 参考訳(メタデータ) (2022-09-05T16:38:13Z) - Preservation of High Frequency Content for Deep Learning-Based Medical
Image Classification [74.84221280249876]
大量の胸部ラジオグラフィーの効率的な分析は、医師や放射線技師を助けることができる。
本稿では,視覚情報の効率的な識別と符号化のための離散ウェーブレット変換(DWT)を提案する。
論文 参考訳(メタデータ) (2022-05-08T15:29:54Z) - A Teacher-Student Framework for Semi-supervised Medical Image
Segmentation From Mixed Supervision [62.4773770041279]
そこで我々は,臓器と病変のセグメンテーションのための教師と学生のスタイルに基づくセミ教師付き学習フレームワークを開発した。
我々は,本モデルがバウンディングボックスの品質に対して堅牢であることを示し,フル教師付き学習手法と比較した性能を実現する。
論文 参考訳(メタデータ) (2020-10-23T07:58:20Z) - Multi-Task Neural Networks with Spatial Activation for Retinal Vessel
Segmentation and Artery/Vein Classification [49.64863177155927]
本稿では,網膜血管,動脈,静脈を同時に分割する空間活性化機構を備えたマルチタスクディープニューラルネットワークを提案する。
提案するネットワークは,容器分割における画素ワイド精度95.70%,A/V分類精度94.50%を実現している。
論文 参考訳(メタデータ) (2020-07-18T05:46:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。