論文の概要: ClassifyViStA:WCE Classification with Visual understanding through Segmentation and Attention
- arxiv url: http://arxiv.org/abs/2412.18591v1
- Date: Tue, 24 Dec 2024 18:45:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-25 19:23:17.85487
- Title: ClassifyViStA:WCE Classification with Visual understanding through Segmentation and Attention
- Title(参考訳): セグメンテーションと注意による視覚的理解を用いたクラス化ViStA:WCE分類
- Authors: S. Balasubramanian, Ammu Abhishek, Yedu Krishna, Darshan Gera,
- Abstract要約: We propose ClassifyViStA, a AI-based framework designed for automated detection and classification of bleeding and non-bleeding frames from WCE video。
このモデルは、分類性能を高めるためにResNet18とVGG16アーキテクチャのアンサンブル上に構築されている。
我々のアプローチは、GI出血の検出を自動化するだけでなく、医療専門家の負担を軽減するための解釈可能なソリューションも提供します。
- 参考スコア(独自算出の注目度): 3.887356044145916
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Gastrointestinal (GI) bleeding is a serious medical condition that presents significant diagnostic challenges, particularly in settings with limited access to healthcare resources. Wireless Capsule Endoscopy (WCE) has emerged as a powerful diagnostic tool for visualizing the GI tract, but it requires time-consuming manual analysis by experienced gastroenterologists, which is prone to human error and inefficient given the increasing number of patients.To address this challenge, we propose ClassifyViStA, an AI-based framework designed for the automated detection and classification of bleeding and non-bleeding frames from WCE videos. The model consists of a standard classification path, augmented by two specialized branches: an implicit attention branch and a segmentation branch.The attention branch focuses on the bleeding regions, while the segmentation branch generates accurate segmentation masks, which are used for classification and interpretability. The model is built upon an ensemble of ResNet18 and VGG16 architectures to enhance classification performance. For the bleeding region detection, we implement a Soft Non-Maximum Suppression (Soft NMS) approach with YOLOv8, which improves the handling of overlapping bounding boxes, resulting in more accurate and nuanced detections.The system's interpretability is enhanced by using the segmentation masks to explain the classification results, offering insights into the decision-making process similar to the way a gastroenterologist identifies bleeding regions. Our approach not only automates the detection of GI bleeding but also provides an interpretable solution that can ease the burden on healthcare professionals and improve diagnostic efficiency. Our code is available at ClassifyViStA.
- Abstract(参考訳): 消化器出血は重篤な疾患であり、特に医療資源へのアクセスが制限された状況において重要な診断上の課題を呈する。
WCE(Wireless Capsule Endoscopy)は、GI領域を視覚化するための強力な診断ツールとして登場したが、経験豊富な消化器科医による手作業による分析を必要とする。これは、患者数の増加に伴い、ヒューマンエラーや非効率性が低いためである。この課題に対処するために、WCEビデオからの出血と非出血フレームの自動検出と分類を目的としたAIベースのフレームワークであるClassifyViStAを提案する。
本モデルは,2つの専門分野(暗黙の注意枝と分節枝)で強化された標準的な分類経路から成り,注意枝は出血部位に焦点を当て,分節枝は正確な分節マスクを生成し,分類と解釈性に使用される。
このモデルは、分類性能を高めるためにResNet18とVGG16アーキテクチャのアンサンブル上に構築されている。
出血領域検出のために, YOLOv8を用いたソフト非最大抑制 (Soft Non-Maximum Suppression (Soft NMS) アプローチを導入し, オーバーラップしたバウンディングボックスのハンドリングを改善し, より正確でニュアンスな検出を可能にした。
我々のアプローチは、GI出血の検出を自動化するだけでなく、医療従事者の負担を軽減し、診断効率を向上させるための解釈可能なソリューションも提供します。
私たちのコードはClassifyViStAで利用可能です。
関連論文リスト
- GAFR-Net: A Graph Attention and Fuzzy-Rule Network for Interpretable Breast Cancer Image Classification [0.0]
病理画像分類のための頑健で解釈可能なグラフ注意とファジィルールネットワークであるGAFRNetを提案する。
GAFR-Netは、複数の倍率および分類タスクにおいて、様々な最先端手法を一貫して上回ることを示す。
これらの結果は,医用医用画像解析における信頼性の高い意思決定支援ツールとして,GAFR-Netの優れた一般化と実用性を検証した。
論文 参考訳(メタデータ) (2026-02-10T01:25:57Z) - Multi-View Stenosis Classification Leveraging Transformer-Based Multiple-Instance Learning Using Real-World Clinical Data [76.89269238957593]
冠動脈狭窄は心血管疾患の主要な原因であり,多発血管造影で冠動脈を解析し診断した。
患者レベルの狭窄分類のためのトランスフォーマーベースマルチビューマルチインスタンス学習フレームワークであるSegmentMILを提案する。
論文 参考訳(メタデータ) (2026-02-02T13:07:52Z) - Robust Multi-Disease Retinal Classification via Xception-Based Transfer Learning and W-Net Vessel Segmentation [0.0]
本稿では,眼疾患の自動診断のためのディープラーニングアーキテクチャに関する総合的研究について述べる。
深い特徴抽出と解釈可能な画像処理モジュールを組み合わせたパイプラインを実装した。
臨床形態学的特徴のモデル予測を基礎として,アルゴリズム出力と専門的医学的検証のギャップを埋めることを目的としている。
論文 参考訳(メタデータ) (2025-12-11T13:03:03Z) - Resource-efficient Automatic Refinement of Segmentations via Weak Supervision from Light Feedback [1.8082075562656847]
SCOREは、トレーニング中の光フィードバックのみを用いてマスク予測を洗練することを学ぶ弱教師付きフレームワークである。
上腕骨CTスキャンにおいてSCOREを実証し、初期予測を大幅に改善し、既存の精錬法と同等の性能を達成する。
論文 参考訳(メタデータ) (2025-11-04T13:53:10Z) - PathSegDiff: Pathology Segmentation using Diffusion model representations [63.20694440934692]
そこで我々は,Latent Diffusion Models (LDMs) を事前学習した特徴抽出器として活用する,病理組織像分割の新しい手法であるPathSegDiffを提案する。
本手法は,H&E染色組織像から多彩な意味情報を抽出するために,自己教師型エンコーダによって誘導される病理特異的LCMを用いる。
本実験は,BCSSおよびGlaSデータセットにおける従来の手法よりも大幅に改善されたことを示す。
論文 参考訳(メタデータ) (2025-04-09T14:58:21Z) - Divide and Conquer: Grounding a Bleeding Areas in Gastrointestinal Image with Two-Stage Model [7.1083241462091165]
本研究では,従来のマルチタスク学習モデルが生み出す課題に対処するために,分類と接地を分離する2段階の枠組みを提案する。
実験結果から,分類精度とセグメンテーション精度が有意に向上した。
論文 参考訳(メタデータ) (2024-12-21T18:18:12Z) - Agent Aggregator with Mask Denoise Mechanism for Histopathology Whole Slide Image Analysis [6.708196053187949]
病理組織学的解析は, 臨床診断における金の基準である。スライディング画像全体(WSI)と関心領域(ROI)の正確な分類は, 病理医の診断に有効である。
弱教師付き学習では、多重インスタンス学習(MIL)がWSI分類に有望なアプローチを示す。
マスク認知機構を有するエージェントアグリゲータであるAMD-MILを提案する。
論文 参考訳(メタデータ) (2024-09-18T03:02:19Z) - Semi- and Weakly-Supervised Learning for Mammogram Mass Segmentation with Limited Annotations [49.33388736227072]
本稿では,マスセグメンテーションのための半弱教師付き学習フレームワークを提案する。
良好な性能を得るために, 限られた強ラベルのサンプルと十分な弱ラベルのサンプルを用いる。
CBIS-DDSMおよびINbreastデータセットを用いた実験により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2024-03-14T12:05:25Z) - Multi-task Explainable Skin Lesion Classification [54.76511683427566]
少ないラベル付きデータでよく一般化する皮膚病変に対する数発のショットベースアプローチを提案する。
提案手法は,アテンションモジュールや分類ネットワークとして機能するセグメンテーションネットワークの融合を含む。
論文 参考訳(メタデータ) (2023-10-11T05:49:47Z) - Class Attention to Regions of Lesion for Imbalanced Medical Image
Recognition [59.28732531600606]
データ不均衡問題に対処するため,textbfClass textbfAttention to textbfRegions of the lesion (CARE)を提案する。
CAREフレームワークは、まれな疾患の病変領域を表すために、バウンディングボックスを必要とする。
その結果,自動バウンディングボックス生成によるCARE変種は,オリジナルのCAREフレームワークに匹敵することがわかった。
論文 参考訳(メタデータ) (2023-07-19T15:19:02Z) - Weakly Supervised Intracranial Hemorrhage Segmentation using Head-Wise
Gradient-Infused Self-Attention Maps from a Swin Transformer in Categorical
Learning [0.6269243524465492]
頭蓋内出血(ICH、Intracranial hemorrhage)は、タイムリーな診断と正確な治療を必要とする救命救急疾患である。
深層学習技術は、医用画像解析と処理の先駆的なアプローチとして現れてきた。
ICH分類タスクで訓練されたSwin変換器と分類ラベルを併用した,新しいICHセグメンテーション手法を提案する。
論文 参考訳(メタデータ) (2023-04-11T00:17:34Z) - Interpretable Diabetic Retinopathy Diagnosis based on Biomarker
Activation Map [2.6170980960630037]
生成的対角学習に基づく新しいバイオマーカー活性化マップ(BAM)フレームワークを提案する。
456個の黄斑スキャンを含むデータセットを、現在の臨床基準に基づいて非参照型または参照型DRとして評価した。
生成したBAMは非灌流領域や網膜液を含む既知の病態の特徴を強調した。
論文 参考訳(メタデータ) (2022-12-13T00:45:46Z) - Fuzzy Attention Neural Network to Tackle Discontinuity in Airway
Segmentation [67.19443246236048]
気道セグメンテーションは肺疾患の検査、診断、予後に重要である。
いくつかの小型の気道支線(気管支や終端など)は自動セグメンテーションの難しさを著しく増す。
本稿では,新しいファジィアテンションニューラルネットワークと包括的損失関数を備える,気道セグメンテーションの効率的な手法を提案する。
論文 参考訳(メタデータ) (2022-09-05T16:38:13Z) - Preservation of High Frequency Content for Deep Learning-Based Medical
Image Classification [74.84221280249876]
大量の胸部ラジオグラフィーの効率的な分析は、医師や放射線技師を助けることができる。
本稿では,視覚情報の効率的な識別と符号化のための離散ウェーブレット変換(DWT)を提案する。
論文 参考訳(メタデータ) (2022-05-08T15:29:54Z) - Multi-Task Neural Networks with Spatial Activation for Retinal Vessel
Segmentation and Artery/Vein Classification [49.64863177155927]
本稿では,網膜血管,動脈,静脈を同時に分割する空間活性化機構を備えたマルチタスクディープニューラルネットワークを提案する。
提案するネットワークは,容器分割における画素ワイド精度95.70%,A/V分類精度94.50%を実現している。
論文 参考訳(メタデータ) (2020-07-18T05:46:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。