論文の概要: Capsule Endoscopy Multi-classification via Gated Attention and Wavelet Transformations
- arxiv url: http://arxiv.org/abs/2410.19363v2
- Date: Mon, 23 Dec 2024 04:32:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-24 15:53:23.425379
- Title: Capsule Endoscopy Multi-classification via Gated Attention and Wavelet Transformations
- Title(参考訳): ゲート型アテンションとウェーブレット変換によるカプセル内視鏡多重分類
- Authors: Lakshmi Srinivas Panchananam, Praveen Kumar Chandaliya, Kishor Upla, Kiran Raja,
- Abstract要約: 消化管の異常は患者の健康に大きく影響を与え、タイムリーな診断が必要である。
この研究は、ビデオフレームから消化管の異常を分類するために設計された新しいモデルの開発と評価のプロセスを示す。
Omni次元のGated Attention(OGA)機構とWavelet変換技術をモデルアーキテクチャに統合することで、モデルは最も重要な領域に集中することができた。
このモデルの性能は、VGG16とResNet50の2つのベースモデルに対してベンチマークされ、胃腸の異常範囲を正確に識別し分類する能力の強化が示されている。
- 参考スコア(独自算出の注目度): 1.5146068448101746
- License:
- Abstract: Abnormalities in the gastrointestinal tract significantly influence the patient's health and require a timely diagnosis for effective treatment. With such consideration, an effective automatic classification of these abnormalities from a video capsule endoscopy (VCE) frame is crucial for improvement in diagnostic workflows. The work presents the process of developing and evaluating a novel model designed to classify gastrointestinal anomalies from a VCE video frame. Integration of Omni Dimensional Gated Attention (OGA) mechanism and Wavelet transformation techniques into the model's architecture allowed the model to focus on the most critical areas in the endoscopy images, reducing noise and irrelevant features. This is particularly advantageous in capsule endoscopy, where images often contain a high degree of variability in texture and color. Wavelet transformations contributed by efficiently capturing spatial and frequency-domain information, improving feature extraction, especially for detecting subtle features from the VCE frames. Furthermore, the features extracted from the Stationary Wavelet Transform and Discrete Wavelet Transform are concatenated channel-wise to capture multiscale features, which are essential for detecting polyps, ulcerations, and bleeding. This approach improves classification accuracy on imbalanced capsule endoscopy datasets. The proposed model achieved 92.76% and 91.19% as training and validation accuracies respectively. At the same time, Training and Validation losses are 0.2057 and 0.2700. The proposed model achieved a Balanced Accuracy of 94.81%, AUC of 87.49%, F1-score of 91.11%, precision of 91.17%, recall of 91.19% and specificity of 98.44%. Additionally, the model's performance is benchmarked against two base models, VGG16 and ResNet50, demonstrating its enhanced ability to identify and classify a range of gastrointestinal abnormalities accurately.
- Abstract(参考訳): 消化管の異常は患者の健康に大きく影響し,有効治療にはタイムリーな診断が必要である。
このような観点から,ビデオカプセル内視鏡(VCE)フレームからこれらの異常を効果的に自動分類することが診断ワークフローの改善に不可欠である。
この研究は、VCEビデオフレームから消化管の異常を分類するために設計された新しいモデルの開発と評価のプロセスを示す。
オムニ次元 Gated Attention (OGA) 機構とウェーブレット変換技術をモデルアーキテクチャに統合することで、モデルは内視鏡画像における最も重要な領域に集中することができ、ノイズや無関係な特徴を減らすことができた。
これはカプセル内視鏡において特に有利であり、画像はテクスチャや色の多様性が高い。
ウェーブレット変換は、空間および周波数領域情報を効率的に取得し、特にVCEフレームからの微妙な特徴を検出するために特徴抽出を改善した。
さらに、静止ウェーブレット変換および離散ウェーブレット変換から抽出された特徴をチャネル的に連結し、ポリープ、潰瘍、出血を検出するのに必須のマルチスケール特徴を捕捉する。
このアプローチにより、不均衡カプセル内視鏡データセットの分類精度が向上する。
提案されたモデルは、それぞれ92.76%と91.19%をトレーニングと検証の精度で達成した。
同時に、訓練と検証の損失は 0.2057 と 0.2700 である。
提案されたモデルは平衡精度94.81%、AUC87.49%、F1スコア91.11%、精度91.17%、リコール91.19%、特異度98.44%を達成した。
さらに、モデルの性能はVGG16とResNet50の2つのベースモデルに対してベンチマークされ、胃腸の異常範囲を正確に識別し分類する能力の強化が示されている。
関連論文リスト
- Integrating Deep Feature Extraction and Hybrid ResNet-DenseNet Model for Multi-Class Abnormality Detection in Endoscopic Images [0.9374652839580183]
本研究の目的は、血管拡張症、出血、潰瘍を含む10種類のGI異常分類の同定を自動化することである。
提案したモデルは、よく構造化されたデータセットで全体の94%の精度を達成する。
論文 参考訳(メタデータ) (2024-10-24T06:10:31Z) - Controllable retinal image synthesis using conditional StyleGAN and latent space manipulation for improved diagnosis and grading of diabetic retinopathy [0.0]
本稿では,高忠実かつ多様なDRファウンダス画像を生成するためのフレームワークを提案する。
生成画像内のDR重大度と視覚的特徴を包括的に制御する。
我々は、条件付きで生成したDR画像をグレードで操作し、データセットの多様性をさらに向上する。
論文 参考訳(メタデータ) (2024-09-11T17:08:28Z) - Deep Generative Classification of Blood Cell Morphology [7.494975467007647]
細胞形態を効果的にモデル化する拡散型分類器であるCytoDiffusionを紹介する。
本手法は異常検出における最先端の識別モデルよりも優れている。
直接解釈可能な逆ファクト・ヒートマップの生成によりモデル説明可能性を向上させる。
論文 参考訳(メタデータ) (2024-08-16T19:17:02Z) - Efficient Data-Sketches and Fine-Tuning for Early Detection of Distributional Drift in Medical Imaging [5.1358645354733765]
本稿では,CT-Scan医療画像における分布のドリフトを検出するための,高精度かつ高感度なアプローチを提案する。
我々は,リアルタイムな異常検出のための頑健なライブラリモデルを開発し,画像の効率的な比較を可能にした。
乳がん画像から関連する特徴を抽出するために,視力変換器の事前訓練モデルを微調整した。
論文 参考訳(メタデータ) (2024-08-15T23:46:37Z) - Enhancing Diagnostic Reliability of Foundation Model with Uncertainty Estimation in OCT Images [41.002573031087856]
光コヒーレンストモグラフィー(OCT)における11個の網膜状態を検出するために,不確実性推定(FMUE)を用いた基礎モデルを開発した。
FMUEは2つの最先端アルゴリズムであるRETFoundとUIOSよりも96.76%高いF1スコアを獲得し、しきい値戦略を98.44%に改善した。
我々のモデルは、F1スコアが高い2人の眼科医(95.17%対61.93% &71.72%)より優れている。
論文 参考訳(メタデータ) (2024-06-18T03:04:52Z) - Detection of Peri-Pancreatic Edema using Deep Learning and Radiomics Techniques [3.6663216419047964]
本研究は,膵疾患255例から得られた新しいCTデータセットをテクスタイピングし,アノテート膵セグメンテーションマスクとそれに対応する膵周囲浮腫の診断ラベルを特徴とする。
我々はまず,リニアトランスフォーマーに基づくセグメント化アルゴリズムであるtextitLinTransUNet モデルの有効性を評価し,CT画像データから膵臓を正確に分割する。
次に,2つの独特の機械学習分類器を持つ分節膵領域を用いて,深部膵浮腫の存在を同定する:深部膵浮腫モデルと放射線治療ベースのeXtreme Gradient Boosting (XGBoost)。
論文 参考訳(メタデータ) (2024-04-25T22:20:17Z) - Adapting Visual-Language Models for Generalizable Anomaly Detection in Medical Images [68.42215385041114]
本稿では,CLIPモデルを用いた医用異常検出のための軽量な多レベル適応と比較フレームワークを提案する。
提案手法では,複数の残像アダプタを事前学習した視覚エンコーダに統合し,視覚的特徴の段階的向上を実現する。
医学的異常検出ベンチマーク実験により,本手法が現在の最先端モデルを大幅に上回っていることが示された。
論文 参考訳(メタデータ) (2024-03-19T09:28:19Z) - Texture Characterization of Histopathologic Images Using Ecological
Diversity Measures and Discrete Wavelet Transform [82.53597363161228]
本稿では,病理組織像間でテクスチャを特徴付ける手法を提案する。
2つのHIデータセットに有望な精度で、そのような画像の固有特性を定量化することが可能である。
論文 参考訳(メタデータ) (2022-02-27T02:19:09Z) - A multicenter study on radiomic features from T$_2$-weighted images of a
customized MR pelvic phantom setting the basis for robust radiomic models in
clinics [47.187609203210705]
骨盤ファントムの2Dおよび3D T$$-weightedイメージを3つのスキャナーで取得した。
放射線学的特徴の再現性と再配置を評価した。
論文 参考訳(メタデータ) (2020-05-14T09:24:48Z) - Adaptive Feature Selection Guided Deep Forest for COVID-19
Classification with Chest CT [49.09507792800059]
胸部CT画像に基づくCOVID-19分類のための適応的特徴選択ガイド付き深層林(AFS-DF)を提案する。
AFS-DF on COVID-19 data with 1495 patients of COVID-19 and 1027 patients of community acquired pneumonia (CAP)。
論文 参考訳(メタデータ) (2020-05-07T06:00:02Z) - Residual Attention U-Net for Automated Multi-Class Segmentation of
COVID-19 Chest CT Images [46.844349956057776]
新型コロナウイルス感染症(COVID-19)は世界中で急速に広がり、公衆衛生や経済に大きな影響を及ぼしている。
新型コロナウイルスによる肺感染症を効果的に定量化する研究はいまだにない。
複数の新型コロナウイルス感染症領域の自動セグメンテーションのための新しいディープラーニングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-04-12T16:24:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。