Fugu-MT 論文翻訳(概要): Capsule Endoscopy Multi-classification via Gated Attention and Wavelet Transformations

論文の概要: Capsule Endoscopy Multi-classification via Gated Attention and Wavelet Transformations

arxiv url: http://arxiv.org/abs/2410.19363v2
Date: Mon, 23 Dec 2024 04:32:45 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-24 17:32:08.646343
Title: Capsule Endoscopy Multi-classification via Gated Attention and Wavelet Transformations
Title（参考訳）: ゲート型アテンションとウェーブレット変換によるカプセル内視鏡多重分類
Authors: Lakshmi Srinivas Panchananam, Praveen Kumar Chandaliya, Kishor Upla, Kiran Raja,
Abstract要約: 消化管の異常は患者の健康に大きく影響を与え、タイムリーな診断が必要である。この研究は、ビデオフレームから消化管の異常を分類するために設計された新しいモデルの開発と評価のプロセスを示す。 Omni次元のGated Attention(OGA)機構とWavelet変換技術をモデルアーキテクチャに統合することで、モデルは最も重要な領域に集中することができた。このモデルの性能は、VGG16とResNet50の2つのベースモデルに対してベンチマークされ、胃腸の異常範囲を正確に識別し分類する能力の強化が示されている。
参考スコア（独自算出の注目度）: 1.5146068448101746
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Abnormalities in the gastrointestinal tract significantly influence the patient's health and require a timely diagnosis for effective treatment. With such consideration, an effective automatic classification of these abnormalities from a video capsule endoscopy (VCE) frame is crucial for improvement in diagnostic workflows. The work presents the process of developing and evaluating a novel model designed to classify gastrointestinal anomalies from a VCE video frame. Integration of Omni Dimensional Gated Attention (OGA) mechanism and Wavelet transformation techniques into the model's architecture allowed the model to focus on the most critical areas in the endoscopy images, reducing noise and irrelevant features. This is particularly advantageous in capsule endoscopy, where images often contain a high degree of variability in texture and color. Wavelet transformations contributed by efficiently capturing spatial and frequency-domain information, improving feature extraction, especially for detecting subtle features from the VCE frames. Furthermore, the features extracted from the Stationary Wavelet Transform and Discrete Wavelet Transform are concatenated channel-wise to capture multiscale features, which are essential for detecting polyps, ulcerations, and bleeding. This approach improves classification accuracy on imbalanced capsule endoscopy datasets. The proposed model achieved 92.76% and 91.19% as training and validation accuracies respectively. At the same time, Training and Validation losses are 0.2057 and 0.2700. The proposed model achieved a Balanced Accuracy of 94.81%, AUC of 87.49%, F1-score of 91.11%, precision of 91.17%, recall of 91.19% and specificity of 98.44%. Additionally, the model's performance is benchmarked against two base models, VGG16 and ResNet50, demonstrating its enhanced ability to identify and classify a range of gastrointestinal abnormalities accurately.
Abstract（参考訳）: 消化管の異常は患者の健康に大きく影響し,有効治療にはタイムリーな診断が必要である。このような観点から,ビデオカプセル内視鏡(VCE)フレームからこれらの異常を効果的に自動分類することが診断ワークフローの改善に不可欠である。この研究は、VCEビデオフレームから消化管の異常を分類するために設計された新しいモデルの開発と評価のプロセスを示す。オムニ次元 Gated Attention (OGA) 機構とウェーブレット変換技術をモデルアーキテクチャに統合することで、モデルは内視鏡画像における最も重要な領域に集中することができ、ノイズや無関係な特徴を減らすことができた。これはカプセル内視鏡において特に有利であり、画像はテクスチャや色の多様性が高い。ウェーブレット変換は、空間および周波数領域情報を効率的に取得し、特にVCEフレームからの微妙な特徴を検出するために特徴抽出を改善した。さらに、静止ウェーブレット変換および離散ウェーブレット変換から抽出された特徴をチャネル的に連結し、ポリープ、潰瘍、出血を検出するのに必須のマルチスケール特徴を捕捉する。このアプローチにより、不均衡カプセル内視鏡データセットの分類精度が向上する。提案されたモデルは、それぞれ92.76%と91.19%をトレーニングと検証の精度で達成した。同時に、訓練と検証の損失は 0.2057 と 0.2700 である。提案されたモデルは平衡精度94.81%、AUC87.49%、F1スコア91.11%、精度91.17%、リコール91.19%、特異度98.44%を達成した。さらに、モデルの性能はVGG16とResNet50の2つのベースモデルに対してベンチマークされ、胃腸の異常範囲を正確に識別し分類する能力の強化が示されている。

関連論文リスト

Detection-Gated Glottal Segmentation with Zero-Shot Cross-Dataset Transfer and Clinical Feature Extraction [0.0]
YOLOv8ベースの検出器とU-Netセグメンタを統合した検出ゲートパイプラインを提案する。モデルは、GIRAFEデータセット(600フレーム)の限られたサブセットに基づいてトレーニングされ、大規模なBAGLSデータセット上でゼロショット転送によって評価された。
論文参考訳（メタデータ） (2026-03-02T17:05:41Z)
Validating Vision Transformers for Otoscopy: Performance and Data-Leakage Effects [42.465094107111646]
本研究では、耳疾患の診断精度を高めるために、視覚トランスモデル、特にスウィントランスモデルの有効性を評価する。この研究はチリ大学臨床病院の耳鼻咽喉科の実際のデータセットを利用した。
論文参考訳（メタデータ） (2025-11-06T23:20:37Z)
An Automatic Detection Method for Hematoma Features in Placental Abruption Ultrasound Images Based on Few-Shot Learning [11.678844582870523]
胎盤破裂は妊娠中の重篤な合併症であり,早期診断は母体・胎児の安全確保に不可欠である。本稿では,小サンプル学習に基づく改良型EH-YOLOv11nを提案する。実験の結果、検出精度は78%で、YOLOv11nよりも2.5%、YOLOv8より13.7%向上した。
論文参考訳（メタデータ） (2025-10-24T14:20:34Z)
GastroViT: A Vision Transformer Based Ensemble Learning Approach for Gastrointestinal Disease Classification with Grad CAM & SHAP Visualization [6.752543644823974]
本稿では,GIトラクターの内視鏡像を正確に分類するために,事前訓練された視覚変換器(ViT)のアンサンブルを提案する。注目に基づくニューラルネットワークであるViTは、トランスフォーマーアーキテクチャの変換パワーを活用することで、画像認識に革命をもたらした。提案モデルは,23種類のGI疾患の画像10,662枚を用いて,公開されているHyperKvasirデータセットを用いて評価した。
論文参考訳（メタデータ） (2025-09-30T16:44:41Z)
DCAT: Dual Cross-Attention Fusion for Disease Classification in Radiological Images with Uncertainty Estimation [0.0]
本稿では,医用画像解析のための新しい二重対向核融合モデルを提案する。機能統合と解釈可能性における重要な課題に対処する。提案されたモデルはAUCの99.75%、100%、99.93%、98.69%、AUPRの99.81%、100%、99.97%、96.36%をそれぞれコビッド19、結核、肺炎胸部X線画像、網膜CT画像で達成した。
論文参考訳（メタデータ） (2025-03-14T20:28:20Z)
Enhanced Multi-Class Classification of Gastrointestinal Endoscopic Images with Interpretable Deep Learning Model [0.7349657385817541]
本研究は,Kvasirデータセットから8000個のラベル付き内視鏡画像を用いて分類精度を向上させる新しい手法を提案する。提案したアーキテクチャは、適度なモデルの複雑さを保ちながら、データ拡張への依存をなくす。テスト精度は94.25%、精度は94.29%、リコールは94.24%である。
論文参考訳（メタデータ） (2025-03-02T08:07:50Z)
Integrating Deep Feature Extraction and Hybrid ResNet-DenseNet Model for Multi-Class Abnormality Detection in Endoscopic Images [0.9374652839580183]
本研究の目的は、血管拡張症、出血、潰瘍を含む10種類のGI異常分類の同定を自動化することである。提案したモデルは、よく構造化されたデータセットで全体の94%の精度を達成する。
論文参考訳（メタデータ） (2024-10-24T06:10:31Z)
Controllable retinal image synthesis using conditional StyleGAN and latent space manipulation for improved diagnosis and grading of diabetic retinopathy [0.0]
本稿では,高忠実かつ多様なDRファウンダス画像を生成するためのフレームワークを提案する。生成画像内のDR重大度と視覚的特徴を包括的に制御する。我々は、条件付きで生成したDR画像をグレードで操作し、データセットの多様性をさらに向上する。
論文参考訳（メタデータ） (2024-09-11T17:08:28Z)
Deep Generative Classification of Blood Cell Morphology [7.494975467007647]
細胞形態を効果的にモデル化する拡散型分類器であるCytoDiffusionを紹介する。本手法は異常検出における最先端の識別モデルよりも優れている。直接解釈可能な逆ファクト・ヒートマップの生成によりモデル説明可能性を向上させる。
論文参考訳（メタデータ） (2024-08-16T19:17:02Z)
Efficient Data-Sketches and Fine-Tuning for Early Detection of Distributional Drift in Medical Imaging [5.1358645354733765]
本稿では,CT-Scan医療画像における分布のドリフトを検出するための,高精度かつ高感度なアプローチを提案する。我々は,リアルタイムな異常検出のための頑健なライブラリモデルを開発し,画像の効率的な比較を可能にした。乳がん画像から関連する特徴を抽出するために,視力変換器の事前訓練モデルを微調整した。
論文参考訳（メタデータ） (2024-08-15T23:46:37Z)
Enhancing Diagnostic Reliability of Foundation Model with Uncertainty Estimation in OCT Images [41.002573031087856]
光コヒーレンストモグラフィー(OCT)における11個の網膜状態を検出するために,不確実性推定(FMUE)を用いた基礎モデルを開発した。 FMUEは2つの最先端アルゴリズムであるRETFoundとUIOSよりも96.76%高いF1スコアを獲得し、しきい値戦略を98.44%に改善した。我々のモデルは、F1スコアが高い2人の眼科医(95.17%対61.93% &71.72%)より優れている。
論文参考訳（メタデータ） (2024-06-18T03:04:52Z)
Evolution-aware VAriance (EVA) Coreset Selection for Medical Image Classification [37.57407966808067]
進化対応可変(EVA)と呼ばれる新しいコアセット選択戦略を提案する。 EVAは10%のトレーニングデータで98.27%の精度を達成しているが、完全なトレーニングセットでは97.20%である。
論文参考訳（メタデータ） (2024-06-09T07:22:50Z)
Detection of Peri-Pancreatic Edema using Deep Learning and Radiomics Techniques [3.6663216419047964]
本研究は,膵疾患255例から得られた新しいCTデータセットをテクスタイピングし,アノテート膵セグメンテーションマスクとそれに対応する膵周囲浮腫の診断ラベルを特徴とする。我々はまず,リニアトランスフォーマーに基づくセグメント化アルゴリズムであるtextitLinTransUNet モデルの有効性を評価し,CT画像データから膵臓を正確に分割する。次に,2つの独特の機械学習分類器を持つ分節膵領域を用いて,深部膵浮腫の存在を同定する:深部膵浮腫モデルと放射線治療ベースのeXtreme Gradient Boosting (XGBoost)。
論文参考訳（メタデータ） (2024-04-25T22:20:17Z)
Interpretable cancer cell detection with phonon microscopy using multi-task conditional neural networks for inter-batch calibration [39.759100498329275]
本稿では,バッチ間キャリブレーションを同時に実現する条件付きニューラルネットワークフレームワークを提案する。異なる実験バッチをトレーニングし、検証することで、我々のアプローチを検証する。このモデルを拡張して, 診断信号の再構成を行い, 疾患状態を示す有能な特徴の物理的解釈を可能にした。
論文参考訳（メタデータ） (2024-03-26T12:20:10Z)
Adapting Visual-Language Models for Generalizable Anomaly Detection in Medical Images [68.42215385041114]
本稿では,CLIPモデルを用いた医用異常検出のための軽量な多レベル適応と比較フレームワークを提案する。提案手法では,複数の残像アダプタを事前学習した視覚エンコーダに統合し,視覚的特徴の段階的向上を実現する。医学的異常検出ベンチマーク実験により,本手法が現在の最先端モデルを大幅に上回っていることが示された。
論文参考訳（メタデータ） (2024-03-19T09:28:19Z)
Liver Tumor Screening and Diagnosis in CT with Pixel-Lesion-Patient Network [37.931408083443074]
Pixel-Lesion-pAtient Network (PLAN) は, アンカークエリの改善と前景のサンプリング損失による各病変の分割と分類を行う。 PLANは95%と96%の患者レベルの感度と特異性を達成している。造影CTでは, 病変レベルの検出精度, リコール, 分類精度は92%, 89%, 86%であり, CNNやトランスフォーマーよりも優れていた。
論文参考訳（メタデータ） (2023-07-17T06:21:45Z)
Texture Characterization of Histopathologic Images Using Ecological Diversity Measures and Discrete Wavelet Transform [82.53597363161228]
本稿では,病理組織像間でテクスチャを特徴付ける手法を提案する。 2つのHIデータセットに有望な精度で、そのような画像の固有特性を定量化することが可能である。
論文参考訳（メタデータ） (2022-02-27T02:19:09Z)
A multicenter study on radiomic features from T$_2$-weighted images of a customized MR pelvic phantom setting the basis for robust radiomic models in clinics [47.187609203210705]
骨盤ファントムの2Dおよび3D T$$-weightedイメージを3つのスキャナーで取得した。放射線学的特徴の再現性と再配置を評価した。
論文参考訳（メタデータ） (2020-05-14T09:24:48Z)
Adaptive Feature Selection Guided Deep Forest for COVID-19 Classification with Chest CT [49.09507792800059]
胸部CT画像に基づくCOVID-19分類のための適応的特徴選択ガイド付き深層林(AFS-DF)を提案する。 AFS-DF on COVID-19 data with 1495 patients of COVID-19 and 1027 patients of community acquired pneumonia (CAP)。
論文参考訳（メタデータ） (2020-05-07T06:00:02Z)
Residual Attention U-Net for Automated Multi-Class Segmentation of COVID-19 Chest CT Images [46.844349956057776]
新型コロナウイルス感染症(COVID-19)は世界中で急速に広がり、公衆衛生や経済に大きな影響を及ぼしている。新型コロナウイルスによる肺感染症を効果的に定量化する研究はいまだにない。複数の新型コロナウイルス感染症領域の自動セグメンテーションのための新しいディープラーニングアルゴリズムを提案する。
論文参考訳（メタデータ） (2020-04-12T16:24:59Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。