論文の概要: Multi-Class Abnormality Classification in Video Capsule Endoscopy Using Deep Learning
- arxiv url: http://arxiv.org/abs/2410.18879v2
- Date: Sun, 01 Dec 2024 11:58:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-03 20:22:39.892427
- Title: Multi-Class Abnormality Classification in Video Capsule Endoscopy Using Deep Learning
- Title(参考訳): 深層学習を用いたビデオカプセル内視鏡のマルチクラス異常分類
- Authors: Arnav Samal, Ranya Batsyas,
- Abstract要約: このレポートでは、Capsule Vision 2024 Challengeに対するTeam Seq2Cureのディープラーニングアプローチの概要を概説する。
コンボリューションニューラルネットワーク(CNN)とトランスフォーマーベースアーキテクチャのアンサンブルを利用して,ビデオカプセル内視鏡フレームの多クラス異常分類を行う。
提案手法は精度86.34パーセント,AUC-ROC平均スコア0.9908を検証セットで達成した。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: This report outlines Team Seq2Cure's deep learning approach for the Capsule Vision 2024 Challenge, leveraging an ensemble of convolutional neural networks (CNNs) and transformer-based architectures for multi-class abnormality classification in video capsule endoscopy frames. The dataset comprised over 50,000 frames from three public sources and one private dataset, labeled across 10 abnormality classes. To overcome the limitations of traditional CNNs in capturing global context, we integrated CNN and transformer models within a multi-model ensemble. Our approach achieved a balanced accuracy of 86.34 percent and a mean AUC-ROC score of 0.9908 on the validation set, earning our submission 5th place in the challenge. Code is available at http://github.com/arnavs04/capsule-vision-2024 .
- Abstract(参考訳): 本稿では、ビデオカプセル内視鏡フレームにおけるマルチクラス異常分類に畳み込みニューラルネットワーク(CNN)とトランスフォーマーベースのアーキテクチャのアンサンブルを活用する、Seq2CureのCapsule Vision 2024 Challengeに対するディープラーニングアプローチの概要を紹介する。
データセットは3つの公開ソースと1つのプライベートデータセットから5万フレーム以上で構成され、10の異常クラスにラベル付けされている。
グローバルコンテキストのキャプチャにおける従来のCNNの制限を克服するため、CNNとトランスフォーマーモデルをマルチモデルアンサンブルに統合した。
提案手法は精度86.34パーセント,AUC-ROC平均スコア0.9908を検証セットで達成した。
コードはhttp://github.com/arnavs04/capsule-vision-2024で入手できる。
関連論文リスト
- Capsule Vision Challenge 2024: Multi-Class Abnormality Classification for Video Capsule Endoscopy [1.124958340749622]
本稿では,ビデオカプセル内視鏡(VCE)フレームにおける異常の分類モデルを提案する。
マイノリティクラス表現を強化するために,ロジテーションライブラリを用いた階層拡張戦略を実装した。
私たちのパイプラインはPyTorchで開発され、柔軟性のあるアーキテクチャを使って、分類の複雑さをシームレスに調整します。
論文 参考訳(メタデータ) (2024-11-03T08:34:04Z) - Multi-Class Abnormality Classification Task in Video Capsule Endoscopy [3.656114607436271]
本研究は,ビデオカプセル内視鏡(VCE)における多クラス異常分類の課題に対処するものである。
本研究の目的は,さまざまな消化管疾患を正しく分類することであり,臨床現場での診断効率の向上に重要である。
チームカプセルコマンドは,平均AUCが0.7314,精度が0.3235で7位にランクインした。
論文 参考訳(メタデータ) (2024-10-25T21:22:52Z) - Severity classification of ground-glass opacity via 2-D convolutional
neural network and lung CT scans: a 3-day exploration [0.0]
グラウンドグラスの不透明度は、COVID-19や肺炎、肺線維症、結核など、多くの肺疾患の指標である。
本稿では,3日間にわたって実施,テストされた概念実証フレームワークについて,第3の課題である「COVID-19コンペティション」による実験的結果を示す。
課題の要件の一部として、このエクササイズ中に生成されたソースコードはhttps://github.com/lisatwyw/cov19.comに投稿されている。
論文 参考訳(メタデータ) (2023-03-23T22:35:37Z) - UniFormer: Unifying Convolution and Self-attention for Visual
Recognition [69.68907941116127]
畳み込みニューラルネットワーク(CNN)とビジョントランスフォーマー(ViT)は、ここ数年で主要なフレームワークである。
コンボリューションと自己注意の利点を簡潔なトランスフォーマー形式にシームレスに統合する新しいUnified TransFormer(UniFormer)を提案する。
我々のUniFormerはImageNet-1K分類において86.3トップ1の精度を実現している。
論文 参考訳(メタデータ) (2022-01-24T04:39:39Z) - Multiclass Anomaly Detection in GI Endoscopic Images using Optimized
Deep One-class Classification in an Imbalanced Dataset [0.0]
ワイヤレスカプセル内視鏡は、医師が消化管を非侵襲的に検査するのに役立つ。
KID2やKvasirのような利用可能なデータセットの多くは、効果的な人工知能(AI)システムのトレーニングを難しくする不均衡な問題に悩まされている。
本研究では,一類分類器のアンサンブルを用いて異常を検出する。
論文 参考訳(メタデータ) (2021-03-15T16:28:42Z) - PS-DeVCEM: Pathology-sensitive deep learning model for video capsule
endoscopy based on weakly labeled data [0.0]
本稿では, ビデオカプセル内視鏡(VCE)データを用いて, フレームレベルの異常検出と大腸疾患の多ラベル分類を行うための, 病因性深層学習モデル(PS-DeVCEM)を提案する。
我々のモデルは注目に基づく深層マルチインスタンス学習によって駆動され、弱いラベル付きデータでエンドツーエンドに訓練されている。
トレーニング中にフレームアノテーション情報を使わずに、時間的にフレームを病状でローカライズする能力を示す。
論文 参考訳(メタデータ) (2020-11-22T15:33:37Z) - A Two-Stage Approach to Device-Robust Acoustic Scene Classification [63.98724740606457]
デバイスロバスト性を改善するために,完全畳み込みニューラルネットワーク(CNN)に基づく2段階システムを提案する。
以上の結果から,提案したASCシステムにより,開発環境における最先端の精度が得られた。
クラスアクティベーションマッピングを用いたニューラルサリエンシ解析により、モデルによって学習されたパターンに関する新たな洞察が得られる。
論文 参考訳(メタデータ) (2020-11-03T03:27:18Z) - Classification of COVID-19 in CT Scans using Multi-Source Transfer
Learning [91.3755431537592]
我々は,従来のトランスファー学習の改良にマルチソース・トランスファー・ラーニングを応用して,CTスキャンによる新型コロナウイルスの分類を提案する。
マルチソースファインチューニングアプローチでは、ImageNetで微調整されたベースラインモデルよりも優れています。
我々の最高のパフォーマンスモデルは、0.893の精度と0.897のリコールスコアを達成でき、ベースラインのリコールスコアを9.3%上回った。
論文 参考訳(メタデータ) (2020-09-22T11:53:06Z) - Automatic sleep stage classification with deep residual networks in a
mixed-cohort setting [63.52264764099532]
我々は,大規模コホートの一般化性を評価するために,新しいディープニューラルネットワークモデルを開発した。
総合的な分類精度はトレーニングデータの分数を増やして向上した。
論文 参考訳(メタデータ) (2020-08-21T10:48:35Z) - Device-Robust Acoustic Scene Classification Based on Two-Stage
Categorization and Data Augmentation [63.98724740606457]
我々は,GT,USTC,Tencent,UKEの4つのグループからなる共同で,DCASE 2020 Challengeの第1タスク - 音響シーン分類(ASC)に取り組む。
タスク1aは、複数の(実とシミュレートされた)デバイスで記録されたオーディオ信号のASCを10種類の微細なクラスにフォーカスする。
Task 1bは、低複雑さのソリューションを使用して、データを3つの上位クラスに分類することに関心がある。
論文 参考訳(メタデータ) (2020-07-16T15:07:14Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。