論文の概要: CASCRNet: An Atrous Spatial Pyramid Pooling and Shared Channel Residual based Network for Capsule Endoscopy
- arxiv url: http://arxiv.org/abs/2410.17863v1
- Date: Wed, 23 Oct 2024 13:35:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-24 13:56:29.508876
- Title: CASCRNet: An Atrous Spatial Pyramid Pooling and Shared Channel Residual based Network for Capsule Endoscopy
- Title(参考訳): CASCRNet:カプセル内視鏡のための空間ピラミッドポーリングとチャネル残差共有ネットワーク
- Authors: K V Srinanda, M Manvith Prabhu, Shyam Lal,
- Abstract要約: この写本は、MISAHUBによるカプセルビジョンチャレンジ2024に関する著作を要約している。
CASCRNet(Capsule endoscopy-Aspp-SCR-Network)を提案する。
提案されたモデルは、F1スコア78.5%、平均AUC98.3%で病気の分類に成功した。
- 参考スコア(独自算出の注目度): 2.1874189959020427
- License:
- Abstract: This manuscript summarizes work on the Capsule Vision Challenge 2024 by MISAHUB. To address the multi-class disease classification task, which is challenging due to the complexity and imbalance in the Capsule Vision challenge dataset, this paper proposes CASCRNet (Capsule endoscopy-Aspp-SCR-Network), a parameter-efficient and novel model that uses Shared Channel Residual (SCR) blocks and Atrous Spatial Pyramid Pooling (ASPP) blocks. Further, the performance of the proposed model is compared with other well-known approaches. The experimental results yield that proposed model provides better disease classification results. The proposed model was successful in classifying diseases with an F1 Score of 78.5% and a Mean AUC of 98.3%, which is promising given its compact architecture.
- Abstract(参考訳): この写本は、MISAHUBによるカプセルビジョンチャレンジ2024に関する著作を要約している。
本稿では,CASCRNet(Capsule endoscopy-Aspp-SCR-Network)とSCR(Shared Channel Residual)ブロックとASPP(Atrous Space Pyramid Pooling)ブロックを用いたパラメータ効率・斬新なモデルを提案する。
さらに,提案モデルの性能を他のよく知られた手法と比較した。
実験結果から, より優れた疾患分類結果が得られた。
提案されたモデルは病気の分類に成功し、F1スコアは78.5%、平均AUCは98.3%だった。
関連論文リスト
- Capsule Vision Challenge 2024: Multi-Class Abnormality Classification for Video Capsule Endoscopy [1.124958340749622]
本稿では,ビデオカプセル内視鏡(VCE)フレームにおける異常の分類モデルを提案する。
マイノリティクラス表現を強化するために,ロジテーションライブラリを用いた階層拡張戦略を実装した。
私たちのパイプラインはPyTorchで開発され、柔軟性のあるアーキテクチャを使って、分類の複雑さをシームレスに調整します。
論文 参考訳(メタデータ) (2024-11-03T08:34:04Z) - CapsuleNet: A Deep Learning Model To Classify GI Diseases Using EfficientNet-b7 [1.2499537119440245]
Capsule Vision 2024 Challengeのために開発された深層学習モデルであるCapsuleNetについて述べる。
我々のモデルは、事前訓練されたEfficientNet-b7バックボーンを活用し、分類のための追加レイヤを調整し、PRELUアクティベーション関数で最適化する。
以上の結果から,CapsuleNetのようなCNNベースのモデルでは,特に推定時間が重要な因子である場合,GIトラクション病の分類に有効な解が得られることが示唆された。
論文 参考訳(メタデータ) (2024-10-24T20:43:47Z) - COCO-Occ: A Benchmark for Occluded Panoptic Segmentation and Image Understanding [8.261771972240778]
本稿では,COCO画像を3つの認知閉塞レベルに手動でラベル付けすることで,COCOデータセットから派生した大規模データセットCOCO-Occを提案する。
論文 参考訳(メタデータ) (2024-09-19T13:26:28Z) - Latent Semantic Consensus For Deterministic Geometric Model Fitting [109.44565542031384]
我々はLSC(Latent Semantic Consensus)と呼ばれる効果的な方法を提案する。
LSCは、モデルフィッティング問題をデータポイントとモデル仮説に基づく2つの潜在意味空間に定式化する。
LSCは、一般的な多構造モデルフィッティングのために、数ミリ秒以内で一貫した、信頼性の高いソリューションを提供することができる。
論文 参考訳(メタデータ) (2024-03-11T05:35:38Z) - Stacking Ensemble Learning in Deep Domain Adaptation for Ophthalmic
Image Classification [61.656149405657246]
ドメイン適応は、十分なラベルデータを取得することが困難な画像分類タスクに有効である。
本稿では,3つのドメイン適応手法を拡張することで,アンサンブル学習を積み重ねるための新しい手法SELDAを提案する。
Age-Related Eye Disease Study (AREDS)ベンチマーク眼科データセットを用いた実験結果から,提案モデルの有効性が示された。
論文 参考訳(メタデータ) (2022-09-27T14:19:00Z) - A Lottery Ticket Hypothesis Framework for Low-Complexity Device-Robust
Neural Acoustic Scene Classification [78.04177357888284]
デバイス・ロバスト音響シーン分類(ASC)のためのデータ拡張、知識伝達、プルーニング、量子化を組み合わせた新しいニューラルモデル圧縮戦略を提案する。
本稿では,低複雑マルチデバイスASCのためのアコースティック・ロッテリー(Austratic Lottery)という,効率的なジョイント・フレームワークについて報告する。
論文 参考訳(メタデータ) (2021-07-03T16:25:24Z) - A Twin Neural Model for Uplift [59.38563723706796]
Upliftは条件付き治療効果モデリングの特定のケースです。
相対リスクのベイズ解釈との関連性を利用して定義した新たな損失関数を提案する。
本提案手法は,シミュレーション設定の最先端と大規模ランダム化実験による実データとの競合性を示す。
論文 参考訳(メタデータ) (2021-05-11T16:02:39Z) - Single Model Deep Learning on Imbalanced Small Datasets for Skin Lesion
Classification [5.642359877598896]
本稿では,小・不均衡なデータセットに基づく皮膚病変の単一モデル分類のための新しいデータ拡張戦略を提案する。
このデータセット上で、様々なDCNNがトレーニングされ、適度な複雑さを持つモデルがより大きなモデルより優れていることを示す。
修正RandAugmentとMulti-weighted Focal Lossを1つのDCNNモデルで組み合わせることで、ISIC 2018チャレンジテストデータセット上の複数のアンサンブルモデルに匹敵する分類精度を達成した。
論文 参考訳(メタデータ) (2021-02-02T03:48:55Z) - Robust Finite Mixture Regression for Heterogeneous Targets [70.19798470463378]
本稿では,サンプルクラスタの探索と,複数の不完全な混合型ターゲットを同時にモデル化するFMRモデルを提案する。
我々は、高次元の学習フレームワークの下で、無症状のオラクルのパフォーマンス境界をモデルに提供します。
その結果,我々のモデルは最先端の性能を達成できることがわかった。
論文 参考訳(メタデータ) (2020-10-12T03:27:07Z) - Predicting Clinical Diagnosis from Patients Electronic Health Records
Using BERT-based Neural Networks [62.9447303059342]
医療コミュニティにおけるこの問題の重要性を示す。
本稿では,変換器 (BERT) モデルによる2方向表現の分類順序の変更について述べる。
約400万人のユニークな患者訪問からなる、大規模なロシアのEHRデータセットを使用します。
論文 参考訳(メタデータ) (2020-07-15T09:22:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。