論文の概要: CAVE: Classifying Abnormalities in Video Capsule Endoscopy
- arxiv url: http://arxiv.org/abs/2410.20231v1
- Date: Sat, 26 Oct 2024 17:25:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-29 12:22:44.372608
- Title: CAVE: Classifying Abnormalities in Video Capsule Endoscopy
- Title(参考訳): CAVE:ビデオカプセル内視鏡における異常の分類
- Authors: Ishita Harish, Saurav Mishra, Neha Bhadoria, Rithik Kumar, Madhav Arora, Syed Rameem Zahra, Ankur Gupta,
- Abstract要約: 本研究では,複雑な画像データセットの分類精度を向上させるために,アンサンブルに基づくアプローチを検討する。
各モデルのユニークな特徴抽出機能を活用し、全体的な精度を向上させる。
実験により、アンサンブルは難易度と不均衡度の高いクラス間で高い精度と堅牢性を達成することが示された。
- 参考スコア(独自算出の注目度): 0.1937002985471497
- License:
- Abstract: In this study, we explore an ensemble-based approach to improve classification accuracy in complex image datasets. Utilizing a Convolutional Block Attention Module (CBAM) alongside a Deep Neural Network (DNN) we leverage the unique feature-extraction capabilities of each model to enhance the overall accuracy. Additional models, such as Random Forest, XGBoost, Support Vector Machine (SVM), and K-Nearest Neighbors (KNN), are introduced to further diversify the predictive power of our ensemble. By leveraging these methods, the proposed approach provides robust feature discrimination and improved classification results. Experimental evaluations demonstrate that the ensemble achieves higher accuracy and robustness across challenging and imbalanced classes, showing significant promise for broader applications in computer vision tasks.
- Abstract(参考訳): 本研究では,複雑な画像データセットの分類精度を向上させるために,アンサンブルに基づくアプローチを検討する。
畳み込みブロック注意モジュール(CBAM)とディープニューラルネットワーク(DNN)を組み合わせることで、各モデルのユニークな特徴抽出機能を活用し、全体的な精度を向上させる。
Random Forest, XGBoost, Support Vector Machine (SVM), K-Nearest Neighbors (KNN) などの追加モデルを導入し, アンサンブルの予測能力をさらに多様化させた。
提案手法は,これらの手法を利用することで,ロバストな特徴識別と分類結果の改善を実現する。
実験により、アンサンブルは困難で不均衡なクラス間で高い精度と堅牢性を達成し、コンピュータビジョンタスクにおいてより広範な応用が期待できることを示す。
関連論文リスト
- DCENWCNet: A Deep CNN Ensemble Network for White Blood Cell Classification with LIME-Based Explainability [0.0]
白血球(WBC)は免疫系の重要な部分です。
従来の畳み込みニューラルネットワーク(CNN)は、血液細胞を物体の一部から分類し、物体認識を行う。
本稿では,3つのCNNアーキテクチャを統合した新しいアンサンブル手法を提案する。
論文 参考訳(メタデータ) (2025-02-08T05:53:20Z) - Hybrid Interpretable Deep Learning Framework for Skin Cancer Diagnosis: Integrating Radial Basis Function Networks with Explainable AI [1.1049608786515839]
皮膚がんは世界中で最も流行し、致命的な疾患の1つである。
本稿では,畳み込みニューラルネットワーク(CNN)とラジアル基底関数(RBF)ネットワークを統合するハイブリッドディープラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2025-01-24T19:19:02Z) - Reliable Joint Segmentation of Retinal Edema Lesions in OCT Images [55.83984261827332]
本稿では,信頼性の高いマルチスケールウェーブレットエンハンストランスネットワークを提案する。
本研究では,ウェーブレット型特徴抽出器ネットワークとマルチスケール変圧器モジュールを統合したセグメンテーションバックボーンを開発した。
提案手法は,他の最先端セグメンテーション手法と比較して信頼性の高いセグメンテーション精度を実現する。
論文 参考訳(メタデータ) (2022-12-01T07:32:56Z) - Preservation of High Frequency Content for Deep Learning-Based Medical
Image Classification [74.84221280249876]
大量の胸部ラジオグラフィーの効率的な分析は、医師や放射線技師を助けることができる。
本稿では,視覚情報の効率的な識別と符号化のための離散ウェーブレット変換(DWT)を提案する。
論文 参考訳(メタデータ) (2022-05-08T15:29:54Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z) - Atlas-aware ConvNetfor Accurate yet Robust Anatomical Segmentation [14.187615351160021]
本稿では、確率論的アトラス事前を予測の明示的な制約として組み込んだ完全な畳み込み制約導入モジュール(CAM)を紹介する。
このようなアトラス前駆体融合の利点は2つの脳パーセレーションタスクで2倍になることを示す。
提案手法は,CAMを微調整し,精度とロバスト性の向上を図ることで,既存のConvNetに容易に適用できることを示唆している。
論文 参考訳(メタデータ) (2021-02-02T02:06:06Z) - Automated Prostate Cancer Diagnosis Based on Gleason Grading Using
Convolutional Neural Network [12.161266795282915]
そこで本研究では,前立腺癌(PCa)の完全分類のための畳み込みニューラルネットワーク(CNN)を用いた自動分類法を提案する。
Patch-Based Image Reconstruction (PBIR) と呼ばれるデータ拡張手法が提案され,WSIの高分解能化と多様性の向上が図られた。
対象データセットへの事前学習モデルの適応性を高めるために,分布補正モジュールを開発した。
論文 参考訳(メタデータ) (2020-11-29T06:42:08Z) - DONet: Dual Objective Networks for Skin Lesion Segmentation [77.9806410198298]
本稿では,皮膚病変のセグメンテーションを改善するために,Dual Objective Networks (DONet) という,シンプルで効果的なフレームワークを提案する。
我々のDONetは2つの対称デコーダを採用し、異なる目標に近づくための異なる予測を生成する。
皮膚内視鏡画像における多種多様な病変のスケールと形状の課題に対処するために,再帰的コンテキスト符号化モジュール(RCEM)を提案する。
論文 参考訳(メタデータ) (2020-08-19T06:02:46Z) - Collaborative Boundary-aware Context Encoding Networks for Error Map
Prediction [65.44752447868626]
本稿では,AEP-Net と呼ばれる協調的コンテキスト符号化ネットワークを提案する。
具体的には、画像とマスクのより優れた特徴融合のための協調的な特徴変換分岐と、エラー領域の正確な局所化を提案する。
AEP-Netはエラー予測タスクの平均DSCが0.8358,0.8164であり、ピアソン相関係数が0.9873である。
論文 参考訳(メタデータ) (2020-06-25T12:42:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。