論文の概要: Open Set Recognition for Endoscopic Image Classification: A Deep Learning Approach on the Kvasir Dataset
- arxiv url: http://arxiv.org/abs/2506.18284v1
- Date: Mon, 23 Jun 2025 04:39:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-24 19:06:36.85527
- Title: Open Set Recognition for Endoscopic Image Classification: A Deep Learning Approach on the Kvasir Dataset
- Title(参考訳): 内視鏡画像分類のためのオープンセット認識: Kvasir データセットの深層学習アプローチ
- Authors: Kasra Moazzami, Seoyoun Son, John Lin, Sun Min Lee, Daniel Son, Hayeon Lee, Jeongho Lee, Seongji Lee,
- Abstract要約: ResNet-50、Swin Transformer、ハイブリッドResNet-Transformerモデルなど、いくつかの代表的なディープラーニングアーキテクチャのOSR機能をクローズドセットおよびオープンセット条件下で評価・比較する。
この研究は、Kvasirデータセットにオープンセット認識を適用するための最初の取り組みの1つであり、医療画像解析においてOSRのパフォーマンスを評価するためのベンチマークを提供する。
- 参考スコア(独自算出の注目度): 5.762226441746656
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Endoscopic image classification plays a pivotal role in medical diagnostics by identifying anatomical landmarks and pathological findings. However, conventional closed-set classification frameworks are inherently limited in open-world clinical settings, where previously unseen conditions can arise andcompromise model reliability. To address this, we explore the application of Open Set Recognition (OSR) techniques on the Kvasir dataset, a publicly available and diverse endoscopic image collection. In this study, we evaluate and compare the OSR capabilities of several representative deep learning architectures, including ResNet-50, Swin Transformer, and a hybrid ResNet-Transformer model, under both closed-set and open-set conditions. OpenMax is adopted as a baseline OSR method to assess the ability of these models to distinguish known classes from previously unseen categories. This work represents one of the first efforts to apply open set recognition to the Kvasir dataset and provides a foundational benchmark for evaluating OSR performance in medical image analysis. Our results offer practical insights into model behavior in clinically realistic settings and highlight the importance of OSR techniques for the safe deployment of AI systems in endoscopy.
- Abstract(参考訳): 内視鏡的画像分類は、解剖学的所見と病理所見を同定することにより、医療診断において重要な役割を担っている。
しかし、従来のクローズドセット分類フレームワークは、本来、未確認の条件が生まれ、モデルの信頼性を補完する、オープンワールドな臨床環境に限られている。
これを解決するために、Kvasirデータセットへのオープンセット認識(OSR)技術の適用について検討する。
本研究では,ResNet-50,Swin Transformer,ハイブリッドResNet-Transformerモデルなど,いくつかの代表的なディープラーニングアーキテクチャのOSR機能を,クローズドセットおよびオープンセット条件下で評価・比較する。
OpenMaxはベースラインOSRメソッドとして採用され、これらのモデルが既知のクラスを、これまで見つからなかったカテゴリと区別する能力を評価する。
この研究は、Kvasirデータセットにオープンセット認識を適用するための最初の取り組みの1つであり、医療画像解析においてOSRのパフォーマンスを評価するための基礎的なベンチマークを提供する。
臨床的に現実的な環境でのモデル行動に関する実践的な知見を提供し,内視鏡におけるAIシステムの安全な配置におけるOSR技術の重要性を強調した。
関連論文リスト
- Electromagnetic Scattering Kernel Guided Reciprocal Point Learning for SAR Open-Set Recognition [6.226365654670747]
Open Set Recognition (OSR)は、未知のクラスを「未知」と表現しながら、既知のクラスを分類することを目的とする。
オープンセットSAR分類を強化するために,相互学習ネットワークを用いた散乱カーネルと呼ばれる手法を提案する。
大規模属性散乱中心モデルに基づく畳み込みカーネルの設計を提案する。
論文 参考訳(メタデータ) (2024-11-07T13:26:20Z) - Visual Prompt Engineering for Vision Language Models in Radiology [0.17183214167143138]
Contrastive Language-Image Pretraining (CLIP)は,マルチモーダルな大規模事前訓練によるゼロショット分類を可能にすることで,有望なソリューションを提供する。
CLIPは、グローバルな画像コンテンツを効果的にキャプチャするが、ラジオロジーは、解釈可能性と診断精度の両方を高めるために、特定の病理領域により局所的な焦点をあてる必要がある。
視覚的手がかりをゼロショット分類に組み込む可能性を探り、矢印、バウンディングボックス、円などの視覚的マーカーを直接放射線画像に埋め込んでモデル注意を誘導する。
論文 参考訳(メタデータ) (2024-08-28T13:53:27Z) - Polar-Net: A Clinical-Friendly Model for Alzheimer's Disease Detection
in OCTA Images [53.235117594102675]
オプティカルコヒーレンス・トモグラフィーは、網膜微小血管の画像化によってアルツハイマー病(AD)を検出するための有望なツールである。
我々はPolar-Netと呼ばれる新しいディープラーニングフレームワークを提案し、解釈可能な結果を提供し、臨床上の事前知識を活用する。
Polar-Netは既存の最先端の手法よりも優れており,網膜血管変化とADとの関連性について,より貴重な病理学的証拠を提供する。
論文 参考訳(メタデータ) (2023-11-10T11:49:49Z) - RIDE: Self-Supervised Learning of Rotation-Equivariant Keypoint
Detection and Invariant Description for Endoscopy [83.4885991036141]
RIDEは回転同変検出と不変記述のための学習に基づく手法である。
内視鏡画像の大規模なキュレーションを自己指導的に行う。
マッチングと相対的なポーズ推定タスクに対して、最先端のパフォーマンスを新たに設定する。
論文 参考訳(メタデータ) (2023-09-18T08:16:30Z) - K-Space-Aware Cross-Modality Score for Synthesized Neuroimage Quality
Assessment [71.27193056354741]
クロスモダリティな医用画像合成をどう評価するかという問題は、ほとんど解明されていない。
本稿では,この課題の進展を促すため,新しい指標K-CROSSを提案する。
K-CROSSは、トレーニング済みのマルチモードセグメンテーションネットワークを使用して、病変の位置を予測する。
論文 参考訳(メタデータ) (2023-07-10T01:26:48Z) - k-SALSA: k-anonymous synthetic averaging of retinal images via local
style alignment [6.36950432352094]
我々は,網膜基底像を合成するためのGANベースのフレームワークであるk-SALSAを紹介する。
k-SALSAは、網膜画像の実用的なパフォーマンスを達成するために、GANのトレーニングと反転のための最先端技術を組み合わせている。
我々の研究は、科学的コラボレーションのための網膜画像のより広範な共有に向けた一歩である。
論文 参考訳(メタデータ) (2023-03-20T01:47:04Z) - Learning disentangled representations for explainable chest X-ray
classification using Dirichlet VAEs [68.73427163074015]
本研究では,胸部X線像の非絡み合った潜在表現の学習にDirVAE(Dirichlet Variational Autoencoder)を用いることを検討した。
DirVAEモデルにより学習された多モード潜在表現の予測能力について,補助的多ラベル分類タスクの実装により検討した。
論文 参考訳(メタデータ) (2023-02-06T18:10:08Z) - Evaluation of Various Open-Set Medical Imaging Tasks with Deep Neural
Networks [15.655519786176438]
我々は最先端のオープンセット手法の厳密な評価を行い、異なるオープンセットシナリオを探索する。
一般領域学習モデルと医療領域学習モデルの主な違いを示す。
論文 参考訳(メタデータ) (2021-10-21T04:19:41Z) - Malignancy Prediction and Lesion Identification from Clinical
Dermatological Images [65.1629311281062]
臨床皮膚画像から機械学習に基づく悪性度予測と病変の同定を検討する。
まず, サブタイプや悪性度に関わらず画像に存在するすべての病変を同定し, その悪性度を推定し, 凝集により, 画像レベルの悪性度も生成する。
論文 参考訳(メタデータ) (2021-04-02T20:52:05Z) - Intrapapillary Capillary Loop Classification in Magnification Endoscopy:
Open Dataset and Baseline Methodology [8.334256673330879]
我々は静止画やビデオフレームを正常または異常と分類できるコンピュータ支援検出システムを構築した。
114の患者ビデオから抽出された68Kバイナリラベルフレームを含む新しいベンチマークデータセットを紹介します。
提案手法は, 臨床医12名による94.7 %に対して, 平均91.7 %の精度を示した。
論文 参考訳(メタデータ) (2021-02-19T14:55:21Z) - Explaining Clinical Decision Support Systems in Medical Imaging using
Cycle-Consistent Activation Maximization [112.2628296775395]
ディープニューラルネットワークを用いた臨床意思決定支援は、着実に関心が高まりつつあるトピックとなっている。
臨床医は、その根底にある意思決定プロセスが不透明で理解しにくいため、この技術の採用をためらうことが多い。
そこで我々は,より小さなデータセットであっても,分類器決定の高品質な可視化を生成するCycleGANアクティベーションに基づく,新たな意思決定手法を提案する。
論文 参考訳(メタデータ) (2020-10-09T14:39:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。