論文の概要: U-SEANNet: A Simple, Efficient and Applied U-Shaped Network for
Diagnosing Nasal Diseases from Nasal Endoscopic Images
- arxiv url: http://arxiv.org/abs/2308.14081v1
- Date: Sun, 27 Aug 2023 11:57:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-29 17:07:04.302502
- Title: U-SEANNet: A Simple, Efficient and Applied U-Shaped Network for
Diagnosing Nasal Diseases from Nasal Endoscopic Images
- Title(参考訳): U-SEANNet:鼻内視鏡画像から鼻疾患を診断するための簡便で効率的なU字型ネットワーク
- Authors: Yubiao Yue, Jun Xue, Haihua Liang, Zhenzhang Li
- Abstract要約: U-SEANNetは、深度的に分離可能な畳み込みを基盤とした革新的なアーキテクチャである。
U-SEANNetの精度は93.58%、感度は90.17%、特異性は91.27%である。
以上の結果から,U-SEANNetによる鼻咽喉科領域の診断の可能性が示唆された。
- 参考スコア(独自算出の注目度): 0.22758077237273844
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Utilizing deep learning (DL) models to improve the early diagnosis of nasal
diseases from nasal endoscopic images holds paramount importance. However, the
lack of available datasets stymies advancements in this field. Furthermore,
existing models fail to strike a good trade-off between model diagnosis
performance, model complexity and parameter size, rendering them unsuitable for
practical application. To bridge these gaps, we created the first large-scale
nasal endoscopy dataset, named 7-NasEID, comprising 11,352 images that span six
nasal diseases and normal samples. Building on this, we proposed U-SEANNet, an
innovative architecture, underpinned by depth-wise separable convolutions.
Additionally, to augment its discernment capabilities for subtle variations in
input images, we further proposed the Global-Local Channel Feature Fusion
Module, enabling the U-SEANNet to focus salient channel features from both
global and local contexts. Notably, U-SEANNet's parameter size and GFLOPs are
only 0.78M and 0.21, respectively. Employing the 7-NasalEID, we conducted the
five-fold cross-validation on U-SEANNet, juxtaposing its performance against
seventeen renowned architectures. The experimental results suggest U-SEANNet as
the state-of-the-art (SOTA) model, achieves an accuracy of 93.58%, sensitivity
of 90.17%, and specificity of 91.27%. These findings demonstrate U-SEANNet's
prodigious potential for diagnosing nasal diseases in practical use, providing
the development of efficacy nasal diseases diagnosis tools with a new insight.
- Abstract(参考訳): 深層学習(DL)モデルを用いて鼻内視鏡画像から鼻疾患の早期診断を改善することが最重要となる。
しかし、利用可能なデータセットの欠如はこの分野の進歩を阻害する。
さらに、既存のモデルは、モデル診断性能、モデル複雑性とパラメータサイズの間に良いトレードオフを課すことができず、実用的な応用には適さない。
このギャップを埋めるために、私たちは最初の大規模な鼻内視鏡データセットである7-NasEIDを作成しました。
これに基づいて、我々は、深度的に分離可能な畳み込みを基盤とした革新的なアーキテクチャであるU-SEANNetを提案した。
さらに,入力画像の微妙な変動に対する識別能力を強化するため,u-seannetがグローバルとローカルの両方のコンテキストのチャネル機能に集中できるように,グローバル・ローカル・チャネル機能融合モジュールを提案した。
特に、U-SEANNet のパラメータサイズと GFLOP はそれぞれ 0.78M と 0.21 である。
7-NasalEIDを用いてU-SEANNet上で5倍のクロスバリデーションを行い,その性能を17の有名なアーキテクチャと比較した。
実験結果から, 最先端(SOTA)モデルとしてのU-SEANNetの精度は93.58%, 感度は90.17%, 特異性は91.27%であることが示唆された。
これらの結果から,u-seannetは鼻疾患の診断を実用的に行う可能性を示し,鼻疾患診断ツールの開発に新たな知見を与えた。
関連論文リスト
- A Unified Model for Compressed Sensing MRI Across Undersampling Patterns [69.19631302047569]
ディープニューラルネットワークは、アンダーサンプル計測から高忠実度画像を再構成する大きな可能性を示している。
我々のモデルは、離散化に依存しないアーキテクチャであるニューラル演算子に基づいている。
我々の推論速度は拡散法よりも1,400倍速い。
論文 参考訳(メタデータ) (2024-10-05T20:03:57Z) - Enhancing Diabetic Retinopathy Diagnosis: A Lightweight CNN Architecture for Efficient Exudate Detection in Retinal Fundus Images [0.0]
本稿では,自動解凍器検出に適した,新しい軽量畳み込みニューラルネットワークアーキテクチャを提案する。
我々は、モデルの一般化性を高めるために、ドメイン固有のデータ拡張を取り入れた。
本モデルでは,F1スコアの90%を達成し,基礎画像による糖尿病網膜症の早期発見における有効性を示した。
論文 参考訳(メタデータ) (2024-08-13T10:13:33Z) - DiNO-Diffusion. Scaling Medical Diffusion via Self-Supervised Pre-Training [0.0]
Dino-Diffusionは潜在拡散モデル(LDM)の自己教師型手法である
アノテーションへの依存をなくすことで、私たちのトレーニングは、公開胸部X線データセットから868万以上の未ラベル画像を活用する。
小さなデータプールからでも意味的に多様な合成データセットを生成するために使用できる。
論文 参考訳(メタデータ) (2024-07-16T10:51:21Z) - Domain-specific augmentations with resolution agnostic self-attention mechanism improves choroid segmentation in optical coherence tomography images [3.8485899972356337]
脈絡膜は眼の重要な血管層であり、網膜光受容体に酸素を供給する。
現在、コロイドを測定するには、独立した半自動および深層学習に基づく複数のアルゴリズムを使う必要がある。
我々は、コロイドセグメンテーション(REACH)のためのロバストで解像度に依存しない、効果的な注意に基づくネットワークを提案する。
論文 参考訳(メタデータ) (2024-05-23T11:35:23Z) - Classification of lung cancer subtypes on CT images with synthetic
pathological priors [41.75054301525535]
同症例のCT像と病理像との間には,画像パターンに大規模な関連性が存在する。
肺がんサブタイプをCT画像上で正確に分類するための自己生成型ハイブリッド機能ネットワーク(SGHF-Net)を提案する。
論文 参考訳(メタデータ) (2023-08-09T02:04:05Z) - Improving Nonalcoholic Fatty Liver Disease Classification Performance
With Latent Diffusion Models [0.0]
拡散モデルを用いて生成した合成画像と実画像を組み合わせることで,非アルコール性脂肪性肝疾患分類性能を向上させることができることを示す。
その結果,拡散生成画像では最大ISスコアが1.90ドル,GANが1.67ドル,FIDスコアが6.9.45ドル,GANが100.05ドルであった。
論文 参考訳(メタデータ) (2023-07-13T01:14:08Z) - MedFMC: A Real-world Dataset and Benchmark For Foundation Model
Adaptation in Medical Image Classification [41.16626194300303]
ファンデーションモデルは、多くの場合、大規模なデータで事前訓練されているが、様々なビジョンや言語アプリケーションのジャンプ開始において、最も成功している。
最近の進歩により、下流タスクにおける基礎モデルの適応は、少数のトレーニングサンプルだけで効率的に行えるようになった。
しかし, 医用画像解析におけるそのような学習パラダイムの適用は, 一般に公開されているデータやベンチマークが不足しているため, 依然として少ない。
論文 参考訳(メタデータ) (2023-06-16T01:46:07Z) - Classification of COVID-19 in CT Scans using Multi-Source Transfer
Learning [91.3755431537592]
我々は,従来のトランスファー学習の改良にマルチソース・トランスファー・ラーニングを応用して,CTスキャンによる新型コロナウイルスの分類を提案する。
マルチソースファインチューニングアプローチでは、ImageNetで微調整されたベースラインモデルよりも優れています。
我々の最高のパフォーマンスモデルは、0.893の精度と0.897のリコールスコアを達成でき、ベースラインのリコールスコアを9.3%上回った。
論文 参考訳(メタデータ) (2020-09-22T11:53:06Z) - Momentum Contrastive Learning for Few-Shot COVID-19 Diagnosis from Chest
CT Images [41.73507451077361]
本稿では,新型コロナウイルスの自動診断のための新しい深層学習アルゴリズムを提案する。
コントラスト学習を用いてエンコーダを訓練し,大規模かつ一般公開された肺データセット上の表現的特徴表現をキャプチャする。
以上の結果より,胸部CT画像による新型コロナウイルスの正確な診断におけるモデルの有用性が示唆された。
論文 参考訳(メタデータ) (2020-06-16T10:14:58Z) - Exploration of Interpretability Techniques for Deep COVID-19
Classification using Chest X-ray Images [10.01138352319106]
5種類のディープラーニングモデル(ResNet18、ResNet34、InceptionV3、InceptionResNetV2、DenseNet161)とそれらのEnsembleは、Chest X-Ray画像を用いて、新型コロナウイルス、肺炎、健康な被験者を分類するために使用されている。
新型コロナウイルスの分類における平均的なMicro-F1スコアは0.66から0.875の範囲で、ネットワークモデルのアンサンブルは0.89である。
論文 参考訳(メタデータ) (2020-06-03T22:55:53Z) - An interpretable classifier for high-resolution breast cancer screening
images utilizing weakly supervised localization [45.00998416720726]
医用画像の特徴に対処する枠組みを提案する。
このモデルはまず、画像全体の低容量だがメモリ効率のよいネットワークを使用して、最も情報性の高い領域を識別する。
次に、選択したリージョンから詳細を収集するために、別の高容量ネットワークを適用します。
最後に、グローバルおよびローカル情報を集約して最終的な予測を行うフュージョンモジュールを使用する。
論文 参考訳(メタデータ) (2020-02-13T15:28:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。