論文の概要: U-SEANNet: A Simple, Efficient and Applied U-Shaped Network for
Diagnosing Nasal Diseases from Nasal Endoscopic Images
- arxiv url: http://arxiv.org/abs/2308.14081v1
- Date: Sun, 27 Aug 2023 11:57:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-29 17:07:04.302502
- Title: U-SEANNet: A Simple, Efficient and Applied U-Shaped Network for
Diagnosing Nasal Diseases from Nasal Endoscopic Images
- Title(参考訳): U-SEANNet:鼻内視鏡画像から鼻疾患を診断するための簡便で効率的なU字型ネットワーク
- Authors: Yubiao Yue, Jun Xue, Haihua Liang, Zhenzhang Li
- Abstract要約: U-SEANNetは、深度的に分離可能な畳み込みを基盤とした革新的なアーキテクチャである。
U-SEANNetの精度は93.58%、感度は90.17%、特異性は91.27%である。
以上の結果から,U-SEANNetによる鼻咽喉科領域の診断の可能性が示唆された。
- 参考スコア(独自算出の注目度): 0.22758077237273844
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Utilizing deep learning (DL) models to improve the early diagnosis of nasal
diseases from nasal endoscopic images holds paramount importance. However, the
lack of available datasets stymies advancements in this field. Furthermore,
existing models fail to strike a good trade-off between model diagnosis
performance, model complexity and parameter size, rendering them unsuitable for
practical application. To bridge these gaps, we created the first large-scale
nasal endoscopy dataset, named 7-NasEID, comprising 11,352 images that span six
nasal diseases and normal samples. Building on this, we proposed U-SEANNet, an
innovative architecture, underpinned by depth-wise separable convolutions.
Additionally, to augment its discernment capabilities for subtle variations in
input images, we further proposed the Global-Local Channel Feature Fusion
Module, enabling the U-SEANNet to focus salient channel features from both
global and local contexts. Notably, U-SEANNet's parameter size and GFLOPs are
only 0.78M and 0.21, respectively. Employing the 7-NasalEID, we conducted the
five-fold cross-validation on U-SEANNet, juxtaposing its performance against
seventeen renowned architectures. The experimental results suggest U-SEANNet as
the state-of-the-art (SOTA) model, achieves an accuracy of 93.58%, sensitivity
of 90.17%, and specificity of 91.27%. These findings demonstrate U-SEANNet's
prodigious potential for diagnosing nasal diseases in practical use, providing
the development of efficacy nasal diseases diagnosis tools with a new insight.
- Abstract(参考訳): 深層学習(DL)モデルを用いて鼻内視鏡画像から鼻疾患の早期診断を改善することが最重要となる。
しかし、利用可能なデータセットの欠如はこの分野の進歩を阻害する。
さらに、既存のモデルは、モデル診断性能、モデル複雑性とパラメータサイズの間に良いトレードオフを課すことができず、実用的な応用には適さない。
このギャップを埋めるために、私たちは最初の大規模な鼻内視鏡データセットである7-NasEIDを作成しました。
これに基づいて、我々は、深度的に分離可能な畳み込みを基盤とした革新的なアーキテクチャであるU-SEANNetを提案した。
さらに,入力画像の微妙な変動に対する識別能力を強化するため,u-seannetがグローバルとローカルの両方のコンテキストのチャネル機能に集中できるように,グローバル・ローカル・チャネル機能融合モジュールを提案した。
特に、U-SEANNet のパラメータサイズと GFLOP はそれぞれ 0.78M と 0.21 である。
7-NasalEIDを用いてU-SEANNet上で5倍のクロスバリデーションを行い,その性能を17の有名なアーキテクチャと比較した。
実験結果から, 最先端(SOTA)モデルとしてのU-SEANNetの精度は93.58%, 感度は90.17%, 特異性は91.27%であることが示唆された。
これらの結果から,u-seannetは鼻疾患の診断を実用的に行う可能性を示し,鼻疾患診断ツールの開発に新たな知見を与えた。
関連論文リスト
- Improving Nonalcoholic Fatty Liver Disease Classification Performance
With Latent Diffusion Models [0.0]
拡散モデルを用いて生成した合成画像と実画像を組み合わせることで,非アルコール性脂肪性肝疾患分類性能を向上させることができることを示す。
その結果,拡散生成画像では最大ISスコアが1.90ドル,GANが1.67ドル,FIDスコアが6.9.45ドル,GANが100.05ドルであった。
論文 参考訳(メタデータ) (2023-07-13T01:14:08Z) - MAF-Net: Multiple attention-guided fusion network for fundus vascular
image segmentation [1.3295074739915493]
網膜基底画像の血管を正確に検出するマルチアテンション誘導核融合ネットワーク(MAF-Net)を提案する。
従来のUNetベースのモデルは、長距離依存を明示的にモデル化するため、部分的な情報を失う可能性がある。
提案手法は,いくつかの最先端手法と比較して良好な結果が得られることを示す。
論文 参考訳(メタデータ) (2023-05-05T15:22:20Z) - Mediastinal Lymph Node Detection and Segmentation Using Deep Learning [1.7188280334580195]
臨床ではCT(Computed tomography)とPET(positron emission tomography)が異常リンパ節(LN)を検出する
深層畳み込みニューラルネットワークは、しばしば医療写真にアイテムを分割する。
良質な深層学習手法であるUNetは、縦隔リンパ節の分節と検出のための戦略に基づいて、双線形および全一般化変異(TGV)を用いて修正された。
修正されたUNetはテクスチャの不連続を維持し、ノイズの多い領域を選択し、バックプロパゲーションを通じて適切なバランスポイントを検索し、画像の解像度を再現する。
論文 参考訳(メタデータ) (2022-11-24T02:55:20Z) - WSSS4LUAD: Grand Challenge on Weakly-supervised Tissue Semantic
Segmentation for Lung Adenocarcinoma [51.50991881342181]
この課題には10,091個のパッチレベルのアノテーションと1300万以上のラベル付きピクセルが含まれる。
第一位チームは0.8413mIoUを達成した(腫瘍:0.8389、ストーマ:0.7931、正常:0.8919)。
論文 参考訳(メタデータ) (2022-04-13T15:27:05Z) - Detection of Large Vessel Occlusions using Deep Learning by Deforming
Vessel Tree Segmentations [5.408694811103598]
この研究は、船体木分割マスクの弾性変形で訓練されたケースレベルの分類に畳み込みニューラルネットワークを使用し、トレーニングデータを人工的に増強する。
ニューラルネットワークは、LVOと影響を受ける半球の存在を分類する。
5倍のクロス検証アブレーション実験において,提案手法を用いることで,少数のデータセットからでも頑健なモデルを訓練できることが実証された。
論文 参考訳(メタデータ) (2021-12-03T09:07:29Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z) - Classification of COVID-19 in CT Scans using Multi-Source Transfer
Learning [91.3755431537592]
我々は,従来のトランスファー学習の改良にマルチソース・トランスファー・ラーニングを応用して,CTスキャンによる新型コロナウイルスの分類を提案する。
マルチソースファインチューニングアプローチでは、ImageNetで微調整されたベースラインモデルよりも優れています。
我々の最高のパフォーマンスモデルは、0.893の精度と0.897のリコールスコアを達成でき、ベースラインのリコールスコアを9.3%上回った。
論文 参考訳(メタデータ) (2020-09-22T11:53:06Z) - Predicting Clinical Diagnosis from Patients Electronic Health Records
Using BERT-based Neural Networks [62.9447303059342]
医療コミュニティにおけるこの問題の重要性を示す。
本稿では,変換器 (BERT) モデルによる2方向表現の分類順序の変更について述べる。
約400万人のユニークな患者訪問からなる、大規模なロシアのEHRデータセットを使用します。
論文 参考訳(メタデータ) (2020-07-15T09:22:55Z) - Two-Stream Deep Feature Modelling for Automated Video Endoscopy Data
Analysis [45.19890687786009]
内視鏡画像解析のための2ストリームモデルを提案する。
本モデルでは,2つの深い特徴入力を融合させ,それらの関係関係を新たな関係ネットワークモデルによりマッピングする。
論文 参考訳(メタデータ) (2020-07-12T05:24:08Z) - Exploration of Interpretability Techniques for Deep COVID-19
Classification using Chest X-ray Images [10.01138352319106]
5種類のディープラーニングモデル(ResNet18、ResNet34、InceptionV3、InceptionResNetV2、DenseNet161)とそれらのEnsembleは、Chest X-Ray画像を用いて、新型コロナウイルス、肺炎、健康な被験者を分類するために使用されている。
新型コロナウイルスの分類における平均的なMicro-F1スコアは0.66から0.875の範囲で、ネットワークモデルのアンサンブルは0.89である。
論文 参考訳(メタデータ) (2020-06-03T22:55:53Z) - An interpretable classifier for high-resolution breast cancer screening
images utilizing weakly supervised localization [45.00998416720726]
医用画像の特徴に対処する枠組みを提案する。
このモデルはまず、画像全体の低容量だがメモリ効率のよいネットワークを使用して、最も情報性の高い領域を識別する。
次に、選択したリージョンから詳細を収集するために、別の高容量ネットワークを適用します。
最後に、グローバルおよびローカル情報を集約して最終的な予測を行うフュージョンモジュールを使用する。
論文 参考訳(メタデータ) (2020-02-13T15:28:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。