論文の概要: Ear-Keeper: A Cross-Platform AI System for Rapid and Accurate Ear Disease Diagnosis
- arxiv url: http://arxiv.org/abs/2308.10610v5
- Date: Wed, 13 Aug 2025 04:08:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-14 20:42:00.412236
- Title: Ear-Keeper: A Cross-Platform AI System for Rapid and Accurate Ear Disease Diagnosis
- Title(参考訳): Ear-Keeper: 迅速かつ正確な耳疾患診断のためのクロスプラットフォームAIシステム
- Authors: Feiyan Lu, Yubiao Yue, Zhenzhang Li, Meiping Zhang, Wen Luo, Fan Zhang, Tong Liu, Jingyong Shi, Guang Wang, Xinyu Zeng,
- Abstract要約: 耳疾患8例と健常症例を対象とした大規模多施設耳内視鏡検査データセットを構築した。
モデルサイズがわずか2.94MBのBest-EarNetは、内部テストセットで95.23%、外部テストセットで92.14%の診断精度を達成した。
我々はBest-EarNet上に構築されたクロスプラットフォームのインテリジェント診断システムであるEar-Keeperを開発した。
- 参考スコア(独自算出の注目度): 8.927331232711548
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Early and accurate detection systems for ear diseases, powered by deep learning, are essential for preventing hearing impairment and improving population health. However, the limited diversity of existing otoendoscopy datasets and the poor balance between diagnostic accuracy, computational efficiency, and model size have hindered the translation of artificial intelligence (AI) algorithms into healthcare applications. In this study, we constructed a large-scale, multi-center otoendoscopy dataset covering eight common ear diseases and healthy cases. Building upon this resource, we developed Best-EarNet, an ultrafast and lightweight deep learning architecture integrating a novel Local-Global Spatial Feature Fusion Module with a multi-scale supervision strategy, enabling real-time and accurate classification of ear conditions. Leveraging transfer learning, Best-EarNet, with a model size of only 2.94 MB, achieved diagnostic accuracies of 95.23% on an internal test set (22,581 images) and 92.14% on an external test set (1,652 images), while requiring only 0.0125 seconds (80 frames per second) to process a single image on a standard CPU. Further subgroup analysis by gender and age showed consistently excellent performance of Best-EarNet across all demographic groups. To enhance clinical interpretability and user trust, we incorporated Grad-CAM-based visualization, highlighting the specific abnormal ear regions contributing to AI predictions. Most importantly, we developed Ear-Keeper, a cross-platform intelligent diagnosis system built upon Best-EarNet, deployable on smartphones, tablets, and personal computers. Ear-Keeper enables public users and healthcare providers to perform comprehensive real-time video-based ear canal screening, supporting early detection and timely intervention of ear diseases.
- Abstract(参考訳): 深層学習による耳疾患の早期かつ正確な検出システムは、聴覚障害の予防と人口健康の改善に不可欠である。
しかし、既存の耳内視鏡データセットの多様性の制限と、診断精度、計算効率、モデルサイズとのバランスの低さにより、人工知能(AI)アルゴリズムの医療応用への変換が妨げられている。
本研究では,8症例の耳疾患と健常症例を対象とした大規模多施設耳内視鏡データセットを構築した。
このリソースを基盤としたBest-EarNetは,新しいローカル・グローバル空間特徴融合モジュールとマルチスケールの監視戦略を統合した超高速で軽量なディープラーニングアーキテクチャであり,耳の状態のリアルタイムかつ正確な分類を可能にする。
モデルサイズがわずか2.94MBのBest-EarNetは、内部テストセット(22,581枚)で95.23%、外部テストセット(1,652枚)で92.14%という診断精度を達成した。
性別と年齢によるさらなるサブグループ分析では、全人口集団でBest-EarNetが一貫して優れた性能を示した。
臨床的解釈可能性とユーザ信頼を高めるため,我々はGrad-CAMベースの可視化を導入し,AI予測に寄与する特定の異常耳領域を強調した。
最も重要なことは、Best-EarNet上に構築されたクロスプラットフォームのインテリジェント診断システムであるEar-Keeperを開発したことです。
Ear-Keeperは、公共のユーザーや医療機関が、早期発見と耳疾患のタイムリーな介入をサポートする、包括的なリアルタイムビデオベースの耳道スクリーニングを行うことを可能にする。
関連論文リスト
- Deploying and Evaluating Multiple Deep Learning Models on Edge Devices for Diabetic Retinopathy Detection [0.0]
糖尿病網膜症(DR)は世界中で約34.6%の糖尿病患者に影響を与えており、2045年までに2億2200万人に達すると予測されている。
従来のDR診断は、時間と資源を集中的に消費する網膜基底画像のマニュアル検査に依存している。
本研究では、エッジデバイス上でリアルタイムDRのための複数のディープラーニングモデルをデプロイするために、Edge Impulseを用いた新しいソリューションを提案する。
論文 参考訳(メタデータ) (2025-06-14T13:53:45Z) - Detection of Disease on Nasal Breath Sound by New Lightweight Architecture: Using COVID-19 as An Example [4.618578603062536]
感染症、特に新型コロナウイルスは、世界的な健康問題であり続けている。
本研究の目的は、スマートフォンで収集した鼻呼吸音声データを用いて、効率的で正確で費用対効果の高い新型コロナウイルス検出のための、新しい、軽量なディープニューラルネットワークを開発することである。
論文 参考訳(メタデータ) (2025-04-01T12:41:53Z) - GONet: A Generalizable Deep Learning Model for Glaucoma Detection [2.0521974107551535]
緑内障性視神経症(英: Glaucomatous optic neuropathy, GON)は、早期に発見され治療を受けなければ、視力喪失を招きかねない眼疾患である。
近年,デジタル眼底画像からGON検出を自動検出する深層学習モデルは,将来性を示しているが,一般化性に限界がある場合が多い。
GONetは、7つの独立したデータセットを用いて開発された堅牢なディープラーニングモデルである。
論文 参考訳(メタデータ) (2025-02-26T19:28:09Z) - Privacy-Preserving Federated Foundation Model for Generalist Ultrasound Artificial Intelligence [83.02106623401885]
プライバシー保護型超音波基礎モデルであるUltraFedFMを提案する。
UltraFedFMは、9か国の16の分散医療機関にわたる連合学習を用いて、協調的に事前訓練されている。
疾患診断には0.927のレシーバ動作特性曲線、病変セグメント化には0.878のサイス類似係数を平均的に達成する。
論文 参考訳(メタデータ) (2024-11-25T13:40:11Z) - MADE-for-ASD: A Multi-Atlas Deep Ensemble Network for Diagnosing Autism Spectrum Disorder [4.7377709803078325]
本稿では,従来の診断手法と潜在的な自動化ソリューションのギャップを埋める。
我々は,脳の機能的磁気共鳴画像(fMRI)データの複数のアトラスを統合するマルチアトラスディープアンサンブルネットワーク,MADE-for-ASDを提案する。
提案手法は,ASD診断性能を向上させるための予測ワークフローに,人口統計情報を統合する。
論文 参考訳(メタデータ) (2024-07-09T17:49:23Z) - Towards a clinically accessible radiology foundation model: open-access and lightweight, with automated evaluation [113.5002649181103]
オープンソースの小型マルチモーダルモデル(SMM)を訓練し、放射線学における未測定臨床ニーズに対する能力ギャップを埋める。
トレーニングのために,697万以上の画像テキストペアからなる大規模なデータセットを組み立てる。
評価のために,GPT-4に基づく実測値CheXpromptを提案する。
LlaVA-Radの推論は高速で、単一のV100 GPU上でプライベート設定で実行できる。
論文 参考訳(メタデータ) (2024-03-12T18:12:02Z) - Detecting Speech Abnormalities with a Perceiver-based Sequence
Classifier that Leverages a Universal Speech Model [4.503292461488901]
いくつかの神経疾患の音声反射異常を検出するPerceiver-based sequenceを提案する。
このシーケンスとUniversal Speech Model (USM)を組み合わせ、1200万時間に及ぶ多様な音声録音をトレーニング(教師なし)する。
我々のモデルは標準変圧器 (80.9%) および知覚器 (81.8%) モデルより優れ、平均精度は83.1%である。
論文 参考訳(メタデータ) (2023-10-16T21:07:12Z) - The role of noise in denoising models for anomaly detection in medical
images [62.0532151156057]
病理脳病変は脳画像に多彩な外観を示す。
正規データのみを用いた教師なし異常検出手法が提案されている。
空間分解能の最適化と雑音の大きさの最適化により,異なるモデル学習体制の性能が向上することを示す。
論文 参考訳(メタデータ) (2023-01-19T21:39:38Z) - A Meta-GNN approach to personalized seizure detection and classification [53.906130332172324]
本稿では,特定の患者に限られた発作サンプルから迅速に適応できるパーソナライズされた発作検出・分類フレームワークを提案する。
トレーニング患者の集合からグローバルモデルを学ぶメタGNNベースの分類器を訓練する。
本手法は, 未確認患者20回に限って, 精度82.7%, F1スコア82.08%を達成し, ベースラインよりも優れていた。
論文 参考訳(メタデータ) (2022-11-01T14:12:58Z) - Side-aware Meta-Learning for Cross-Dataset Listener Diagnosis with
Subjective Tinnitus [38.66127142638335]
本稿では,クロスデータセット・ティンニタス診断のための側面認識メタラーニングを提案する。
本手法は,クロスデータセット分類において73.8%の精度を実現する。
論文 参考訳(メタデータ) (2022-05-03T03:17:44Z) - Multiple Time Series Fusion Based on LSTM An Application to CAP A Phase
Classification Using EEG [56.155331323304]
本研究では,深層学習に基づく脳波チャンネルの特徴レベル融合を行う。
チャネル選択,融合,分類手順を2つの最適化アルゴリズムで最適化した。
論文 参考訳(メタデータ) (2021-12-18T14:17:49Z) - Novel EEG based Schizophrenia Detection with IoMT Framework for Smart
Healthcare [0.0]
統合失調症(Sz)は、世界中の人々の思考、行動、感情に深刻な影響を及ぼす脳障害である。
EEGは非線形時系列信号であり、その非線形構造のために調査に利用することがかなり重要である。
本稿では,深層学習を用いた脳波を用いたSz検出の性能向上を目的とする。
論文 参考訳(メタデータ) (2021-11-19T18:21:20Z) - Detecting COVID-19 from Breathing and Coughing Sounds using Deep Neural
Networks [68.8204255655161]
私たちは、Convolutional Neural Networksのアンサンブルを適応させて、スピーカーがCOVID-19に感染しているかどうかを分類します。
最終的には、74.9%のUnweighted Average Recall(UAR)、またはニューラルネットワークをアンサンブルすることで、ROC曲線(AUC)の80.7%を達成する。
論文 参考訳(メタデータ) (2020-12-29T01:14:17Z) - UESegNet: Context Aware Unconstrained ROI Segmentation Networks for Ear
Biometric [8.187718963808484]
耳のバイオメトリックスは 制約のない環境において かなりの困難を抱えています
野生における耳の局所化の問題に対処するため、我々は2つの高性能興味領域分割モデル UESegNet-1 と UESegNet-2 を提案している。
モデルの一般化をテストするために、6つの異なるベンチマークデータセットで評価される。
論文 参考訳(メタデータ) (2020-10-08T14:05:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。