論文の概要: Real-Time Glottis Detection Framework via Spatial-decoupled Feature Learning for Nasal Transnasal Intubation
- arxiv url: http://arxiv.org/abs/2603.07630v1
- Date: Sun, 08 Mar 2026 13:36:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-10 15:13:14.991802
- Title: Real-Time Glottis Detection Framework via Spatial-decoupled Feature Learning for Nasal Transnasal Intubation
- Title(参考訳): 鼻腔内挿管のための空間分離型特徴学習によるリアルタイム喉頭検出フレームワーク
- Authors: Jinyu Liu, Gaoyang Zhang, Yang Zhou, Ruoyi Hao, Yang Zhang, Hongliang Ren,
- Abstract要約: 組込みデバイスとエッジデバイスのための軽量かつ効率的なグロッティ検出フレームワークであるMobile GlottisNetを提案する。
このモデルには構造的認識と空間的アライメント機構が含まれており、複雑な解剖学的および視覚的条件下でのロバストな声門局在を可能にする。
実験の結果,PIDデータセットと臨床データセットの両方で5MB程度の大きさのモデルでは,デバイス上で62FPS以上,エッジプラットフォーム上で33FPS以上の推論速度が得られた。
- 参考スコア(独自算出の注目度): 13.846515413602722
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Nasotracheal intubation (NTI) is a vital procedure in emergency airway management, where rapid and accurate glottis detection is essential to ensure patient safety. However, existing machine assisted visual detection systems often rely on high performance computational resources and suffer from significant inference delays, which limits their applicability in time critical and resource constrained scenarios. To overcome these limitations, we propose Mobile GlottisNet, a lightweight and efficient glottis detection framework designed for real time inference on embedded and edge devices. The model incorporates structural awareness and spatial alignment mechanisms, enabling robust glottis localization under complex anatomical and visual conditions. We implement a hierarchical dynamic thresholding strategy to enhance sample assignment, and introduce an adaptive feature decoupling module based on deformable convolution to support dynamic spatial reconstruction. A cross layer dynamic weighting scheme further facilitates the fusion of semantic and detail features across multiple scales. Experimental results demonstrate that the model, with a size of only 5MB on both our PID dataset and Clinical datasets, achieves inference speeds of over 62 FPS on devices and 33 FPS on edge platforms, showing great potential in the application of emergency NTI.
- Abstract(参考訳): 鼻気管挿管(Nasotracheal Intubation, NTI)は, 緊急気道管理において重要な処置であり, 患者の安全を確保するために, 迅速かつ正確な声門検出が不可欠である。
しかし、既存の機械支援視覚検出システムは、しばしば高性能な計算資源に依存し、大きな推論遅延に悩まされ、時間的クリティカルかつリソース制約のあるシナリオにおける適用性が制限される。
これらの制限を克服するために,組込みデバイスとエッジデバイスでリアルタイムに推論できる軽量かつ効率的なグロッティ検出フレームワークであるMobile GlottisNetを提案する。
このモデルには構造的認識と空間的アライメント機構が含まれており、複雑な解剖学的および視覚的条件下でのロバストな声門局在を可能にする。
また, 動的空間再構成を支援するために, 変形可能な畳み込みに基づく適応的特徴分離モジュールを導入する。
クロス層動的重み付けスキームは、複数のスケールにわたる意味的特徴と詳細特徴の融合をさらに促進する。
実験の結果,PIDデータセットと臨床データセットの両方で5MB程度の大きさのモデルでは,デバイス上で62FPS以上,エッジプラットフォーム上で33FPS以上の推論速度が達成され,緊急NTIの適用の可能性が大きく示された。
関連論文リスト
- DAV-GSWT: Diffusion-Active-View Sampling for Data-Efficient Gaussian Splatting Wang Tiles [9.641815204004823]
3D Gaussian Splattingは、フォトリアリスティックなニューラルレンダリングの機能を再定義した。
DAV-GSWTは拡散先行とアクティブビューサンプリングを活用して高忠実度Wang Tilesを合成するフレームワークである。
本システムは,大規模仮想環境に必要な視覚的整合性と対話的性能を維持しつつ,必要なデータ量を大幅に削減する。
論文 参考訳(メタデータ) (2026-02-17T04:47:39Z) - Time-Vertex Machine Learning for Optimal Sensor Placement in Temporal Graph Signals: Applications in Structural Health Monitoring [17.858977538517212]
構造的健康モニタリング(SHM)は、インフラの安全性とレジリエンスを維持する上で重要な役割を担っている。
我々は,解釈可能かつ効率的なセンサ配置を実現するために,TVML(Time-Vertex Machine Learning)を提案する。
論文 参考訳(メタデータ) (2025-12-22T11:59:47Z) - FAIM: Frequency-Aware Interactive Mamba for Time Series Classification [87.84511960413715]
時系列分類(TSC)は、環境モニタリング、診断、姿勢認識など、多くの実世界の応用において重要である。
本稿では,周波数対応対話型マンバモデルであるFAIMを提案する。
FAIMは既存の最先端(SOTA)手法を一貫して上回り、精度と効率のトレードオフが優れていることを示す。
論文 参考訳(メタデータ) (2025-11-26T08:36:33Z) - RT-DETRv4: Painlessly Furthering Real-Time Object Detection with Vision Foundation Models [48.91205564876609]
軽量物体検出器の高効率化を目的とした,コスト効率・高適合性蒸留フレームワークを提案する。
当社のアプローチは、さまざまなDETRベースのモデルに対して、目立って一貫したパフォーマンス向上を実現しています。
我々の新しいモデルファミリーRT-DETRv4はCOCOの最先端結果を達成し、APスコアは49.7/53.5/55.4/57.0で、対応する速度は273/169/124/78 FPSである。
論文 参考訳(メタデータ) (2025-10-29T08:13:17Z) - Artificial Intelligence-Based Multiscale Temporal Modeling for Anomaly Detection in Cloud Services [10.421371572062595]
本研究では,マルチスケール特徴認識を統合したTransformerアーキテクチャに基づく異常検出手法を提案する。
提案手法は,精度,リコール,AUC,F1スコアなどの主要な指標において,主流のベースラインモデルより優れている。
論文 参考訳(メタデータ) (2025-08-20T07:52:36Z) - FreSca: Scaling in Frequency Space Enhances Diffusion Models [55.75504192166779]
本稿では,潜時拡散モデルにおける周波数制御について検討する。
本稿では,低周波成分と高周波成分にノイズ差を分解する新しいフレームワークFreScaを紹介する。
FreScaはモデルの再トレーニングやアーキテクチャの変更なしに動作し、モデルとタスクに依存しない制御を提供する。
論文 参考訳(メタデータ) (2025-04-02T22:03:11Z) - DA-Flow: Dual Attention Normalizing Flow for Skeleton-based Video Anomaly Detection [52.74152717667157]
本稿では,DAM(Dual Attention Module)と呼ばれる軽量モジュールを提案する。
フレームアテンション機構を使用して、最も重要なフレームを識別し、スケルトンアテンション機構を使用して、最小パラメータとフロップで固定されたパーティション間の広範な関係をキャプチャする。
論文 参考訳(メタデータ) (2024-06-05T06:18:03Z) - D$^2$ST-Adapter: Disentangled-and-Deformable Spatio-Temporal Adapter for Few-shot Action Recognition [64.153799533257]
D$2$ST-Adapterは、空間的特徴と時間的特徴の非絡み合いの符号化を可能にする内部のデュアルパスアーキテクチャで構成されている。
本手法は,時間的ダイナミクスが行動認識に不可欠である難易度シナリオに特に適している。
論文 参考訳(メタデータ) (2023-12-03T15:40:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。