論文の概要: UltraUNet: Real-Time Ultrasound Tongue Segmentation for Diverse Linguistic and Imaging Conditions
- arxiv url: http://arxiv.org/abs/2509.23225v1
- Date: Sat, 27 Sep 2025 10:11:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-30 22:32:19.110397
- Title: UltraUNet: Real-Time Ultrasound Tongue Segmentation for Diverse Linguistic and Imaging Conditions
- Title(参考訳): UltraUNet:多言語・画像用リアルタイム超音波舌分割法
- Authors: Alisher Myrgyyassov, Zhen Song, Yu Sun, Bruce Xiao Wang, Min Ney Wong, Yongping Zheng,
- Abstract要約: UltraUNetは、リアルタイム舌輪郭分割に最適化された軽量エンコーダデコーダアーキテクチャである。
毎秒250フレームを実現し、デノナイジングやブラーシミュレーションなどの超音波特有の拡張を統合している。
- 参考スコア(独自算出の注目度): 6.292752302827303
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Ultrasound tongue imaging (UTI) is a non-invasive and cost-effective tool for studying speech articulation, motor control, and related disorders. However, real-time tongue contour segmentation remains challenging due to low signal-to-noise ratios, imaging variability, and computational demands. We propose UltraUNet, a lightweight encoder-decoder architecture optimized for real-time segmentation of tongue contours in ultrasound images. UltraUNet incorporates domain-specific innovations such as lightweight Squeeze-and-Excitation blocks, Group Normalization for small-batch stability, and summation-based skip connections to reduce memory and computational overhead. It achieves 250 frames per second and integrates ultrasound-specific augmentations like denoising and blur simulation. Evaluations on 8 datasets demonstrate high accuracy and robustness, with single-dataset Dice = 0.855 and MSD = 0.993px, and cross-dataset Dice averaging 0.734 and 0.761. UltraUNet provides a fast, accurate solution for speech research, clinical diagnostics, and analysis of speech motor disorders.
- Abstract(参考訳): 超音波舌画像(UTI)は、音声の調音、運動制御、および関連する疾患を研究するための非侵襲的で費用対効果の高いツールである。
しかし、低信号対雑音比、画像の可変性、計算要求により、リアルタイム舌輪郭区分けは依然として困難である。
超音波画像における舌輪郭のリアルタイムセグメンテーションに最適化された軽量エンコーダデコーダアーキテクチャであるUltraUNetを提案する。
UltraUNetは、軽量なSqueeze-and-Excitationブロック、小バッチ安定性のためのグループ正規化、メモリと計算オーバーヘッドを減らすために要約ベースのスキップ接続などのドメイン固有のイノベーションを取り入れている。
毎秒250フレームを実現し、デノナイジングやブラーシミュレーションなどの超音波特有の拡張を統合している。
8つのデータセットに対する評価は、シングルデータセットDice = 0.855 と MSD = 0.993px と、平均 0.734 と 0.761 のクロスデータセットDice の精度と堅牢性を示している。
UltraUNetは、音声研究、臨床診断、および音声運動障害の分析のための高速で正確なソリューションを提供する。
関連論文リスト
- UltraUPConvNet: A UPerNet- and ConvNeXt-Based Multi-Task Network for Ultrasound Tissue Segmentation and Disease Prediction [3.594242421630227]
超音波画像分類とセグメンテーションの両方のための普遍的なフレームワークであるUltraUPConvNetを紹介する。
本モデルは,計算オーバーヘッドの少ない特定のデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2025-09-14T05:51:58Z) - Advancing Chronic Tuberculosis Diagnostics Using Vision-Language Models: A Multi modal Framework for Precision Analysis [0.0]
本研究では,自動結核検診(TB)を強化するビジョン・ランゲージ・モデル(VLM)を提案する。
胸部X線画像と臨床データを統合することにより,手動による解釈の課題に対処する。
このモデルでは、重要な慢性TBの病態を検出するための高精度(44%)とリコール(44%)が示された。
論文 参考訳(メタデータ) (2025-03-17T13:49:29Z) - SAS: Segment Anything Small for Ultrasound -- A Non-Generative Data Augmentation Technique for Robust Deep Learning in Ultrasound Imaging [1.0485739694839666]
Segment Anything Small (SAS) は、シンプルだが効果的なスケールとテクスチャ対応のデータ拡張技術である。
SASは超音波画像中の小さな解剖構造をセグメント化するためのディープラーニングモデルの性能を向上させる。
論文 参考訳(メタデータ) (2025-03-07T20:24:35Z) - A Unified Model for Compressed Sensing MRI Across Undersampling Patterns [69.19631302047569]
様々な計測アンサンプパターンと画像解像度に頑健な統合MRI再構成モデルを提案する。
我々のモデルは、拡散法よりも600$times$高速な推論で、最先端CNN(End-to-End VarNet)の4dBでSSIMを11%改善し、PSNRを4dB改善する。
論文 参考訳(メタデータ) (2024-10-05T20:03:57Z) - Towards a Benchmark for Colorectal Cancer Segmentation in Endorectal Ultrasound Videos: Dataset and Model Development [59.74920439478643]
本稿では,多様なERUSシナリオをカバーする最初のベンチマークデータセットを収集し,注釈付けする。
ERUS-10Kデータセットは77の動画と10,000の高解像度アノテートフレームで構成されています。
本稿では,ASTR (Adaptive Sparse-context TRansformer) という大腸癌セグメンテーションのベンチマークモデルを提案する。
論文 参考訳(メタデータ) (2024-08-19T15:04:42Z) - CathFlow: Self-Supervised Segmentation of Catheters in Interventional Ultrasound Using Optical Flow and Transformers [66.15847237150909]
縦型超音波画像におけるカテーテルのセグメンテーションのための自己教師型ディープラーニングアーキテクチャを提案する。
ネットワークアーキテクチャは、Attention in Attentionメカニズムで構築されたセグメンテーショントランスフォーマであるAiAReSeg上に構築されている。
我々は,シリコンオルタファントムから収集した合成データと画像からなる実験データセット上で,我々のモデルを検証した。
論文 参考訳(メタデータ) (2024-03-21T15:13:36Z) - WATUNet: A Deep Neural Network for Segmentation of Volumetric Sweep
Imaging Ultrasound [1.2903292694072621]
ボリューム・スイープ・イメージング(VSI)は、訓練を受けていないオペレーターが高品質な超音波画像をキャプチャできる革新的な手法である。
本稿ではWavelet_Attention_UNet(WATUNet)と呼ばれる新しいセグメンテーションモデルを提案する。
このモデルでは、簡単な接続ではなく、ウェーブレットゲート(WG)とアテンションゲート(AG)をエンコーダとデコーダの間に組み込んで、上記の制限を克服する。
論文 参考訳(メタデータ) (2023-11-17T20:32:37Z) - Weakly-supervised Learning For Catheter Segmentation in 3D Frustum
Ultrasound [74.22397862400177]
超音波を用いた新しいカテーテルセグメンテーション法を提案する。
提案手法は,1ボリュームあたり0.25秒の効率で最先端の性能を実現した。
論文 参考訳(メタデータ) (2020-10-19T13:56:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。