論文の概要: Machine Learning-Assisted Vocal Cord Ultrasound Examination: Project VIPR
- arxiv url: http://arxiv.org/abs/2512.23177v1
- Date: Mon, 29 Dec 2025 03:35:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-30 22:37:30.395741
- Title: Machine Learning-Assisted Vocal Cord Ultrasound Examination: Project VIPR
- Title(参考訳): 機械学習による声帯超音波検査:Project VIPR
- Authors: Will Sebelik-Lassiter, Evan Schubert, Muhammad Alliyu, Quentin Robbins, Excel Olatunji, Mustafa Barry,
- Abstract要約: 声帯超音波 (VCUS) は, より侵襲性が高く, 許容度も高い検査技術として出現しているが, その精度は操作者に依存している。
本研究の目的は、音声コードを自動的に識別し、正常な声帯画像と声帯麻痺を区別する機械学習支援アルゴリズムを適用することである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Intro: Vocal cord ultrasound (VCUS) has emerged as a less invasive and better tolerated examination technique, but its accuracy is operator dependent. This research aims to apply a machine learning-assisted algorithm to automatically identify the vocal cords and distinguish normal vocal cord images from vocal cord paralysis (VCP). Methods: VCUS videos were acquired from 30 volunteers, which were split into still frames and cropped to a uniform size. Healthy and simulated VCP images were used as training data for vocal cord segmentation and VCP classification models. Results: The vocal cord segmentation model achieved a validation accuracy of 96%, while the best classification model (VIPRnet) achieved a validation accuracy of 99%. Conclusion: Machine learning-assisted analysis of VCUS shows great promise in improving diagnostic accuracy over operator-dependent human interpretation.
- Abstract(参考訳): Intro: 声帯超音波(VCUS)は, 侵襲性が低く, 許容度が高い検査技術として登場したが, その精度は操作者に依存している。
本研究の目的は、音声コードを自動的に識別し、正常な声帯画像と声帯麻痺(VCP)を区別する機械学習支援アルゴリズムを適用することである。
方法:VCUSビデオは30人のボランティアから取得され、静止フレームに分割され、均一なサイズに収穫された。
声帯分類モデルとVCP分類モデルの訓練データとして,健康的,シミュレーション的なVCP画像を用いた。
結果: 声帯分節モデルの検証精度は96%, 最高の分類モデル (VIPRnet) は99%であった。
結論: 機械学習によるVCUSの分析は,操作者に依存した人間の解釈よりも,診断精度を向上させる上で非常に有望である。
関連論文リスト
- PRECISE-AS: Personalized Reinforcement Learning for Efficient Point-of-Care Echocardiography in Aortic Stenosis Diagnosis [6.276251898178271]
大動脈狭窄 (Aortic stenosis, AS) は、大動脈弁が狭くなり、血流が低下することによる生命維持状態である。
心エコー検査(echo)へのアクセスは、特に農村部や低地部において、資源の制約により制限されることが多い。
本稿では,患者の最も情報性の高いエコー映像を動的に選択する強化学習(RL)によるアクティブビデオ取得フレームワークを提案する。
論文 参考訳(メタデータ) (2025-09-02T23:47:43Z) - Automating Sonologists USG Commands with AI and Voice Interface [0.0]
本研究は, リアルタイム画像処理, 臓器追跡, 音声コマンドを組み込んだ, 高度なAIを用いた超音波イメージングシステムを提案する。
この革新的な解決策の目標は、ソノロジーにより予測可能で生産的な画像処理を提供することである。
論文 参考訳(メタデータ) (2024-11-20T03:03:49Z) - Multimodal Laryngoscopic Video Analysis for Assisted Diagnosis of Vocal Fold Paralysis [9.530028450239394]
本システムは,映像と音声データの両方を解析するための音声キーワードスポッティング手法と,映像に基づく声門検出を統合している。
事前訓練されたオーディオエンコーダを使用して、患者の音声を符号化し、オーディオ機能を取得する。
左右両方の声帯の角度偏差を,分割した声門マスク上の推定声門正中線に測定することにより,視覚的特徴が生成される。
論文 参考訳(メタデータ) (2024-09-05T14:56:38Z) - Show from Tell: Audio-Visual Modelling in Clinical Settings [58.88175583465277]
臨床環境でのオーディオ・ビジュアル・モデリングを考察し、人間の専門的アノテーションを使わずに医学的表現を学習するためのソリューションを提供する。
この目的のために, 単純かつ効果的なマルチモーダル自己教師型学習フレームワークを提案する。
提案手法は,音声のみを基準として,超音波画像中の解剖学的関心領域をローカライズすることができる。
論文 参考訳(メタデータ) (2023-10-25T08:55:48Z) - Anomalous Sound Detection using Audio Representation with Machine ID
based Contrastive Learning Pretraining [52.191658157204856]
コントラスト学習を用いて、各音声サンプルではなく、各機械IDの音声表現を洗練する。
提案手法では、コントラスト学習を用いて音声表現モデルを事前学習する。
実験の結果,本手法はコントラスト学習や自己教師型分類を用いて最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2023-04-07T11:08:31Z) - Transfer Learning Based Diagnosis and Analysis of Lung Sound Aberrations [0.35232085374661276]
本研究は、聴診器と音声記録ソフトウェアによって得られた呼吸音を非侵襲的に識別する手法を開発することを目的とする。
各オーディオサンプルの視覚的表現が構築され、視覚を効果的に記述するために使用されるような方法を用いて、分類のためのリソース識別が可能である。
呼吸音響データベースは、95%の精度、88%の精度、86%のリコールスコア、81%のF1スコアを含む最先端の結果を得た。
論文 参考訳(メタデータ) (2023-03-15T04:46:57Z) - Utilizing synthetic training data for the supervised classification of
rat ultrasonic vocalizations [0.0]
ミューリンは120kHzの周波数で超音波発声(USV)を発生させる。
これらの呼び出しは社会的行動において重要であるため、その分析は声道コミュニケーションの機能とその機能に関する洞察を与えることができる。
我々は、ラットのUSVを含むオーディオにおいて、訓練された人間の2つの畳み込みニューラルネットワーク(CNN)、DeepSqueak、VocalMatの検出と分類性能を比較した。
論文 参考訳(メタデータ) (2023-03-03T03:17:45Z) - Self-supervised contrastive learning of echocardiogram videos enables
label-efficient cardiac disease diagnosis [48.64462717254158]
心エコービデオを用いた自己教師型コントラスト学習手法であるエコーCLRを開発した。
左室肥大症 (LVH) と大動脈狭窄症 (AS) の分類成績は,EchoCLR の訓練により有意に改善した。
EchoCLRは、医療ビデオの表現を学習する能力に特有であり、SSLがラベル付きデータセットからラベル効率の高い疾患分類を可能にすることを実証している。
論文 参考訳(メタデータ) (2022-07-23T19:17:26Z) - DiffSVC: A Diffusion Probabilistic Model for Singing Voice Conversion [51.83469048737548]
本稿では拡散確率モデルに基づくSVCシステムであるDiffSVCを提案する。
DiffSVCでは、破壊されたメルスペクトログラムとその対応するステップ情報を入力として、付加されたガウスノイズを予測するデノナイジングモジュールを訓練する。
実験により、DiffSVCは、現在の最先端SVCアプローチと自然性および音声類似性の観点から、優れた変換性能が得られることが示された。
論文 参考訳(メタデータ) (2021-05-28T14:26:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。