論文の概要: Automated pharyngeal phase detection and bolus localization in
videofluoroscopic swallowing study: Killing two birds with one stone?
- arxiv url: http://arxiv.org/abs/2111.04699v1
- Date: Mon, 8 Nov 2021 18:25:01 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-09 17:11:37.961993
- Title: Automated pharyngeal phase detection and bolus localization in
videofluoroscopic swallowing study: Killing two birds with one stone?
- Title(参考訳): ビデオフルオロスコピックドローイング研究における咽頭位相自動検出と骨の局在:石で2羽の鳥を殺すか?
- Authors: Andrea Bandini, Sana Smaoui, Catriona M. Steele
- Abstract要約: ビデオフルオロスコープドローイング研究(VFSS)は、ドローイングを評価するための金標準イメージング技術である。
研究者は、摂食の咽頭相を自動的に検出できることを実証した。
本稿では,咽頭位相検出と骨の局在化に弱い教師付きで取り組むディープラーニングフレームワークを提案する。
- 参考スコア(独自算出の注目度): 1.4337588659482519
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The videofluoroscopic swallowing study (VFSS) is a gold-standard imaging
technique for assessing swallowing, but analysis and rating of VFSS recordings
is time consuming and requires specialized training and expertise. Researchers
have demonstrated that it is possible to automatically detect the pharyngeal
phase of swallowing and to localize the bolus in VFSS recordings via computer
vision approaches, fostering the development of novel techniques for automatic
VFSS analysis. However, training of algorithms to perform these tasks requires
large amounts of annotated data that are seldom available. We demonstrate that
the challenges of pharyngeal phase detection and bolus localization can be
solved together using a single approach. We propose a deep-learning framework
that jointly tackles pharyngeal phase detection and bolus localization in a
weakly-supervised manner, requiring only the initial and final frames of the
pharyngeal phase as ground truth annotations for the training. Our approach
stems from the observation that bolus presence in the pharynx is the most
prominent visual feature upon which to infer whether individual VFSS frames
belong to the pharyngeal phase. We conducted extensive experiments with
multiple convolutional neural networks (CNNs) on a dataset of 1245 VFSS clips
from 59 healthy subjects. We demonstrated that the pharyngeal phase can be
detected with an F1-score higher than 0.9. Moreover, by processing the class
activation maps of the CNNs, we were able to localize the bolus with promising
results, obtaining correlations with ground truth trajectories higher than 0.9,
without any manual annotations of bolus location used for training purposes.
Once validated on a larger sample of participants with swallowing disorders,
our framework will pave the way for the development of intelligent tools for
VFSS analysis to support clinicians in swallowing assessment.
- Abstract(参考訳): ビデオフルオロスコピックドローイング研究(VFSS)は、ドローイングを評価するための金標準イメージング技術であるが、VFSS記録の分析と評価には時間がかかり、専門的な訓練と専門知識が必要である。
研究者らは、吸入の咽頭相を自動的に検出し、コンピュータビジョンアプローチによるVFSS記録のボーラスを局在させることで、自動VFSS分析のための新しい技術の開発を促進することができることを示した。
しかし、これらのタスクを実行するアルゴリズムのトレーニングには、ほとんど利用できない大量の注釈付きデータが必要である。
咽頭位相検出と骨の局在化の課題は, 一つのアプローチで同時に解決できることを実証した。
本稿では, 咽頭位相検出と骨の局所化を弱教師付きで共同で行う深層学習フレームワークを提案し, 訓練の真理アノテーションとして咽頭位相の初期および最終フレームのみを必要とする。
我々のアプローチは、咽頭に骨が存在することが最も顕著な視覚的特徴であり、個々のVFSSフレームが咽頭相に属しているかどうかを推測することに由来する。
健常者59名の1245vfssクリップのデータセット上で,複数の畳み込みニューラルネットワーク(cnns)を用いた広範囲な実験を行った。
咽頭相はf1-scoreが0.9以上の値で検出できることを示した。
さらに,CNNのクラスアクティベーションマップを処理することにより,トレーニング目的に使用するボーラス位置のマニュアルアノテーションを使わずに,有望な結果でボラスをローカライズし,0.9以上の真理軌道との相関関係を得ることができた。
摂食障害患者のより大きなサンプルで検証を行えば,VFSS分析のためのインテリジェントなツールを開発するための枠組みが整備され,臨床医の摂食評価を支援する。
関連論文リスト
- Vascular Segmentation of Functional Ultrasound Images using Deep Learning [0.0]
機能的超音波(fUS)画像のための,最初のディープラーニングベースセグメンテーションツールを紹介する。
競合セグメンテーション性能を90%の精度で達成し、71%の堅牢性と0.59のIUをfUSスタックから100フレームの時間フレームで実現した。
この研究は、ローカライゼーション顕微鏡に代わる非侵襲的で費用効果の高い代替手段を提供し、fUSデータの解釈を強化し、血管機能の理解を改善している。
論文 参考訳(メタデータ) (2024-10-28T09:00:28Z) - Bifurcation Identification for Ultrasound-driven Robotic Cannulation [11.50984693836901]
外傷や重篤なケアでは、迅速かつ正確な血管内アクセスが患者の生存の鍵となる。
血管分岐(英: Vessel bifurcations)は、医療処置中のカテーテルや針の安全な配置をガイドする解剖学的ランドマークである。
超音波画像を用いて血管分岐を自律的に抽出するアルゴリズムは存在しない。
本稿では,血管分岐を同定し,自律型ロボット缶詰システムに最適な針挿入部位を提供する新しいアルゴリズムであるBIFURCを紹介する。
論文 参考訳(メタデータ) (2024-09-10T18:53:52Z) - Dr-LLaVA: Visual Instruction Tuning with Symbolic Clinical Grounding [53.629132242389716]
VLM(Vision-Language Models)は、医用画像を分析し、自然言語の相互作用に関与することによって、臨床医を支援する。
VLMはしばしば「幻覚的」な振る舞いを示し、文脈的マルチモーダル情報に基づかないテキスト出力を生成する。
本稿では,臨床推論の象徴的表現を用いて医療知識にVLMを基盤とする新たなアライメントアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-05-29T23:19:28Z) - CathFlow: Self-Supervised Segmentation of Catheters in Interventional Ultrasound Using Optical Flow and Transformers [66.15847237150909]
縦型超音波画像におけるカテーテルのセグメンテーションのための自己教師型ディープラーニングアーキテクチャを提案する。
ネットワークアーキテクチャは、Attention in Attentionメカニズムで構築されたセグメンテーショントランスフォーマであるAiAReSeg上に構築されている。
我々は,シリコンオルタファントムから収集した合成データと画像からなる実験データセット上で,我々のモデルを検証した。
論文 参考訳(メタデータ) (2024-03-21T15:13:36Z) - Stethoscope-guided Supervised Contrastive Learning for Cross-domain
Adaptation on Respiratory Sound Classification [1.690115983364313]
本稿では、ソースドメインから異なるターゲットドメインに知識を転送するクロスドメイン適応手法を提案する。
特に、個々の領域として異なる聴診器タイプを考慮し、新しい聴診器誘導型教師付きコントラスト学習手法を提案する。
ICBHIデータセットの実験結果から,提案手法はドメイン依存性の低減とICBHIスコア61.71%の達成に有効であることが示された。
論文 参考訳(メタデータ) (2023-12-15T08:34:31Z) - Domain Adaptive Synapse Detection with Weak Point Annotations [63.97144211520869]
弱点アノテーションを用いたドメイン適応型シナプス検出のためのフレームワークであるAdaSynを提案する。
I SBI 2023のWASPSYNチャレンジでは、我々の手法が第1位にランクインした。
論文 参考訳(メタデータ) (2023-08-31T05:05:53Z) - Deep denoising autoencoder-based non-invasive blood flow detection for
arteriovenous fistula [10.030431512848239]
本稿では,DAE(Deep Denoising Autoencoder)に基づく次元削減と再構成作業を行う手法を提案する。
以上の結果から,DAEが生み出す潜伏表現は0.93の精度で予測を上回った。
ノイズ・ミキシングの導入とノイズ・トゥ・クリーン・スキームの利用により、潜在表現の識別能力が効果的に向上する。
論文 参考訳(メタデータ) (2023-06-12T04:46:01Z) - Tissue Classification During Needle Insertion Using Self-Supervised
Contrastive Learning and Optical Coherence Tomography [53.38589633687604]
針先端で取得した複雑なCT信号の位相および強度データから組織を分類するディープニューラルネットワークを提案する。
トレーニングセットの10%で、提案した事前学習戦略により、モデルが0.84のF1スコアを達成するのに対して、モデルが0.60のF1スコアを得るのに対して、モデルが0.84のF1スコアを得るのに役立ちます。
論文 参考訳(メタデータ) (2023-04-26T14:11:04Z) - Attend Who is Weak: Pruning-assisted Medical Image Localization under
Sophisticated and Implicit Imbalances [102.68466217374655]
ディープニューラルネットワーク(DNN)は、医療画像理解タスクのテキストファクト選択として急速に普及している。
本稿では,プルーニングを用いてテキスト・ハード・トゥ・ラーン(HTL)学習サンプルを自動かつ適応的に識別する手法を提案する。
また、HTLが複雑な人口動態の不均衡を捉える能力を示す興味深い統計分析も提示する。
論文 参考訳(メタデータ) (2022-12-06T00:32:03Z) - CovidDeep: SARS-CoV-2/COVID-19 Test Based on Wearable Medical Sensors
and Efficient Neural Networks [51.589769497681175]
新型コロナウイルス(SARS-CoV-2)がパンデミックを引き起こしている。
SARS-CoV-2の逆転写-ポリメラーゼ連鎖反応に基づく現在の試験体制は、試験要求に追いついていない。
我々は,効率的なDNNと市販のWMSを組み合わせたCovidDeepというフレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-20T21:47:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。