論文の概要: Automating Sonologists USG Commands with AI and Voice Interface
- arxiv url: http://arxiv.org/abs/2411.13006v1
- Date: Wed, 20 Nov 2024 03:03:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-21 16:12:50.636391
- Title: Automating Sonologists USG Commands with AI and Voice Interface
- Title(参考訳): AIと音声インタフェースによる音響学のUSGコマンドの自動化
- Authors: Emad Mohamed, Shruti Tiwari, Sheena Christabel Pravin,
- Abstract要約: 本研究は, リアルタイム画像処理, 臓器追跡, 音声コマンドを組み込んだ, 高度なAIを用いた超音波イメージングシステムを提案する。
この革新的な解決策の目標は、ソノロジーにより予測可能で生産的な画像処理を提供することである。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: This research presents an advanced AI-powered ultrasound imaging system that incorporates real-time image processing, organ tracking, and voice commands to enhance the efficiency and accuracy of diagnoses in clinical practice. Traditional ultrasound diagnostics often require significant time and introduce a degree of subjectivity due to user interaction. The goal of this innovative solution is to provide Sonologists with a more predictable and productive imaging procedure utilizing artificial intelligence, computer vision, and voice technology. The functionality of the system employs computer vision and deep learning algorithms, specifically adopting the Mask R-CNN model from Detectron2 for semantic segmentation of organs and key landmarks. This automation improves diagnostic accuracy by enabling the extraction of valuable information with minimal human input. Additionally, it includes a voice recognition feature that allows for hands-free operation, enabling users to control the system with commands such as freeze or liver, all while maintaining their focus on the patient. The architecture comprises video processing and real-time segmentation modules that prepare the system to perform essential imaging functions, such as freezing and zooming in on frames. The liver histopathology module, optimized for detecting fibrosis, achieved an impressive accuracy of 98.6%. Furthermore, the organ segmentation module produces output confidence levels between 50% and 95%, demonstrating its efficacy in organ detection.
- Abstract(参考訳): 本研究は, リアルタイム画像処理, 臓器追跡, 音声コマンドを取り入れ, 臨床診断の効率と精度を高めるAIを用いた超音波イメージングシステムを提案する。
従来の超音波診断では、かなりの時間を要することが多く、ユーザインタラクションによる主観性の導入も少なくない。
この革新的なソリューションの目標は、人工知能、コンピュータビジョン、音声技術を利用したより予測可能で生産的な画像処理を提供することである。
このシステムの機能はコンピュータビジョンとディープラーニングアルゴリズムを採用しており、特に臓器とキーランドマークのセマンティックセグメンテーションにTectron2のMask R-CNNモデルを採用している。
この自動化は、最小限の人間の入力で貴重な情報の抽出を可能にすることにより、診断精度を向上させる。
さらに音声認識機能もあり、ハンズフリーの操作が可能で、フリーズや肝臓などのコマンドでシステムをコントロールできる。
このアーキテクチャは、ビデオ処理とリアルタイムセグメンテーションモジュールで構成されており、フレーム上で凍結やズームインなどの重要なイメージング機能を実行するためにシステムを準備する。
肝病理組織学的モジュールは線維症検出に最適化され,98.6%の精度が得られた。
さらに、臓器分節モジュールは50%から95%の出力信頼度を産生し、臓器検出におけるその有効性を示す。
関連論文リスト
- Adversarial Neural Networks in Medical Imaging Advancements and Challenges in Semantic Segmentation [6.88255677115486]
人工知能(AI)の最近の進歩は、医療画像のパラダイムシフトを引き起こしている。
本稿では,脳画像のセマンティックセグメンテーションへの深層学習(AIの主分野)の統合を体系的に検討する。
敵対的ニューラルネットワークは、自動化するだけでなく、セマンティックセグメンテーションプロセスを洗練する、新しいAIアプローチである。
論文 参考訳(メタデータ) (2024-10-17T00:05:05Z) - Transforming Surgical Interventions with Embodied Intelligence for Ultrasound Robotics [24.014073238400137]
本稿では,超音波ロボットと大規模言語モデル(LLM)とドメイン固有知識強化を組み合わせた,新しい超音波身体情報システムを提案する。
まず、LLMを超音波ロボットと統合して、医師の言葉による指示を正確に動作計画に解釈する。
以上の結果から,提案システムは超音波スキャンの効率と品質を向上し,自律型医療スキャン技術のさらなる進歩の道を開くことが示唆された。
論文 参考訳(メタデータ) (2024-06-18T14:22:16Z) - CathFlow: Self-Supervised Segmentation of Catheters in Interventional Ultrasound Using Optical Flow and Transformers [66.15847237150909]
縦型超音波画像におけるカテーテルのセグメンテーションのための自己教師型ディープラーニングアーキテクチャを提案する。
ネットワークアーキテクチャは、Attention in Attentionメカニズムで構築されたセグメンテーショントランスフォーマであるAiAReSeg上に構築されている。
我々は,シリコンオルタファントムから収集した合成データと画像からなる実験データセット上で,我々のモデルを検証した。
論文 参考訳(メタデータ) (2024-03-21T15:13:36Z) - LOTUS: Learning to Optimize Task-based US representations [39.81131738128329]
超音波画像における臓器の解剖学的セグメンテーションは多くの臨床応用に不可欠である。
既存のディープニューラルネットワークは、臨床的に許容できるパフォーマンスを達成するために、トレーニングのために大量のラベル付きデータを必要とする。
本稿では,タスクベース超音速画像表現を最適化する学習手法を提案する。
論文 参考訳(メタデータ) (2023-07-29T16:29:39Z) - TUNeS: A Temporal U-Net with Self-Attention for Video-based Surgical Phase Recognition [1.5237530964650965]
畳み込み型U-Net構造のコアに自己アテンションを組み込んだ,効率的かつシンプルな時間モデルTUNeSを提案する。
実験では, ほぼすべての時間モデルが, より長い時間的文脈で訓練された特徴抽出器上でより優れた性能を示した。
論文 参考訳(メタデータ) (2023-07-19T14:10:55Z) - Robotic Navigation Autonomy for Subretinal Injection via Intelligent
Real-Time Virtual iOCT Volume Slicing [88.99939660183881]
網膜下注射のための自律型ロボットナビゲーションの枠組みを提案する。
提案手法は,機器のポーズ推定方法,ロボットとi OCTシステム間のオンライン登録,およびインジェクションターゲットへのナビゲーションに適した軌道計画から構成される。
ブタ前眼の精度と再現性について実験を行った。
論文 参考訳(メタデータ) (2023-01-17T21:41:21Z) - Voice-assisted Image Labelling for Endoscopic Ultrasound Classification
using Neural Networks [48.732863591145964]
本稿では,臨床医が提示した生音声からのEUS画像にラベルを付けるマルチモーダル畳み込みニューラルネットワークアーキテクチャを提案する。
その結果,5つのラベルを持つデータセットにおいて,画像レベルでの予測精度は76%であった。
論文 参考訳(メタデータ) (2021-10-12T21:22:24Z) - Deep Learning for Ultrasound Beamforming [120.12255978513912]
受信した超音波エコーを空間画像領域にマッピングするビームフォーミングは、超音波画像形成チェーンの心臓に位置する。
現代の超音波イメージングは、強力なデジタル受信チャネル処理の革新に大きく依存している。
ディープラーニング手法は、デジタルビームフォーミングパイプラインにおいて魅力的な役割を果たす。
論文 参考訳(メタデータ) (2021-09-23T15:15:21Z) - Deep learning facilitates fully automated brain image registration of
optoacoustic tomography and magnetic resonance imaging [6.9975936496083495]
マルチスペクトル光音響トモグラフィ(Multi-spectral optoacoustic tomography、MSOT)は、歯状脳からの多重分子および機能情報を提供する新しい光学イメージング法である。
磁気共鳴イメージング(MRI)により、優れたソフト・コントラストと高分解能脳解剖学を提供することができる。
マルチモーダル画像の登録は、主にこれらのモダリティによって描画される全く異なる画像コントラストのために、依然として困難である。
本稿では,深層学習によるMSOT-MRIマルチモーダル画像の完全自動登録手法を提案する。
論文 参考訳(メタデータ) (2021-09-04T14:50:44Z) - Improved Speech Emotion Recognition using Transfer Learning and
Spectrogram Augmentation [56.264157127549446]
音声感情認識(SER)は、人間とコンピュータの相互作用において重要な役割を果たす課題である。
SERの主な課題の1つは、データの不足である。
本稿では,スペクトログラム拡張と併用した移動学習戦略を提案する。
論文 参考訳(メタデータ) (2021-08-05T10:39:39Z) - Relational Graph Learning on Visual and Kinematics Embeddings for
Accurate Gesture Recognition in Robotic Surgery [84.73764603474413]
本稿では,マルチモーダルグラフネットワーク(MRG-Net)の新たなオンラインアプローチを提案し,視覚情報とキネマティクス情報を動的に統合する。
本手法の有効性は, JIGSAWSデータセット上での最先端の成果で実証された。
論文 参考訳(メタデータ) (2020-11-03T11:00:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。