論文の概要: End-to-End Framework Integrating Generative AI and Deep Reinforcement Learning for Autonomous Ultrasound Scanning
- arxiv url: http://arxiv.org/abs/2511.00114v1
- Date: Fri, 31 Oct 2025 00:54:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-05 16:37:26.616005
- Title: End-to-End Framework Integrating Generative AI and Deep Reinforcement Learning for Autonomous Ultrasound Scanning
- Title(参考訳): 自動超音波スキャンのための生成AIと深部強化学習を統合したエンドツーエンドフレームワーク
- Authors: Hanae Elmekki, Amanda Spilkin, Ehsan Zakeri, Antonela Mariel Zanuttini, Ahmed Alagha, Hani Sami, Jamal Bentahar, Lyes Kadem, Wen-Fang Xie, Philippe Pibarot, Rabeb Mizouni, Hadi Otrok, Azzam Mourad, Sami Muhaidat,
- Abstract要約: 本稿では、生成型AIとDRLを統合して、自律的かつ再現可能な心臓USスキャンを可能にする、初のエンドツーエンドフレームワークを提案する。
提案するフレームワークは、画像タイプを分類し、品質を評価するエキスパート検証モデルを通じて、AIによるガイダンスを提供する。
- 参考スコア(独自算出の注目度): 18.746846962661433
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Cardiac ultrasound (US) is among the most widely used diagnostic tools in cardiology for assessing heart health, but its effectiveness is limited by operator dependence, time constraints, and human error. The shortage of trained professionals, especially in remote areas, further restricts access. These issues underscore the need for automated solutions that can ensure consistent, and accessible cardiac imaging regardless of operator skill or location. Recent progress in artificial intelligence (AI), especially in deep reinforcement learning (DRL), has gained attention for enabling autonomous decision-making. However, existing DRL-based approaches to cardiac US scanning lack reproducibility, rely on proprietary data, and use simplified models. Motivated by these gaps, we present the first end-to-end framework that integrates generative AI and DRL to enable autonomous and reproducible cardiac US scanning. The framework comprises two components: (i) a conditional generative simulator combining Generative Adversarial Networks (GANs) with Variational Autoencoders (VAEs), that models the cardiac US environment producing realistic action-conditioned images; and (ii) a DRL module that leverages this simulator to learn autonomous, accurate scanning policies. The proposed framework delivers AI-driven guidance through expert-validated models that classify image type and assess quality, supports conditional generation of realistic US images, and establishes a reproducible foundation extendable to other organs. To ensure reproducibility, a publicly available dataset of real cardiac US scans is released. The solution is validated through several experiments. The VAE-GAN is benchmarked against existing GAN variants, with performance assessed using qualitative and quantitative approaches, while the DRL-based scanning system is evaluated under varying configurations to demonstrate effectiveness.
- Abstract(参考訳): 心臓超音波(US)は心臓の健康を評価するために最も広く用いられる診断ツールであるが、その有効性はオペレータ依存、時間制約、ヒューマンエラーによって制限される。
訓練を受けた専門家の不足、特に遠隔地では、アクセスを制限している。
これらの問題は、オペレーターのスキルや位置に関わらず、一貫した、アクセス可能な心臓イメージングを確実にする自動化ソリューションの必要性を浮き彫りにしている。
人工知能(AI)の最近の進歩、特に深層強化学習(DRL)は、自律的な意思決定を可能にするために注目を集めている。
しかし、既存のDRLベースの心臓スキャンアプローチでは再現性がなく、プロプライエタリなデータに依存し、単純化されたモデルを使用する。
これらのギャップに触発され、生成型AIとDRLを統合し、自律的で再現可能な心臓USスキャンを可能にする最初のエンドツーエンドフレームワークを提示する。
フレームワークには2つのコンポーネントがある。
(i)GAN(Generative Adversarial Networks)と変分オートエンコーダ(VAE)を組み合わせた条件付き生成シミュレータで、リアルな行動条件画像を生成する心臓の環境をモデル化する。
(II)このシミュレータを利用して自律的かつ正確なスキャンポリシーを学習するDRLモジュール。
提案フレームワークは、画像タイプを分類し、品質を評価する専門家検証モデルを通じてAIによるガイダンスを提供し、現実的な米国イメージの条件付き生成をサポートし、他の臓器に拡張可能な再現可能な基盤を確立する。
再現性を確保するため、実際の心臓USスキャンのデータセットが公開されている。
この解はいくつかの実験によって検証される。
VAE-GANは既存のGANとベンチマークされ、質的および定量的なアプローチで評価され、DRLベースのスキャンシステムは様々な構成で評価され、有効性を示す。
関連論文リスト
- ReclAIm: A multi-agent framework for degradation-aware performance tuning of medical imaging AI [0.0]
ReclAImは、自律的な監視、評価、微調整が可能なマルチエージェントフレームワークである。
MRI、CT、X線データセット間でモデルの一貫性のあるパフォーマンスをトレーニングし、評価し、維持する。
論文 参考訳(メタデータ) (2025-10-19T21:02:01Z) - A Fully Open and Generalizable Foundation Model for Ultrasound Clinical Applications [77.3888788549565]
一般臨床用超音波基礎モデルであるEchoCareについて紹介する。
我々は、キュレートされた、一般公開された大規模なデータセットであるEchoCareData上で、自己教師付き学習を通じてEchoCareを開発した。
最小限のトレーニングで、EchoCareは10の代表的なベンチマークで最先端の比較モデルを上回っている。
論文 参考訳(メタデータ) (2025-09-15T10:05:31Z) - Design and Validation of a Responsible Artificial Intelligence-based System for the Referral of Diabetic Retinopathy Patients [65.57160385098935]
糖尿病網膜症の早期発見は、視力喪失のリスクを最大95%減少させる可能性がある。
我々は、AIライフサイクル全体にわたる倫理的原則を取り入れた、DRスクリーニングのための責任あるAIシステムであるRAIS-DRを開発した。
当科におけるRAIS-DRをFDA認可のEyeArtシステムと比較した。
論文 参考訳(メタデータ) (2025-08-17T21:54:11Z) - Explainable AI for Collaborative Assessment of 2D/3D Registration Quality [50.65650507103078]
本稿では,2D/3D登録品質検証に特化して訓練された最初の人工知能フレームワークを提案する。
我々の説明可能なAI(XAI)アプローチは、人間のオペレーターに対する情報意思決定を強化することを目的としている。
論文 参考訳(メタデータ) (2025-07-23T15:28:57Z) - AI- Enhanced Stethoscope in Remote Diagnostics for Cardiopulmonary Diseases [0.0]
本研究は, 肺と心臓の状態を同時に診断するためのAIを, 聴診音を用いて統合する, 革新的かつ効率的なモデルを提案する。
すでに高価格のデジタル聴診器と異なり、提案したモデルは低コストの組込みデバイスに展開するよう特に設計されている。
提案モデルでは,MFCCの特徴抽出と工学的手法を用いて,信号が正確な診断のために適切に解析されていることを保証する。
論文 参考訳(メタデータ) (2025-05-18T12:59:15Z) - Retuve: Automated Multi-Modality Analysis of Hip Dysplasia with Open Source AI [35.088124182314075]
ヒップ(DDH)の発達は、時間的介入を妨げる重要な診断上の課題を生じさせる。
これらの制約に対処するため、マルチモーダルDDH分析のためのオープンソースのフレームワークであるRetuveを紹介した。
Retuveはオープンソースの原則に固執することにより、DDH研究における透明性、コラボレーション、アクセシビリティを促進する。
論文 参考訳(メタデータ) (2025-04-08T20:41:21Z) - Generative Diffusion-based Contract Design for Efficient AI Twins Migration in Vehicular Embodied AI Networks [55.15079732226397]
Embodied AIは、サイバースペースと物理空間のギャップを埋める、急速に進歩する分野だ。
VEANETでは、組み込まれたAIツインが車載AIアシスタントとして機能し、自律運転をサポートするさまざまなタスクを実行する。
論文 参考訳(メタデータ) (2024-10-02T02:20:42Z) - RIGID: A Training-free and Model-Agnostic Framework for Robust AI-Generated Image Detection [60.960988614701414]
RIGIDは、堅牢なAI生成画像検出のためのトレーニング不要でモデルに依存しない方法である。
RIGIDは、既存のトレーニングベースおよびトレーニング不要な検出器を著しく上回っている。
論文 参考訳(メタデータ) (2024-05-30T14:49:54Z) - CheXstray: Real-time Multi-Modal Data Concordance for Drift Detection in
Medical Imaging AI [1.359138408203412]
医用画像AIドリフトモニタリングワークフローを構築してテストし、同時代の地上真実なしにデータとモデルドリフトを追跡する。
主な貢献は,(1)VAEおよび領域特異的統計手法を含む医用画像ドリフト検出のための概念実証である。
この研究は、動的医療環境における継続的医療画像AIモデルモニタリングに関連する翻訳ギャップに対処するために重要な意味を持つ。
論文 参考訳(メタデータ) (2022-02-06T18:58:35Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。