論文の概要: Agentic AI for Personalized Physiotherapy: A Multi-Agent Framework for Generative Video Training and Real-Time Pose Correction
- arxiv url: http://arxiv.org/abs/2604.21154v1
- Date: Wed, 22 Apr 2026 23:47:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-24 14:40:06.215427
- Title: Agentic AI for Personalized Physiotherapy: A Multi-Agent Framework for Generative Video Training and Real-Time Pose Correction
- Title(参考訳): パーソナライズされた理学療法のためのエージェントAI:生成ビデオトレーニングとリアルタイムポス補正のためのマルチエージェントフレームワーク
- Authors: Abhishek Dharmaratnakar, Srivaths Ranganathan, Anushree Sinha, Debanshu Das,
- Abstract要約: 本稿では、生成AIとコンピュータビジョンを利用して、遠隔リハビリテーションループを閉じる新しいマルチエージェントシステム(MAS)アーキテクチャを提案する。
本稿では,システムアーキテクチャ,Large Language Models と MediaPipe を用いたプロトタイプパイプラインについて概説し,臨床評価計画を概説する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: At-home physiotherapy compliance remains critically low due to a lack of personalized supervision and dynamic feedback. Existing digital health solutions rely on static, pre-recorded video libraries or generic 3D avatars that fail to account for a patient's specific injury limitations or home environment. In this paper, we propose a novel Multi-Agent System (MAS) architecture that leverages Generative AI and computer vision to close the tele-rehabilitation loop. Our framework consists of four specialized micro-agents: a Clinical Extraction Agent that parses unstructured medical notes into kinematic constraints; a Video Synthesis Agent that utilizes foundational video generation models to create personalized, patient-specific exercise videos; a Vision Processing Agent for real-time pose estimation; and a Diagnostic Feedback Agent that issues corrective instructions. We present the system architecture, detail the prototype pipeline using Large Language Models and MediaPipe, and outline our clinical evaluation plan. This work demonstrates the feasibility of combining generative media with agentic autonomous decision-making to scale personalized patient care safely and effectively.
- Abstract(参考訳): 家庭での理学療法のコンプライアンスは、パーソナライズされた監督と動的なフィードバックが欠如しているため、極めて低いままである。
既存のデジタルヘルスソリューションは、静的で記録されたビデオライブラリや一般的な3Dアバターに依存しており、患者の特定の怪我や家庭環境を考慮できない。
本稿では、生成AIとコンピュータビジョンを利用して遠隔リハビリテーションループを閉じる新しいマルチエージェントシステム(MAS)アーキテクチャを提案する。
本フレームワークは,非構造化医用メモをキネマティック制約に解析する臨床抽出エージェント,個人化された患者固有のエクササイズビデオを作成するための基礎的ビデオ生成モデルを利用するビデオ合成エージェント,リアルタイムポーズ推定のためのビジョン処理エージェント,補正指示を発行する診断フィードバックエージェントの4つの特殊なマイクロエージェントで構成されている。
本稿では,システムアーキテクチャ,Large Language Models と MediaPipe を用いたプロトタイプパイプラインについて概説し,臨床評価計画を概説する。
本研究は、生成メディアとエージェントによる自律的意思決定を組み合わせることで、パーソナライズされた患者ケアを安全かつ効果的にスケールできることを実証する。
関連論文リスト
- Agentic Large Language Models for Training-Free Neuro-Radiological Image Analysis [19.715805184063168]
Agentic AIは新しいソリューションを提供し、本質的な3D処理を必要としない。
自動脳MRI解析のための無トレーニングエージェントパイプラインを提案する。
この結果から,エージェントAIは,訓練や微調整を必要とせず,ツール使用による高次神経・放射線画像解析の課題を解決できることが示唆された。
論文 参考訳(メタデータ) (2026-04-17T22:04:16Z) - EvoClinician: A Self-Evolving Agent for Multi-Turn Medical Diagnosis via Test-Time Evolutionary Learning [72.70291772077738]
エージェントのマルチターン診断能力を評価するためのベンチマークであるMed-Inquireを提案する。
次に、テスト時に効率的な診断戦略を学ぶ自己進化エージェントであるEvoClinicianを紹介する。
実験の結果,EvoClinicianは連続学習ベースラインや,メモリエージェントなどの自己進化エージェントよりも優れていた。
論文 参考訳(メタデータ) (2026-01-30T13:26:18Z) - Lightweight Structured Multimodal Reasoning for Clinical Scene Understanding in Robotics [4.253383204461325]
映像に基づくシーン理解のための軽量なエージェント・マルチモーダル・フレームワークを提案する。
チェーンオブ思考の推論、音声ビジョンの融合、動的ツールの実行をサポートする。
論文 参考訳(メタデータ) (2025-09-26T07:49:49Z) - MedVSR: Medical Video Super-Resolution with Cross State-Space Propagation [63.38824041721275]
低解像度(LR)医療ビデオは、ビデオ超解像度(VSR)モデルに固有の課題を提示する。
本稿では,医療用VSRのためのフレームワークであるMedVSRを提案する。
MedVSRは既存のVSRモデルよりも性能と効率が優れていることを示す。
論文 参考訳(メタデータ) (2025-09-25T14:56:59Z) - Does DINOv3 Set a New Medical Vision Standard? [67.33543059306938]
本報告は、DINOv3が、ドメイン固有の事前トレーニングなしで、医用視覚タスクのための強力な統合エンコーダとして機能するかどうかを考察する。
我々はDINOv3を2D/3D分類やセグメンテーションを含む一般的な医療ビジョンタスクでベンチマークした。
注目すべきは、いくつかのタスクでBiomedCLIPやCT-Netといった医療固有の基礎モデルよりも優れていることだ。
論文 参考訳(メタデータ) (2025-09-08T09:28:57Z) - Q-Former Autoencoder: A Modern Framework for Medical Anomaly Detection [12.245379864678291]
本稿では,最新のオートエンコーダベースのフレームワークであるQ-Former Autoencoderを提案する。
凍結した視覚基盤モデルを特徴抽出器として直接利用し、ドメイン固有の微調整なしでリッチで多段階な高レベル表現を可能にする。
本研究は,視覚基盤モデルエンコーダが自然画像に基づいて事前訓練され,医用画像解析タスクに効果的に応用できる可能性を強調した。
論文 参考訳(メタデータ) (2025-07-24T14:55:33Z) - Learning to Be A Doctor: Searching for Effective Medical Agent Architectures [32.82784216021035]
本稿では,医療エージェントアーキテクチャの自動設計のための新しいフレームワークを紹介する。
自動機械学習(AutoML)の成功に触発され、階層的で表現力のあるエージェント検索空間を定義する。
本フレームワークは,多様な機能ノード型からなるグラフベースのアーキテクチャとして医療エージェントを概念化する。
論文 参考訳(メタデータ) (2025-04-15T15:44:21Z) - Endora: Video Generation Models as Endoscopy Simulators [53.72175969751398]
本稿では,臨床内視鏡シーンをシミュレートする医用ビデオを作成するための革新的な手法であるモデルを紹介する。
また、ビデオ生成モデルを用いた内視鏡シミュレーションのための最初の公開ベンチマークを開拓した。
Endoraは、臨床内視鏡研究のための生成AIの展開において、注目すべきブレークスルーとなる。
論文 参考訳(メタデータ) (2024-03-17T00:51:59Z) - Safe AI for health and beyond -- Monitoring to transform a health
service [51.8524501805308]
機械学習アルゴリズムの出力を監視するために必要なインフラストラクチャを評価する。
モデルのモニタリングと更新の例を示す2つのシナリオを提示します。
論文 参考訳(メタデータ) (2023-03-02T17:27:45Z) - Multimodal Semantic Scene Graphs for Holistic Modeling of Surgical
Procedures [70.69948035469467]
カメラビューから3Dグラフを生成するための最新のコンピュータビジョン手法を利用する。
次に,手術手順の象徴的,意味的表現を統一することを目的としたマルチモーダルセマンティックグラフシーン(MSSG)を紹介する。
論文 参考訳(メタデータ) (2021-06-09T14:35:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。