論文の概要: Diagnosing Shoulder Disorders Using Multimodal Large Language Models and Consumer-Grade Cameras
- arxiv url: http://arxiv.org/abs/2510.09230v1
- Date: Fri, 10 Oct 2025 10:17:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 00:38:48.694754
- Title: Diagnosing Shoulder Disorders Using Multimodal Large Language Models and Consumer-Grade Cameras
- Title(参考訳): マルチモーダル大言語モデルとコンシューマグレードカメラを用いた肩障害の診断
- Authors: Jindong Hong, Wencheng Zhang, Shiqin Qiao, Jianhai Chen, Jianing Qiu, Chuanyang Zheng, Qian Xu, Yun Ji, Qianyue Wen, Weiwei Sun, Hao Li, Huizhen Li, Huichao Wang, Kai Wu, Meng Li, Yijun He, Lingjie Luo, Jiankai Sun,
- Abstract要約: 医療資源が乏しい地域では、早期かつ正確な診断が大きな課題となっている。
本研究は、診断の基盤として、コンシューマグレードのデバイスが捉えたビデオを導入し、ユーザにとってのコストを削減した。
肩障害の早期診断におけるMLLM(Multimodal Large Language Models)の革新的応用に着目する。
- 参考スコア(独自算出の注目度): 26.022889803242236
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Shoulder disorders, such as frozen shoulder (a.k.a., adhesive capsulitis), are common conditions affecting the health of people worldwide, and have a high incidence rate among the elderly and workers engaged in repetitive shoulder tasks. In regions with scarce medical resources, achieving early and accurate diagnosis poses significant challenges, and there is an urgent need for low-cost and easily scalable auxiliary diagnostic solutions. This research introduces videos captured by consumer-grade devices as the basis for diagnosis, reducing the cost for users. We focus on the innovative application of Multimodal Large Language Models (MLLMs) in the preliminary diagnosis of shoulder disorders and propose a Hybrid Motion Video Diagnosis framework (HMVDx). This framework divides the two tasks of action understanding and disease diagnosis, which are respectively completed by two MLLMs. In addition to traditional evaluation indicators, this work proposes a novel metric called Usability Index by the logical process of medical decision-making (action recognition, movement diagnosis, and final diagnosis). This index evaluates the effectiveness of MLLMs in the medical field from the perspective of the entire medical diagnostic pathway, revealing the potential value of low-cost MLLMs in medical applications for medical practitioners. In experimental comparisons, the accuracy of HMVDx in diagnosing shoulder joint injuries has increased by 79.6\% compared with direct video diagnosis, a significant technical contribution to future research on the application of MLLMs for video understanding in the medical field.
- Abstract(参考訳): 肩関節症(肩関節症など)は、世界中の人々の健康に影響を及ぼす一般的な疾患であり、反復的な肩の作業に従事している高齢者や労働者の間では高い頻度で発症する。
医療資源が乏しい地域では、早期かつ正確な診断が大きな課題となり、低コストでスケーラブルな補助診断ソリューションが緊急に必要となる。
本研究は、診断の基盤として、コンシューマグレードのデバイスが捉えたビデオを導入し、ユーザにとってのコストを削減した。
肩関節障害の早期診断におけるMLLM(Multimodal Large Language Models)の革新的応用に着目し,HMVDx(Hybrid Motion Video Diagnosis framework)を提案する。
本フレームワークは,2つのMLLMでそれぞれ完了した行動理解と疾患診断の2つのタスクを分割する。
本研究は,従来の評価指標に加えて,医学的意思決定(行動認識,運動診断,最終診断)の論理的プロセスによるユーザビリティ指標(Usability Index)と呼ばれる新しい指標を提案する。
本索引は,医療分野におけるMLLMの有効性を医療診断経路全体の観点から評価し,医療従事者の医療応用における低コストMLLMの有用性を明らかにする。
肩関節損傷の診断における HMVDx の精度は, 直接的ビデオ診断と比較して79.6 % 向上した。
関連論文リスト
- MACD: Multi-Agent Clinical Diagnosis with Self-Learned Knowledge for LLM [32.0716204095227]
大規模言語モデル(LLM)は医学的応用において顕著な可能性を示している。
本研究は,新しいMulti-Agent Clinical Diagnosis (MACD) フレームワークを提案する。
LLMはマルチエージェントパイプラインを通じて自己学習型臨床知識を提供する。
論文 参考訳(メタデータ) (2025-09-24T12:37:11Z) - MAM: Modular Multi-Agent Framework for Multi-Modal Medical Diagnosis via Role-Specialized Collaboration [57.98393950821579]
マルチモーダル医療診断のためのモジュール型マルチエージェントフレームワーク(MAM)について紹介する。
我々の経験的発見に触発されて、MAMは医療診断プロセスを、一般実践者、スペシャリストチーム、放射線科医、医療助手、ディレクターの専門的な役割に分解する。
このモジュール的で協調的なフレームワークは、効率的な知識更新を可能にし、既存の医療用LLMと知識ベースを活用する。
論文 参考訳(メタデータ) (2025-06-24T17:52:43Z) - The Multi-Round Diagnostic RAG Framework for Emulating Clinical Reasoning [10.483453944197407]
現代医学と漢方医学の両方をカバーする知識グラフであるDiagnosGraphを構築した。
口語患者の物語と学術的な医療知識のギャップを埋めるために、DiagnosGraphは1,908ドルの医療記録も導入している。
MRD-RAGがLSMの診断性能を向上させることを実証した。
論文 参考訳(メタデータ) (2025-04-10T13:17:51Z) - Structured Outputs Enable General-Purpose LLMs to be Medical Experts [50.02627258858336]
大規模言語モデル(LLM)は、しばしばオープンエンドの医学的問題に苦しむ。
本稿では,構造化医療推論を利用した新しいアプローチを提案する。
我々の手法は85.8のファクチュアリティスコアを達成し、微調整されたモデルを上回る。
論文 参考訳(メタデータ) (2025-03-05T05:24:55Z) - Improving Interactive Diagnostic Ability of a Large Language Model Agent Through Clinical Experience Learning [17.647875658030006]
本研究では,性能劣化現象の根底にあるメカニズムについて検討する。
我々は,中国とアメリカの医療施設から350万件以上の電子医療記録を活用する,PPME ( Plug-and-play) LLM エージェントを開発した。
本研究は, 初期疾患の診断・調査のための専門モデルを統合し, 指導的, 強化的学習技術を用いて訓練した。
論文 参考訳(メタデータ) (2025-02-24T06:24:20Z) - Improving Medical Large Vision-Language Models with Abnormal-Aware Feedback [57.98393950821579]
医学的異常を明らかにするための新しいUMed-LVLMを提案する。
本稿では,GPT-4Vを用いた診断手法を提案する。
UMed-LVLMは既存のMed-LVLMよりも医療異常の同定と理解に優れていた。
論文 参考訳(メタデータ) (2025-01-02T17:37:20Z) - SkinGEN: an Explainable Dermatology Diagnosis-to-Generation Framework with Interactive Vision-Language Models [54.32264601568605]
SkinGENは、VLMが提供する診断結果から参照デモを生成する、診断から生成までのフレームワークである。
システム性能と説明可能性の両方を評価するために,32人の参加者によるユーザスタディを実施している。
その結果、SkinGENはVLM予測に対するユーザの理解を著しく改善し、診断プロセスへの信頼を高めることが示されている。
論文 参考訳(メタデータ) (2024-04-23T05:36:33Z) - AI Hospital: Benchmarking Large Language Models in a Multi-agent Medical Interaction Simulator [69.51568871044454]
我々は,emphDoctorをプレイヤとして,NPC間の動的医療相互作用をシミュレーションするフレームワークであるtextbfAI Hospitalを紹介した。
この設定は臨床シナリオにおけるLCMの現実的な評価を可能にする。
高品質な中国の医療記録とNPCを利用したマルチビュー医療評価ベンチマークを開発した。
論文 参考訳(メタデータ) (2024-02-15T06:46:48Z) - Ophtha-LLaMA2: A Large Language Model for Ophthalmology [31.39653268440651]
大規模言語モデル(LLM)は自然言語処理(NLP)の分野で大きな成功を収めた。
本研究は,眼科疾患の診断に適したLLM「Ophtha-LLaMA2」を構築した。
推測試験の結果,Ophtha-LLaMA2は細調整データセットが小さい場合でも,眼科診断において有意に良好な成績を示した。
論文 参考訳(メタデータ) (2023-12-08T08:43:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。