論文の概要: Medical Video Generation for Disease Progression Simulation
- arxiv url: http://arxiv.org/abs/2411.11943v1
- Date: Mon, 18 Nov 2024 18:37:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-20 13:38:03.247544
- Title: Medical Video Generation for Disease Progression Simulation
- Title(参考訳): 疾患進展シミュレーションのための医用ビデオ生成
- Authors: Xu Cao, Kaizhao Liang, Kuei-Da Liao, Tianren Gao, Wenqian Ye, Jintai Chen, Zhiguang Ding, Jianguo Cao, James M. Rehg, Jimeng Sun,
- Abstract要約: 疾患関連画像と映像の特徴を制御できる第1の医用ビデオ生成フレームワークを提案する。
胸部X線,眼底写真,皮膚画像の3領域にまたがる枠組みを検証した。
MVGは、コヒーレントで臨床的に妥当な疾患軌跡を発生させる上で、ベースラインモデルよりも著しく優れている。
- 参考スコア(独自算出の注目度): 40.38123964910394
- License:
- Abstract: Modeling disease progression is crucial for improving the quality and efficacy of clinical diagnosis and prognosis, but it is often hindered by a lack of longitudinal medical image monitoring for individual patients. To address this challenge, we propose the first Medical Video Generation (MVG) framework that enables controlled manipulation of disease-related image and video features, allowing precise, realistic, and personalized simulations of disease progression. Our approach begins by leveraging large language models (LLMs) to recaption prompt for disease trajectory. Next, a controllable multi-round diffusion model simulates the disease progression state for each patient, creating realistic intermediate disease state sequence. Finally, a diffusion-based video transition generation model interpolates disease progression between these states. We validate our framework across three medical imaging domains: chest X-ray, fundus photography, and skin image. Our results demonstrate that MVG significantly outperforms baseline models in generating coherent and clinically plausible disease trajectories. Two user studies by veteran physicians, provide further validation and insights into the clinical utility of the generated sequences. MVG has the potential to assist healthcare providers in modeling disease trajectories, interpolating missing medical image data, and enhancing medical education through realistic, dynamic visualizations of disease progression.
- Abstract(参考訳): 疾患の進行をモデル化することは, 臨床診断や予後の質や効果を改善する上で重要であるが, 個々の患者に対する経時的医療画像モニタリングの欠如によってしばしば妨げられる。
この課題に対処するために,病状関連画像と映像の特徴を制御し,病状進行の精密で現実的でパーソナライズされたシミュレーションを可能にする,第1の医療ビデオ生成(MVG)フレームワークを提案する。
我々のアプローチは、大きな言語モデル(LLM)を活用して病気の軌跡を再現することから始まります。
次に、制御可能な多ラウンド拡散モデルにより、患者ごとの疾患進行状態をシミュレートし、現実的な中間疾患状態列を生成する。
最後に、拡散に基づくビデオ遷移生成モデルが、これらの状態間の疾患進行を補間する。
胸部X線,眼底写真,皮膚画像の3領域にまたがる枠組みを検証した。
その結果,MVGはコヒーレントかつ臨床的に可塑性な疾患の軌跡を発生させる上で,ベースラインモデルよりも有意に優れていた。
ベテラン医師による2つのユーザスタディは、生成されたシーケンスの臨床的有用性に関するさらなる検証と洞察を提供する。
MVGは、病気の軌跡をモデル化し、欠落した医療画像データを補間し、病気の進行を現実的でダイナミックに可視化することで医療機関を支援する可能性がある。
関連論文リスト
- Unscrambling disease progression at scale: fast inference of event permutations with optimal transport [2.9087305408570945]
疾患進行モデルでは、慢性変性状態として、患者の特徴の変化の群レベルの時間的軌跡を推定する。
本研究では,Birkhoff polytopeに属する事象の潜在置換行列として,最適な輸送からモデル疾患進行へのアイデアを活用する。
実験は、シミュレーションにおけるノイズに対する速度、精度、堅牢性の増加を実証する。
論文 参考訳(メタデータ) (2024-10-18T11:44:29Z) - Potential of Multimodal Large Language Models for Data Mining of Medical Images and Free-text Reports [51.45762396192655]
特にGemini-Vision-Series (Gemini) と GPT-4-Series (GPT-4) は、コンピュータビジョンのための人工知能のパラダイムシフトを象徴している。
本研究は,14の医用画像データセットを対象に,Gemini,GPT-4,および4つの一般的な大規模モデルの性能評価を行った。
論文 参考訳(メタデータ) (2024-07-08T09:08:42Z) - Probabilistic Temporal Prediction of Continuous Disease Trajectories and Treatment Effects Using Neural SDEs [6.5527554277858275]
神経差分方程式(NSDE)による疾患進行の持続的時間的進化をモデル化するための最初の因果時間的枠組みを提示する。
本研究は,将来のMS障害(EDSSなど)と治療効果を正確に予測するための,不確実性に基づく因果学習(DL)モデルとして,最初の成功例を示す。
論文 参考訳(メタデータ) (2024-06-18T17:22:55Z) - PIE: Simulating Disease Progression via Progressive Image Editing [27.658116659009025]
プログレッシブイメージ編集(PIE)は、疾患に関連する画像の特徴を制御できる。
我々は、テキスト・ツー・イメージ生成モデルの最近の進歩を活用して、疾患の進行を正確にシミュレートし、各患者にパーソナライズする。
PIEは、現実世界の標準に適合した疾患進行画像を生成する最初の企業である。
論文 参考訳(メタデータ) (2023-09-21T02:46:32Z) - LVM-Med: Learning Large-Scale Self-Supervised Vision Models for Medical
Imaging via Second-order Graph Matching [59.01894976615714]
LVM-Medは、大規模医療データセットに基づいてトレーニングされた、最初のディープネットワークファミリーである。
55の公開データセットから約13万の医療画像を収集しました。
LVM-Medは、多くの最先端の教師付き、自己監督型、基礎モデルよりも経験的に優れている。
論文 参考訳(メタデータ) (2023-06-20T22:21:34Z) - Mixture of Input-Output Hidden Markov Models for Heterogeneous Disease
Progression Modeling [11.768140291216769]
本稿では,多発性疾患の進行動態を検出する階層型時系列モデルを提案する。
本稿では,パーキンソン病に対する合成データセットと実世界縦断データセットを用いたモデルの有用性について述べる。
論文 参考訳(メタデータ) (2022-07-24T23:17:06Z) - AlignTransformer: Hierarchical Alignment of Visual Regions and Disease
Tags for Medical Report Generation [50.21065317817769]
本稿では,Align Hierarchical Attention (AHA)とMulti-Grained Transformer (MGT)モジュールを含むAlign Transformerフレームワークを提案する。
パブリックなIU-XrayとMIMIC-CXRデータセットの実験は、AlignTransformerが2つのデータセットの最先端メソッドと競合する結果が得られることを示している。
論文 参考訳(メタデータ) (2022-03-18T13:43:53Z) - Context-aware Health Event Prediction via Transition Functions on
Dynamic Disease Graphs [15.17817233616652]
多くの機械学習アプローチは、患者の異なる訪問で病気の表現が静的であると仮定している。
動的疾患グラフ上の遷移関数を用いた文脈認識学習フレームワークを提案する。
2つの実世界のEHRデータセットの実験結果から、提案されたモデルは、健康事象を予測する上で、技術の現状よりも優れていることが示された。
論文 参考訳(メタデータ) (2021-12-09T20:06:39Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z) - Learning Dynamic and Personalized Comorbidity Networks from Event Data
using Deep Diffusion Processes [102.02672176520382]
コンコルビンド病は、個人によって異なる複雑な時間的パターンを通じて発生し進行する。
電子的な健康記録では、患者が持つ異なる疾患を観察できるが、それぞれの共死状態の時間的関係を推測できるだけである。
我々は「ダイナミック・コオービディティ・ネットワーク」をモデル化するための深層拡散プロセスを開発する。
論文 参考訳(メタデータ) (2020-01-08T15:47:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。