論文の概要: Echocardiography video synthesis from end diastolic semantic map via
diffusion model
- arxiv url: http://arxiv.org/abs/2310.07131v1
- Date: Wed, 11 Oct 2023 02:08:05 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-13 07:45:36.193118
- Title: Echocardiography video synthesis from end diastolic semantic map via
diffusion model
- Title(参考訳): 拡散モデルを用いた拡張期意味地図からの心エコービデオ合成
- Authors: Phi Nguyen Van, Duc Tran Minh, Hieu Pham Huy, Long Tran Quoc
- Abstract要約: 本稿では,心臓ビデオ合成のために既存のビデオ拡散モデルを拡張し,課題に対処することを目的とする。
我々の焦点は、心循環中に初期フレームのセマンティックマップを用いてビデオを生成することであり、一般にエンドダイアストルと呼ばれる。
本モデルでは,FID,FVD,SSMIなどの複数の指標を用いて,標準拡散法よりも優れた性能を示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Denoising Diffusion Probabilistic Models (DDPMs) have demonstrated
significant achievements in various image and video generation tasks, including
the domain of medical imaging. However, generating echocardiography videos
based on semantic anatomical information remains an unexplored area of
research. This is mostly due to the constraints imposed by the currently
available datasets, which lack sufficient scale and comprehensive frame-wise
annotations for every cardiac cycle. This paper aims to tackle the
aforementioned challenges by expanding upon existing video diffusion models for
the purpose of cardiac video synthesis. More specifically, our focus lies in
generating video using semantic maps of the initial frame during the cardiac
cycle, commonly referred to as end diastole. To further improve the synthesis
process, we integrate spatial adaptive normalization into multiscale feature
maps. This enables the inclusion of semantic guidance during synthesis,
resulting in enhanced realism and coherence of the resultant video sequences.
Experiments are conducted on the CAMUS dataset, which is a highly used dataset
in the field of echocardiography. Our model exhibits better performance
compared to the standard diffusion technique in terms of multiple metrics,
including FID, FVD, and SSMI.
- Abstract(参考訳): Denoising Diffusion Probabilistic Models (DDPMs) は、医用画像の領域を含む様々な画像およびビデオ生成タスクにおいて重要な成果を示した。
しかし、意味解剖情報に基づく心エコービデオの生成は、まだ未調査領域である。
これは主に、現在利用可能なデータセットが課している制約によるもので、心臓サイクル毎に十分なスケールと包括的なフレームワイドアノテーションが欠如している。
本稿では,既存のビデオ拡散モデルを拡張して,心臓ビデオ合成の課題に対処することを目的とする。
より具体的には、心臓周期中の初期フレームのセマンティックマップを使ってビデオを生成することに重点を置いています。
合成プロセスをさらに改善するために,空間適応正規化を多スケール特徴マップに統合する。
これにより、合成中に意味的指導を取り入れることができ、その結果の映像シーケンスのリアリズムとコヒーレンスが強化される。
CAMUSデータセットは、心エコー検査の分野でよく使われるデータセットである。
本モデルでは,FID,FVD,SSMIなどの複数の指標を用いて,標準拡散法よりも優れた性能を示す。
関連論文リスト
- EchoFM: Foundation Model for Generalizable Echocardiogram Analysis [22.585990526913246]
心エコービデオの表現と解析に特化して設計された基礎モデルであるEchoFMを紹介する。
EchoFMでは,空間的および時間的変動の両方をキャプチャする自己教師型学習フレームワークを提案する。
我々は,290,000本以上の心エコービデオと最大2000万フレームの画像からなる広範囲なデータセット上で,我々のモデルを事前訓練した。
論文 参考訳(メタデータ) (2024-10-30T19:32:02Z) - Explainable and Controllable Motion Curve Guided Cardiac Ultrasound Video Generation [11.879436948659691]
心エコー画像生成のための説明可能かつ制御可能な手法を提案する。
まず,各心部分構造から運動情報を抽出し,運動曲線を構築する。
第2に,動作曲線に意味的特徴をマッピングできる構造間アライメントモジュールを提案する。
第三に、位置認識型アテンション機構は、構造的位置情報を持つガウスマスクを用いて、映像の一貫性を高めるように設計されている。
論文 参考訳(メタデータ) (2024-07-31T09:59:20Z) - Unlocking the Power of Spatial and Temporal Information in Medical Multimodal Pre-training [99.2891802841936]
我々は,空間的・時間的微粒なモデリングのためのMed-STフレームワークを提案する。
空間モデリングでは、Med-STはMixture of View Expert (MoVE)アーキテクチャを使用して、正面と横の両方のビューから異なる視覚的特徴を統合する。
時間的モデリングのために,フォワードマッピング分類 (FMC) とリバースマッピング回帰 (RMR) による新たな双方向サイクル整合性目標を提案する。
論文 参考訳(メタデータ) (2024-05-30T03:15:09Z) - Vivim: a Video Vision Mamba for Medical Video Segmentation [52.11785024350253]
本稿では、医用ビデオセグメンテーションタスクのためのビデオビジョンマンバベースのフレームワークVivimを提案する。
我々のビビムは、長期表現を様々なスケールのシーケンスに効果的に圧縮することができる。
超音波検査では甲状腺分節,乳房病変分節,大腸内視鏡検査ではポリープ分節が有効で有効であった。
論文 参考訳(メタデータ) (2024-01-25T13:27:03Z) - Diffusion Priors for Dynamic View Synthesis from Monocular Videos [59.42406064983643]
ダイナミックノベルビュー合成は、ビデオ内の視覚的コンテンツの時間的進化を捉えることを目的としている。
まず、ビデオフレーム上に予め訓練されたRGB-D拡散モデルをカスタマイズ手法を用いて微調整する。
動的および静的なニューラルレイディアンス場を含む4次元表現に、微調整されたモデルから知識を蒸留する。
論文 参考訳(メタデータ) (2024-01-10T23:26:41Z) - Echocardiography Segmentation Using Neural ODE-based Diffeomorphic
Registration Field [0.0]
本稿ではニューラル常微分方程式(ニューラルODE)を用いた新しい拡散画像登録法を提案する。
提案手法であるEcho-ODEでは,従来の最先端技術と比較して,いくつかの改良が加えられている。
その結果,本手法は過去の最先端技術よりも多面的に優れていることがわかった。
論文 参考訳(メタデータ) (2023-06-16T08:37:27Z) - Motion-Conditioned Diffusion Model for Controllable Video Synthesis [75.367816656045]
本稿では,開始画像フレームと一組のストロークから映像を生成する条件拡散モデルであるMCDiffを紹介する。
MCDiffはストローク誘導制御可能なビデオ合成における最先端の視覚的品質を実現する。
論文 参考訳(メタデータ) (2023-04-27T17:59:32Z) - Feature-Conditioned Cascaded Video Diffusion Models for Precise
Echocardiogram Synthesis [5.102090025931326]
我々は、ビデオモデリングのための解明された拡散モデルを拡張し、単一の画像から可視なビデオシーケンスを生成する。
我々の画像からシーケンスへのアプローチは、最近提案されたシーケンスからシーケンス生成手法よりも38ポイント高い93%のR2$スコアを達成する。
論文 参考訳(メタデータ) (2023-03-22T15:26:22Z) - Modeling Shared Responses in Neuroimaging Studies through MultiView ICA [94.31804763196116]
被験者の大規模なコホートを含むグループ研究は、脳機能組織に関する一般的な結論を引き出す上で重要である。
グループ研究のための新しい多視点独立成分分析モデルを提案し、各被験者のデータを共有独立音源と雑音の線形結合としてモデル化する。
まず、fMRIデータを用いて、被験者間の共通音源の同定における感度の向上を示す。
論文 参考訳(メタデータ) (2020-06-11T17:29:53Z) - On the effectiveness of GAN generated cardiac MRIs for segmentation [12.59275199633534]
本稿では,心形態の潜在表現を学習するための変分オートエンコーダ(VAE)を提案する。
一方、GANは、与えられた解剖学的マップに適した現実的なMR画像を生成するために、"SPatially-Adaptive (DE)Normalization"モジュールを使用する。
合成アノテート画像を用いて訓練したCNNのセグメンテーションは,従来の手法と比較して競合する結果が得られることを示す。
論文 参考訳(メタデータ) (2020-05-18T18:48:38Z) - Pathological Retinal Region Segmentation From OCT Images Using Geometric
Relation Based Augmentation [84.7571086566595]
本稿では,幾何学と形状の内在的関係を共同で符号化することで,従来のGANベースの医用画像合成法よりも優れた手法を提案する。
提案手法は,取得手順の異なる画像を有する公開RETOUCHデータセット上で,最先端のセグメンテーション手法より優れている。
論文 参考訳(メタデータ) (2020-03-31T11:50:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。