Fugu-MT 論文翻訳(概要): Echocardiography video synthesis from end diastolic semantic map via diffusion model

論文の概要: Echocardiography video synthesis from end diastolic semantic map via diffusion model

arxiv url: http://arxiv.org/abs/2310.07131v1
Date: Wed, 11 Oct 2023 02:08:05 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-13 07:45:36.193118
Title: Echocardiography video synthesis from end diastolic semantic map via diffusion model
Title（参考訳）: 拡散モデルを用いた拡張期意味地図からの心エコービデオ合成
Authors: Phi Nguyen Van, Duc Tran Minh, Hieu Pham Huy, Long Tran Quoc
Abstract要約: 本稿では,心臓ビデオ合成のために既存のビデオ拡散モデルを拡張し,課題に対処することを目的とする。我々の焦点は、心循環中に初期フレームのセマンティックマップを用いてビデオを生成することであり、一般にエンドダイアストルと呼ばれる。本モデルでは,FID,FVD,SSMIなどの複数の指標を用いて,標準拡散法よりも優れた性能を示す。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Denoising Diffusion Probabilistic Models (DDPMs) have demonstrated significant achievements in various image and video generation tasks, including the domain of medical imaging. However, generating echocardiography videos based on semantic anatomical information remains an unexplored area of research. This is mostly due to the constraints imposed by the currently available datasets, which lack sufficient scale and comprehensive frame-wise annotations for every cardiac cycle. This paper aims to tackle the aforementioned challenges by expanding upon existing video diffusion models for the purpose of cardiac video synthesis. More specifically, our focus lies in generating video using semantic maps of the initial frame during the cardiac cycle, commonly referred to as end diastole. To further improve the synthesis process, we integrate spatial adaptive normalization into multiscale feature maps. This enables the inclusion of semantic guidance during synthesis, resulting in enhanced realism and coherence of the resultant video sequences. Experiments are conducted on the CAMUS dataset, which is a highly used dataset in the field of echocardiography. Our model exhibits better performance compared to the standard diffusion technique in terms of multiple metrics, including FID, FVD, and SSMI.
Abstract（参考訳）: Denoising Diffusion Probabilistic Models (DDPMs) は、医用画像の領域を含む様々な画像およびビデオ生成タスクにおいて重要な成果を示した。しかし、意味解剖情報に基づく心エコービデオの生成は、まだ未調査領域である。これは主に、現在利用可能なデータセットが課している制約によるもので、心臓サイクル毎に十分なスケールと包括的なフレームワイドアノテーションが欠如している。本稿では,既存のビデオ拡散モデルを拡張して,心臓ビデオ合成の課題に対処することを目的とする。より具体的には、心臓周期中の初期フレームのセマンティックマップを使ってビデオを生成することに重点を置いています。合成プロセスをさらに改善するために,空間適応正規化を多スケール特徴マップに統合する。これにより、合成中に意味的指導を取り入れることができ、その結果の映像シーケンスのリアリズムとコヒーレンスが強化される。 CAMUSデータセットは、心エコー検査の分野でよく使われるデータセットである。本モデルでは,FID,FVD,SSMIなどの複数の指標を用いて,標準拡散法よりも優れた性能を示す。

関連論文リスト

InfoMotion: A Graph-Based Approach to Video Dataset Distillation for Echocardiography [12.676788334083332]
本稿では,コンパクトな人工心エコービデオデータセットを蒸留するための新しい手法を提案する。我々はEchoNet-Dynamicデータセットに対する我々のアプローチを評価し、(25)合成ビデオのみを用いて(69.38%)テスト精度を達成した。
論文参考訳（メタデータ） (2025-12-10T08:39:25Z)
Label-free Motion-Conditioned Diffusion Model for Cardiac Ultrasound Synthesis [13.306765004903118]
本研究では, ラベルなし遅延拡散フレームワークであるMotion Conditioned Diffusion Model (MCDM)を提案する。 MCDMは、手動ラベルに依存することなく、時間的に一貫性があり、臨床的に現実的なシーケンスを生成する、競争力のあるビデオ生成性能を実現する。
論文参考訳（メタデータ） (2025-12-10T08:32:34Z)
Echo-DND: A dual noise diffusion model for robust and precise left ventricle segmentation in echocardiography [0.6749750044497732]
本稿では,心エコー区分けのための新しい二重雑音拡散モデルであるEcho-DNDを紹介する。モデルのパフォーマンスは、CAMUSとEchoNet-Dynamicデータセットで厳格に検証された。これらのデータセットでそれぞれ0.962と0.939の高Diceスコアを達成する。
論文参考訳（メタデータ） (2025-06-18T06:27:08Z)
EchoWorld: Learning Motion-Aware World Models for Echocardiography Probe Guidance [79.66329903007869]
本稿では,プローブ誘導のためのモーションアウェアな世界モデリングフレームワークであるEchoWorldを紹介する。解剖学的な知識と運動によって引き起こされる視覚力学を符号化する。 200以上の定期的なスキャンから100万枚以上の超音波画像で訓練されている。
論文参考訳（メタデータ） (2025-04-17T16:19:05Z)
EchoFlow: A Foundation Model for Cardiac Ultrasound Image and Video Generation [6.849095682774907]
本稿では,高画質でプライバシー保護された人工心エコー画像とビデオを生成するための新しいフレームワークであるEchoFlowを紹介する。本研究は,EchoFlowを用いた合成データセットのみにトレーニングされた下流モデルが,実際のデータセットでトレーニングされたモデルと性能的に同等であることを示す。
論文参考訳（メタデータ） (2025-03-28T11:51:59Z)
Ultrasound Image-to-Video Synthesis via Latent Dynamic Diffusion Models [17.949823366019285]
そこで本研究では,超音波画像から可視性超音波映像を合成する手法を提案する。 BUSVベンチマークにおいて,強い定量的結果を示し,映像を視覚的にアピールする。画像から映像へのアプローチは,超音波ビデオ解析の進歩に有効なデータ拡張ソリューションを提供する。
論文参考訳（メタデータ） (2025-03-19T07:58:43Z)
EchoFM: Foundation Model for Generalizable Echocardiogram Analysis [22.585990526913246]
心エコービデオの表現と解析に特化して設計された基礎モデルであるEchoFMを紹介する。 EchoFMでは,空間的および時間的変動の両方をキャプチャする自己教師型学習フレームワークを提案する。我々は,290,000本以上の心エコービデオと最大2000万フレームの画像からなる広範囲なデータセット上で,我々のモデルを事前訓練した。
論文参考訳（メタデータ） (2024-10-30T19:32:02Z)
Explainable and Controllable Motion Curve Guided Cardiac Ultrasound Video Generation [11.879436948659691]
心エコー画像生成のための説明可能かつ制御可能な手法を提案する。まず,各心部分構造から運動情報を抽出し,運動曲線を構築する。第2に,動作曲線に意味的特徴をマッピングできる構造間アライメントモジュールを提案する。第三に、位置認識型アテンション機構は、構造的位置情報を持つガウスマスクを用いて、映像の一貫性を高めるように設計されている。
論文参考訳（メタデータ） (2024-07-31T09:59:20Z)
Unlocking the Power of Spatial and Temporal Information in Medical Multimodal Pre-training [99.2891802841936]
我々は,空間的・時間的微粒なモデリングのためのMed-STフレームワークを提案する。空間モデリングでは、Med-STはMixture of View Expert (MoVE)アーキテクチャを使用して、正面と横の両方のビューから異なる視覚的特徴を統合する。時間的モデリングのために,フォワードマッピング分類 (FMC) とリバースマッピング回帰 (RMR) による新たな双方向サイクル整合性目標を提案する。
論文参考訳（メタデータ） (2024-05-30T03:15:09Z)
Vivim: a Video Vision Mamba for Medical Video Segmentation [52.11785024350253]
本稿では、医用ビデオセグメンテーションタスクのためのビデオビジョンマンバベースのフレームワークVivimを提案する。我々のビビムは、長期表現を様々なスケールのシーケンスに効果的に圧縮することができる。超音波検査では甲状腺分節,乳房病変分節,大腸内視鏡検査ではポリープ分節が有効で有効であった。
論文参考訳（メタデータ） (2024-01-25T13:27:03Z)
Diffusion Priors for Dynamic View Synthesis from Monocular Videos [59.42406064983643]
ダイナミックノベルビュー合成は、ビデオ内の視覚的コンテンツの時間的進化を捉えることを目的としている。まず、ビデオフレーム上に予め訓練されたRGB-D拡散モデルをカスタマイズ手法を用いて微調整する。動的および静的なニューラルレイディアンス場を含む4次元表現に、微調整されたモデルから知識を蒸留する。
論文参考訳（メタデータ） (2024-01-10T23:26:41Z)
Echocardiography Segmentation Using Neural ODE-based Diffeomorphic Registration Field [0.0]
本稿ではニューラル常微分方程式(ニューラルODE)を用いた新しい拡散画像登録法を提案する。提案手法であるEcho-ODEでは,従来の最先端技術と比較して,いくつかの改良が加えられている。その結果,本手法は過去の最先端技術よりも多面的に優れていることがわかった。
論文参考訳（メタデータ） (2023-06-16T08:37:27Z)
Motion-Conditioned Diffusion Model for Controllable Video Synthesis [75.367816656045]
本稿では,開始画像フレームと一組のストロークから映像を生成する条件拡散モデルであるMCDiffを紹介する。 MCDiffはストローク誘導制御可能なビデオ合成における最先端の視覚的品質を実現する。
論文参考訳（メタデータ） (2023-04-27T17:59:32Z)
Feature-Conditioned Cascaded Video Diffusion Models for Precise Echocardiogram Synthesis [5.102090025931326]
我々は、ビデオモデリングのための解明された拡散モデルを拡張し、単一の画像から可視なビデオシーケンスを生成する。我々の画像からシーケンスへのアプローチは、最近提案されたシーケンスからシーケンス生成手法よりも38ポイント高い93%のR2$スコアを達成する。
論文参考訳（メタデータ） (2023-03-22T15:26:22Z)
Modeling Shared Responses in Neuroimaging Studies through MultiView ICA [94.31804763196116]
被験者の大規模なコホートを含むグループ研究は、脳機能組織に関する一般的な結論を引き出す上で重要である。グループ研究のための新しい多視点独立成分分析モデルを提案し、各被験者のデータを共有独立音源と雑音の線形結合としてモデル化する。まず、fMRIデータを用いて、被験者間の共通音源の同定における感度の向上を示す。
論文参考訳（メタデータ） (2020-06-11T17:29:53Z)
On the effectiveness of GAN generated cardiac MRIs for segmentation [12.59275199633534]
本稿では,心形態の潜在表現を学習するための変分オートエンコーダ(VAE)を提案する。一方、GANは、与えられた解剖学的マップに適した現実的なMR画像を生成するために、"SPatially-Adaptive (DE)Normalization"モジュールを使用する。合成アノテート画像を用いて訓練したCNNのセグメンテーションは,従来の手法と比較して競合する結果が得られることを示す。
論文参考訳（メタデータ） (2020-05-18T18:48:38Z)
Pathological Retinal Region Segmentation From OCT Images Using Geometric Relation Based Augmentation [84.7571086566595]
本稿では,幾何学と形状の内在的関係を共同で符号化することで,従来のGANベースの医用画像合成法よりも優れた手法を提案する。提案手法は,取得手順の異なる画像を有する公開RETOUCHデータセット上で,最先端のセグメンテーション手法より優れている。
論文参考訳（メタデータ） (2020-03-31T11:50:43Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。