Fugu-MT 論文翻訳(概要): Efficient Semantic Diffusion Architectures for Model Training on Synthetic Echocardiograms

論文の概要: Efficient Semantic Diffusion Architectures for Model Training on Synthetic Echocardiograms

arxiv url: http://arxiv.org/abs/2409.19371v1
Date: Sat, 28 Sep 2024 14:50:50 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-05 23:48:39.591093
Title: Efficient Semantic Diffusion Architectures for Model Training on Synthetic Echocardiograms
Title（参考訳）: 合成心エコー図を用いたモデルトレーニングのための効率的な意味的拡散構造
Authors: David Stojanovski, Mariana da Silva, Pablo Lamata, Arian Beqiri, Alberto Gomez,
Abstract要約: 本稿では, セマンティックガイド付き人工心臓超音波画像を生成するために, LDM(Gamma$-distriion Latent Denoising Diffusion Models)を提案する。また、左室区分けと2値心エコー図の分類タスクのための訓練深部ネットワークにおける実際のデータの代わりにこれらの合成画像を使用することの可能性についても検討した。
参考スコア（独自算出の注目度）: 0.9765507069335528
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We investigate the utility of diffusion generative models to efficiently synthesise datasets that effectively train deep learning models for image analysis. Specifically, we propose novel $\Gamma$-distribution Latent Denoising Diffusion Models (LDMs) designed to generate semantically guided synthetic cardiac ultrasound images with improved computational efficiency. We also investigate the potential of using these synthetic images as a replacement for real data in training deep networks for left-ventricular segmentation and binary echocardiogram view classification tasks. We compared six diffusion models in terms of the computational cost of generating synthetic 2D echo data, the visual realism of the resulting images, and the performance, on real data, of downstream tasks (segmentation and classification) trained using these synthetic echoes. We compare various diffusion strategies and ODE solvers for their impact on segmentation and classification performance. The results show that our propose architectures significantly reduce computational costs while maintaining or improving downstream task performance compared to state-of-the-art methods. While other diffusion models generated more realistic-looking echo images at higher computational cost, our research suggests that for model training, visual realism is not necessarily related to model performance, and considerable compute costs can be saved by using more efficient models.
Abstract（参考訳）: 画像解析のためのディープラーニングモデルを効果的に学習するデータセットを効率的に合成するための拡散生成モデルの有用性について検討する。具体的には, セマンティックガイド付き人工心臓超音波画像を生成するために, 計算効率を向上した新規なLDM ($\Gamma$-distribution Latent Denoising Diffusion Models) を提案する。また、左室区分けと2値心エコー図の分類タスクのための訓練深部ネットワークにおける実際のデータの代わりにこれらの合成画像を使用することの可能性についても検討した。合成エコーデータを生成するための計算コスト,得られた画像の視覚的リアリズム,および実データに基づいて,これらの合成エコーを用いて訓練された下流タスク(分割と分類)の性能を6つの拡散モデルと比較した。セグメンテーションと分類性能に影響を及ぼす様々な拡散戦略とODEソルバを比較した。その結果,提案アーキテクチャは,最先端手法と比較して,ダウンストリームタスク性能を維持・改善しながら,計算コストを大幅に削減することを示した。他の拡散モデルはよりリアルなエコー像を高い計算コストで生成するが、我々の研究はモデルトレーニングでは、視覚的リアリズムは必ずしもモデルの性能と関係がなく、より効率的なモデルを使用することでかなりの計算コストを節約できることを示している。

関連論文リスト

Towards Application Aligned Synthetic Surgical Image Synthesis [3.1373284090264857]
下流モデルで好まれるサンプルと拡散モデルを整合させる新しいフレームワークであるemphSurgical Application-Aligned Diffusion (SAADi)を紹介する。提案手法では, 画像生成過程を下流の目的と明確に整合させるために, 拡散モデルの微調整を軽量に行う。
論文参考訳（メタデータ） (2025-09-23T08:40:40Z)
Direct Dual-Energy CT Material Decomposition using Model-based Denoising Diffusion Model [105.95160543743984]
本稿では,Dual-Energy Decomposition Model-based Diffusion (DEcomp-MoD) と呼ばれる深層学習手法を提案する。 Decomp-MoDは、教師なしスコアベースモデルと教師なしディープラーニングネットワークより優れていることを示す。
論文参考訳（メタデータ） (2025-07-24T01:00:06Z)
Dual-Expert Consistency Model for Efficient and High-Quality Video Generation [57.33788820909211]
本稿では,パラメータ効率の高いtextbfDual-Expert Consistency Model (DCM) を提案する。提案手法は, ビデオ拡散モデル蒸留における専門的専門化の有効性を実証し, サンプリング工程を大幅に短縮して, 最先端の視覚品質を実現する。
論文参考訳（メタデータ） (2025-06-03T17:55:04Z)
Provably Improving Generalization of Few-Shot Models with Synthetic Data [15.33628135372502]
本研究では,分散の相違が教師あり学習に与える影響を定量化する理論的枠組みを開発する。本稿では,データ分割とモデルトレーニングの両方を最適化するために,プロトタイプ学習を統合した理論に基づく新しいアルゴリズムを提案する。
論文参考訳（メタデータ） (2025-05-30T03:59:45Z)
Dataset Distillation with Probabilistic Latent Features [9.318549327568695]
合成データのコンパクトなセットは、下流の分類タスクにおける元のデータセットを効果的に置き換えることができる。本稿では,潜在特徴の共分散をモデル化する新しい手法を提案する。提案手法は,バックボーンアーキテクチャにまたがる最先端のクロスアーキテクチャ性能を実現する。
論文参考訳（メタデータ） (2025-05-10T13:53:49Z)
Improving Object Detection by Modifying Synthetic Data with Explainable AI [3.0519884745675485]
本稿では,合成画像の設計効率を向上させるための新しい概念的アプローチを提案する。 XAI技術は、これらの画像を生成するために使用される3Dメッシュモデルを修正する、ループ中の人間プロセスを導く。合成データは、トレーニング中に見えない方向の車両の検出を4.6%改善できることを示す。
論文参考訳（メタデータ） (2024-12-02T13:24:43Z)
Evaluating Utility of Memory Efficient Medical Image Generation: A Study on Lung Nodule Segmentation [0.0]
本研究は,合成医用画像を生成するためのメモリ効率のパッチワイド拡散確率モデル(DDPM)を提案する。本手法は, メモリ制約を効率的に管理しながら, 結節分割による高能率合成画像を生成する。本手法は,合成データのみに基づくセグメンテーションモデルのトレーニングと,合成画像を用いた実世界のトレーニングデータの拡張の2つのシナリオで評価する。
論文参考訳（メタデータ） (2024-10-16T13:20:57Z)
Memory-efficient High-resolution OCT Volume Synthesis with Cascaded Amortized Latent Diffusion Models [48.87160158792048]
本稿では,高分解能CTボリュームをメモリ効率よく合成できるCA-LDM(Cascaded amortized Latent diffusion model)を提案する。公開高解像度OCTデータセットを用いた実験により、我々の合成データは、既存の手法の能力を超越した、現実的な高解像度かつグローバルな特徴を持つことが示された。
論文参考訳（メタデータ） (2024-05-26T10:58:22Z)
Is Synthetic Image Useful for Transfer Learning? An Investigation into Data Generation, Volume, and Utilization [62.157627519792946]
ブリッジドトランスファー(ブリッジドトランスファー)と呼ばれる新しいフレームワークを導入する。このフレームワークは、当初、トレーニング済みモデルの微調整に合成画像を使用し、転送性を向上させる。合成画像と実画像のスタイルアライメントを改善するために,データセットスタイルの逆変換方式を提案する。提案手法は10の異なるデータセットと5つの異なるモデルで評価され、一貫した改善が示されている。
論文参考訳（メタデータ） (2024-03-28T22:25:05Z)
SeNM-VAE: Semi-Supervised Noise Modeling with Hierarchical Variational Autoencoder [13.453138169497903]
SeNM-VAEは、ペアとアンペアの両方のデータセットを利用して、現実的な劣化データを生成する半教師付きノイズモデリング手法である。実世界の画像認識と超分解能タスクのためのペアトレーニングサンプルを生成するために,本手法を用いた。提案手法は, 合成劣化画像の品質を, 他の不対とペアのノイズモデリング法と比較して向上させる。
論文参考訳（メタデータ） (2024-03-26T09:03:40Z)
Deep Domain Adaptation: A Sim2Real Neural Approach for Improving Eye-Tracking Systems [80.62854148838359]
眼球画像のセグメンテーションは、最終視線推定に大きな影響を及ぼす眼球追跡の重要なステップである。対象視線画像と合成訓練データとの重なり合いを測定するために,次元還元法を用いている。提案手法は,シミュレーションと実世界のデータサンプルの相違に対処する際の頑健で,性能が向上する。
論文参考訳（メタデータ） (2024-03-23T22:32:06Z)
DetDiffusion: Synergizing Generative and Perceptive Models for Enhanced Data Generation and Perception [78.26734070960886]
現在の知覚モデルは、リソース集約的なデータセットに大きく依存している。セグメンテーションを通じて知覚認識損失(P.A.損失)を導入し、品質と制御性の両方を改善した。本手法は,世代間における知覚認識属性(P.A. Attr)の抽出と利用により,データ拡張をカスタマイズする。
論文参考訳（メタデータ） (2024-03-20T04:58:03Z)
Retinal OCT Synthesis with Denoising Diffusion Probabilistic Models for Layer Segmentation [2.4113205575263708]
本稿では,拡散確率モデル(DDPM)を用いて網膜光コヒーレンス断層撮影(OCT)画像を自動的に生成する画像合成手法を提案する。階層分割の精度を一貫して改善し,様々なニューラルネットワークを用いて検証する。これらの結果から,網膜CT画像の手動アノテーションの必要性が軽減される可能性が示唆された。
論文参考訳（メタデータ） (2023-11-09T16:09:24Z)
Improving the Effectiveness of Deep Generative Data [5.856292656853396]
下流の画像処理タスクのための純粋合成画像のモデルを訓練すると、実際のデータに対するトレーニングに比べ、望ましくない性能低下が生じる。本稿では,この現象に寄与する要因を記述した新しい分類法を提案し,CIFAR-10データセットを用いて検討する。本手法は,合成データと合成データの混合による学習と合成データのみの学習において,下流分類タスクのベースラインに優れる。
論文参考訳（メタデータ） (2023-11-07T12:57:58Z)
An Adversarial Active Sampling-based Data Augmentation Framework for Manufacturable Chip Design [55.62660894625669]
リソグラフィーモデリングは、チップ設計マスクが製造可能であることを保証するため、チップ設計において重要な問題である。機械学習の最近の進歩は、時間を要するリソグラフィーシミュレーションをディープニューラルネットワークに置き換えるための代替ソリューションを提供している。本稿では,限られたデータのジレンマを解消し,機械学習モデルの性能を向上させるために,データ拡張フレームワークを提案する。
論文参考訳（メタデータ） (2022-10-27T20:53:39Z)
DiVAE: Photorealistic Images Synthesis with Denoising Diffusion Decoder [73.1010640692609]
本稿では,拡散デコーダ(DiVAE)を用いたVQ-VAEアーキテクチャモデルを提案する。我々のモデルは最先端の成果を達成し、さらに多くのフォトリアリスティックな画像を生成する。
論文参考訳（メタデータ） (2022-06-01T10:39:12Z)
Synthetic Data and Hierarchical Object Detection in Overhead Imagery [0.0]
衛星画像における低・ゼロサンプル学習を向上させるための新しい合成データ生成および拡張技術を開発した。合成画像の有効性を検証するために,検出モデルと2段階モデルの訓練を行い,実際の衛星画像上で得られたモデルを評価する。
論文参考訳（メタデータ） (2021-01-29T22:52:47Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。