Fugu-MT 論文翻訳(概要): Synthesising Rare Cataract Surgery Samples with Guided Diffusion Models

論文の概要: Synthesising Rare Cataract Surgery Samples with Guided Diffusion Models

arxiv url: http://arxiv.org/abs/2308.02587v1
Date: Thu, 3 Aug 2023 18:09:26 GMT
ステータス: 翻訳完了
システム内更新日: 2023-08-08 19:47:14.258886
Title: Synthesising Rare Cataract Surgery Samples with Guided Diffusion Models
Title（参考訳）: 誘導拡散モデルを用いた白内障手術例の合成
Authors: Yannik Frisch, Moritz Fuchs, Antoine Sanner, Felix Anton Ucar, Marius Frenzel, Joana Wasielica-Poslednik, Adrian Gericke, Felix Mathias Wagner, Thomas Dratsch, Anirban Mukhopadhyay
Abstract要約: 白内障手術の動画データを,訓練済みのツールの最悪のパフォーマンスの段階で分析する。本モデルは,複雑なマルチクラスマルチラベル条件に基づいて,多種多様な高品質なサンプルを合成することができる。人工的に拡張されたデータにより,ツール分類の下流タスクにおけるデータ空間の問題を改善することができる。
参考スコア（独自算出の注目度）: 0.7577401420358975
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Cataract surgery is a frequently performed procedure that demands automation and advanced assistance systems. However, gathering and annotating data for training such systems is resource intensive. The publicly available data also comprises severe imbalances inherent to the surgical process. Motivated by this, we analyse cataract surgery video data for the worst-performing phases of a pre-trained downstream tool classifier. The analysis demonstrates that imbalances deteriorate the classifier's performance on underrepresented cases. To address this challenge, we utilise a conditional generative model based on Denoising Diffusion Implicit Models (DDIM) and Classifier-Free Guidance (CFG). Our model can synthesise diverse, high-quality examples based on complex multi-class multi-label conditions, such as surgical phases and combinations of surgical tools. We affirm that the synthesised samples display tools that the classifier recognises. These samples are hard to differentiate from real images, even for clinical experts with more than five years of experience. Further, our synthetically extended data can improve the data sparsity problem for the downstream task of tool classification. The evaluations demonstrate that the model can generate valuable unseen examples, allowing the tool classifier to improve by up to 10% for rare cases. Overall, our approach can facilitate the development of automated assistance systems for cataract surgery by providing a reliable source of realistic synthetic data, which we make available for everyone.
Abstract（参考訳）: 白内障手術は、自動化と高度な補助システムを必要とする頻繁な手術である。しかし、そのようなシステムのトレーニングのためのデータの収集と注釈はリソース集約的です。公開されているデータは、手術プロセスに固有の深刻な不均衡も含んでいる。そこで本研究では,前訓練した下流ツール分類器の最悪の相に対する白内障手術ビデオデータの解析を行った。分析の結果,不均衡が不均衡な場合における分類器の性能を低下させることが示された。この課題を解決するために,Diffusion Implicit Models (DDIM) と Classifier-Free Guidance (CFG) に基づく条件生成モデルを利用する。本モデルでは, 手術段階や手術器具の組み合わせなど, 複雑な多言語条件に基づいて, 多様な高品質な例を合成することができる。合成されたサンプルは、分類器が認識するツールを表示する。これらのサンプルは、5年以上の経験を持つ臨床専門家にとっても、実際の画像と区別が難しい。さらに,この合成拡張データにより,ツール分類の下流タスクにおけるデータスパーシティ問題を改善できる。評価の結果、モデルは貴重な未発見の例を生成できることが示され、稀なケースではツール分類器を最大10%改善することができる。全体として,本手法は,現実的な合成データの信頼できる情報源を提供することにより,白内障手術の自動化支援システムの開発を促進することができる。

関連論文リスト

Prototype-Guided Diffusion for Digital Pathology: Achieving Foundation Model Performance with Minimal Clinical Data [6.318463500874778]
本研究では,高忠実度合成病理データを大規模に生成するプロトタイプ誘導拡散モデルを提案する。我々のアプローチは、生成したデータの生物学的、診断学的に有意義な変動を保証します。我々は、大規模な実世界のデータセットでトレーニングされたモデルよりも60倍-760倍少ないデータを使用しても、我々の合成データセットでトレーニングされた自己教師機能によって競争性能が向上することを示した。
論文参考訳（メタデータ） (2025-04-15T21:17:39Z)
Latent Drifting in Diffusion Models for Counterfactual Medical Image Synthesis [55.959002385347645]
遅延ドリフトにより、医療画像に対して拡散モデルを条件付けし、反ファクト画像生成の複雑なタスクに適合させることができる。我々は,脳MRIと胸部X線による3つの時系列的ベンチマークデータセットを用いて,対物画像生成法について検討した。
論文参考訳（メタデータ） (2024-12-30T01:59:34Z)
SimuScope: Realistic Endoscopic Synthetic Dataset Generation through Surgical Simulation and Diffusion Models [1.28795255913358]
そこで本研究では,最新のCASシステムに必要なアノテーションをすべて自動生成する,本格的な手術シミュレータを提案する。手術器具と変形可能な解剖学的環境の間の力学を含む、より複雑で現実的な外科的相互作用のシミュレーションを提供する。安定拡散と低ランク適応に基づく軽量でフレキシブルな画像から画像への変換法を提案する。
論文参考訳（メタデータ） (2024-12-03T09:49:43Z)
SurgicaL-CD: Generating Surgical Images via Unpaired Image Translation with Latent Consistency Diffusion Models [1.6189876649941652]
現実的な手術画像を生成するために, 連続拡散法であるemphSurgicaL-CDを導入する。以上の結果から,本手法はGANや拡散に基づく手法よりも優れていることが示された。
論文参考訳（メタデータ） (2024-08-19T09:19:25Z)
Synthetic Image Learning: Preserving Performance and Preventing Membership Inference Attacks [5.0243930429558885]
本稿では,下流分類器の学習のための合成データの生成と利用を最適化するパイプラインである知識リサイクル(KR)を紹介する。このパイプラインの核心は生成的知識蒸留(GKD)であり、情報の品質と有用性を大幅に向上させる技術が提案されている。その結果、実データと合成データでトレーニングされたモデルと、実データでトレーニングされたモデルとの性能差が著しく低下した。
論文参考訳（メタデータ） (2024-07-22T10:31:07Z)
TSynD: Targeted Synthetic Data Generation for Enhanced Medical Image Classification [0.011037620731410175]
この研究は、生成モデルを誘導し、高い不確実性でデータを合成することを目的としている。最適化プロセスによりオートエンコーダの特徴空間を変更する。我々は,複数の分類タスクに対するテスト時間データ拡張と敵攻撃に対する堅牢性を向上させる。
論文参考訳（メタデータ） (2024-06-25T11:38:46Z)
Improving Deep Learning-based Automatic Cranial Defect Reconstruction by Heavy Data Augmentation: From Image Registration to Latent Diffusion Models [0.2911706166691895]
この研究は、パーソナライズされた頭蓋インプラントの自動モデリングにおける人工知能の分野に多大な貢献をしている。重データの増大が定量的および定性的な結果の両方を著しく増加させることを示す。また, 人工的に拡張したネットワークは, 実際の臨床的欠陥を再構築することに成功した。
論文参考訳（メタデータ） (2024-06-10T15:34:23Z)
On Sensitivity and Robustness of Normalization Schemes to Input Distribution Shifts in Automatic MR Image Diagnosis [58.634791552376235]
深層学習(DL)モデルは、再構成画像を入力として、複数の疾患の診断において最先端のパフォーマンスを達成した。 DLモデルは、トレーニングとテストフェーズ間の入力データ分布の変化につながるため、さまざまなアーティファクトに敏感である。本稿では,グループ正規化やレイヤ正規化といった他の正規化手法を用いて,画像のさまざまなアーチファクトに対して,モデル性能にロバスト性を注入することを提案する。
論文参考訳（メタデータ） (2023-06-23T03:09:03Z)
Semantic Latent Space Regression of Diffusion Autoencoders for Vertebral Fracture Grading [72.45699658852304]
本稿では,教師なし特徴抽出器として生成拡散オートエンコーダモデルを訓練するための新しい手法を提案する。フラクチャーグレーディングを連続回帰としてモデル化し, フラクチャーのスムーズな進行を反映した。重要なことに,本手法の創成特性は,与えられた脊椎の様々な段階を可視化し,自動グルーピングに寄与する特徴を解釈し,洞察することを可能にする。
論文参考訳（メタデータ） (2023-03-21T17:16:01Z)
Unified Framework for Histopathology Image Augmentation and Classification via Generative Models [6.404713841079193]
本稿では,データ生成とモデルトレーニングの段階を統一プロセスに統合する,革新的な統一フレームワークを提案する。提案手法では、画像合成と分類の両方を同時に扱うために、純粋視覚変換器(ViT)ベースの条件付き生成適応ネットワーク(cGAN)モデルを用いる。本実験により,我々の統合合成増強フレームワークは,病理組織像分類モデルの性能を一貫して向上させることが示された。
論文参考訳（メタデータ） (2022-12-20T03:40:44Z)
Contrastive Model Inversion for Data-Free Knowledge Distillation [60.08025054715192]
そこで、データ多様性を最適化可能な目的として明示的にモデル化するContrastive Model Inversionを提案します。我々の主な観察では、同じ量のデータの制約の下では、高いデータの多様性は、通常より強いインスタンス識別を示す。 CIFAR-10, CIFAR-100, Tiny-ImageNetを用いた実験により, 生成したデータを知識蒸留に使用する場合, CMIは極めて優れた性能を示すことが示された。
論文参考訳（メタデータ） (2021-05-18T15:13:00Z)
Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文参考訳（メタデータ） (2020-09-02T02:50:30Z)
Modeling Shared Responses in Neuroimaging Studies through MultiView ICA [94.31804763196116]
被験者の大規模なコホートを含むグループ研究は、脳機能組織に関する一般的な結論を引き出す上で重要である。グループ研究のための新しい多視点独立成分分析モデルを提案し、各被験者のデータを共有独立音源と雑音の線形結合としてモデル化する。まず、fMRIデータを用いて、被験者間の共通音源の同定における感度の向上を示す。
論文参考訳（メタデータ） (2020-06-11T17:29:53Z)
Self-Training with Improved Regularization for Sample-Efficient Chest X-Ray Classification [80.00316465793702]
挑戦的なシナリオで堅牢なモデリングを可能にするディープラーニングフレームワークを提案する。その結果,85%のラベル付きデータを用いて,大規模データ設定で学習した分類器の性能に適合する予測モデルを構築することができた。
論文参考訳（メタデータ） (2020-05-03T02:36:00Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。