論文の概要: Synthesising Rare Cataract Surgery Samples with Guided Diffusion Models
- arxiv url: http://arxiv.org/abs/2308.02587v1
- Date: Thu, 3 Aug 2023 18:09:26 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-08 19:47:14.258886
- Title: Synthesising Rare Cataract Surgery Samples with Guided Diffusion Models
- Title(参考訳): 誘導拡散モデルを用いた白内障手術例の合成
- Authors: Yannik Frisch, Moritz Fuchs, Antoine Sanner, Felix Anton Ucar, Marius
Frenzel, Joana Wasielica-Poslednik, Adrian Gericke, Felix Mathias Wagner,
Thomas Dratsch, Anirban Mukhopadhyay
- Abstract要約: 白内障手術の動画データを,訓練済みのツールの最悪のパフォーマンスの段階で分析する。
本モデルは,複雑なマルチクラスマルチラベル条件に基づいて,多種多様な高品質なサンプルを合成することができる。
人工的に拡張されたデータにより,ツール分類の下流タスクにおけるデータ空間の問題を改善することができる。
- 参考スコア(独自算出の注目度): 0.7577401420358975
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Cataract surgery is a frequently performed procedure that demands automation
and advanced assistance systems. However, gathering and annotating data for
training such systems is resource intensive. The publicly available data also
comprises severe imbalances inherent to the surgical process. Motivated by
this, we analyse cataract surgery video data for the worst-performing phases of
a pre-trained downstream tool classifier. The analysis demonstrates that
imbalances deteriorate the classifier's performance on underrepresented cases.
To address this challenge, we utilise a conditional generative model based on
Denoising Diffusion Implicit Models (DDIM) and Classifier-Free Guidance (CFG).
Our model can synthesise diverse, high-quality examples based on complex
multi-class multi-label conditions, such as surgical phases and combinations of
surgical tools. We affirm that the synthesised samples display tools that the
classifier recognises. These samples are hard to differentiate from real
images, even for clinical experts with more than five years of experience.
Further, our synthetically extended data can improve the data sparsity problem
for the downstream task of tool classification. The evaluations demonstrate
that the model can generate valuable unseen examples, allowing the tool
classifier to improve by up to 10% for rare cases. Overall, our approach can
facilitate the development of automated assistance systems for cataract surgery
by providing a reliable source of realistic synthetic data, which we make
available for everyone.
- Abstract(参考訳): 白内障手術は、自動化と高度な補助システムを必要とする頻繁な手術である。
しかし、そのようなシステムのトレーニングのためのデータの収集と注釈はリソース集約的です。
公開されているデータは、手術プロセスに固有の深刻な不均衡も含んでいる。
そこで本研究では,前訓練した下流ツール分類器の最悪の相に対する白内障手術ビデオデータの解析を行った。
分析の結果,不均衡が不均衡な場合における分類器の性能を低下させることが示された。
この課題を解決するために,Diffusion Implicit Models (DDIM) と Classifier-Free Guidance (CFG) に基づく条件生成モデルを利用する。
本モデルでは, 手術段階や手術器具の組み合わせなど, 複雑な多言語条件に基づいて, 多様な高品質な例を合成することができる。
合成されたサンプルは、分類器が認識するツールを表示する。
これらのサンプルは、5年以上の経験を持つ臨床専門家にとっても、実際の画像と区別が難しい。
さらに,この合成拡張データにより,ツール分類の下流タスクにおけるデータスパーシティ問題を改善できる。
評価の結果、モデルは貴重な未発見の例を生成できることが示され、稀なケースではツール分類器を最大10%改善することができる。
全体として,本手法は,現実的な合成データの信頼できる情報源を提供することにより,白内障手術の自動化支援システムの開発を促進することができる。
関連論文リスト
- SurgicaL-CD: Generating Surgical Images via Unpaired Image Translation with Latent Consistency Diffusion Models [1.6189876649941652]
現実的な手術画像を生成するために, 連続拡散法であるemphSurgicaL-CDを導入する。
以上の結果から,本手法はGANや拡散に基づく手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2024-08-19T09:19:25Z) - Synthetic Image Learning: Preserving Performance and Preventing Membership Inference Attacks [5.0243930429558885]
本稿では,下流分類器の学習のための合成データの生成と利用を最適化するパイプラインである知識リサイクル(KR)を紹介する。
このパイプラインの核心は生成的知識蒸留(GKD)であり、情報の品質と有用性を大幅に向上させる技術が提案されている。
その結果、実データと合成データでトレーニングされたモデルと、実データでトレーニングされたモデルとの性能差が著しく低下した。
論文 参考訳(メタデータ) (2024-07-22T10:31:07Z) - TSynD: Targeted Synthetic Data Generation for Enhanced Medical Image Classification [0.011037620731410175]
この研究は、生成モデルを誘導し、高い不確実性でデータを合成することを目的としている。
最適化プロセスによりオートエンコーダの特徴空間を変更する。
我々は,複数の分類タスクに対するテスト時間データ拡張と敵攻撃に対する堅牢性を向上させる。
論文 参考訳(メタデータ) (2024-06-25T11:38:46Z) - Improving Deep Learning-based Automatic Cranial Defect Reconstruction by Heavy Data Augmentation: From Image Registration to Latent Diffusion Models [0.2911706166691895]
この研究は、パーソナライズされた頭蓋インプラントの自動モデリングにおける人工知能の分野に多大な貢献をしている。
重データの増大が定量的および定性的な結果の両方を著しく増加させることを示す。
また, 人工的に拡張したネットワークは, 実際の臨床的欠陥を再構築することに成功した。
論文 参考訳(メタデータ) (2024-06-10T15:34:23Z) - On Sensitivity and Robustness of Normalization Schemes to Input
Distribution Shifts in Automatic MR Image Diagnosis [58.634791552376235]
深層学習(DL)モデルは、再構成画像を入力として、複数の疾患の診断において最先端のパフォーマンスを達成した。
DLモデルは、トレーニングとテストフェーズ間の入力データ分布の変化につながるため、さまざまなアーティファクトに敏感である。
本稿では,グループ正規化やレイヤ正規化といった他の正規化手法を用いて,画像のさまざまなアーチファクトに対して,モデル性能にロバスト性を注入することを提案する。
論文 参考訳(メタデータ) (2023-06-23T03:09:03Z) - Semantic Latent Space Regression of Diffusion Autoencoders for Vertebral
Fracture Grading [72.45699658852304]
本稿では,教師なし特徴抽出器として生成拡散オートエンコーダモデルを訓練するための新しい手法を提案する。
フラクチャーグレーディングを連続回帰としてモデル化し, フラクチャーのスムーズな進行を反映した。
重要なことに,本手法の創成特性は,与えられた脊椎の様々な段階を可視化し,自動グルーピングに寄与する特徴を解釈し,洞察することを可能にする。
論文 参考訳(メタデータ) (2023-03-21T17:16:01Z) - Unified Framework for Histopathology Image Augmentation and Classification via Generative Models [6.404713841079193]
本稿では,データ生成とモデルトレーニングの段階を統一プロセスに統合する,革新的な統一フレームワークを提案する。
提案手法では、画像合成と分類の両方を同時に扱うために、純粋視覚変換器(ViT)ベースの条件付き生成適応ネットワーク(cGAN)モデルを用いる。
本実験により,我々の統合合成増強フレームワークは,病理組織像分類モデルの性能を一貫して向上させることが示された。
論文 参考訳(メタデータ) (2022-12-20T03:40:44Z) - Contrastive Model Inversion for Data-Free Knowledge Distillation [60.08025054715192]
そこで、データ多様性を最適化可能な目的として明示的にモデル化するContrastive Model Inversionを提案します。
我々の主な観察では、同じ量のデータの制約の下では、高いデータの多様性は、通常より強いインスタンス識別を示す。
CIFAR-10, CIFAR-100, Tiny-ImageNetを用いた実験により, 生成したデータを知識蒸留に使用する場合, CMIは極めて優れた性能を示すことが示された。
論文 参考訳(メタデータ) (2021-05-18T15:13:00Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Modeling Shared Responses in Neuroimaging Studies through MultiView ICA [94.31804763196116]
被験者の大規模なコホートを含むグループ研究は、脳機能組織に関する一般的な結論を引き出す上で重要である。
グループ研究のための新しい多視点独立成分分析モデルを提案し、各被験者のデータを共有独立音源と雑音の線形結合としてモデル化する。
まず、fMRIデータを用いて、被験者間の共通音源の同定における感度の向上を示す。
論文 参考訳(メタデータ) (2020-06-11T17:29:53Z) - Self-Training with Improved Regularization for Sample-Efficient Chest
X-Ray Classification [80.00316465793702]
挑戦的なシナリオで堅牢なモデリングを可能にするディープラーニングフレームワークを提案する。
その結果,85%のラベル付きデータを用いて,大規模データ設定で学習した分類器の性能に適合する予測モデルを構築することができた。
論文 参考訳(メタデータ) (2020-05-03T02:36:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。