論文の概要: Synthesising Rare Cataract Surgery Samples with Guided Diffusion Models
- arxiv url: http://arxiv.org/abs/2308.02587v1
- Date: Thu, 3 Aug 2023 18:09:26 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-08 19:47:14.258886
- Title: Synthesising Rare Cataract Surgery Samples with Guided Diffusion Models
- Title(参考訳): 誘導拡散モデルを用いた白内障手術例の合成
- Authors: Yannik Frisch, Moritz Fuchs, Antoine Sanner, Felix Anton Ucar, Marius
Frenzel, Joana Wasielica-Poslednik, Adrian Gericke, Felix Mathias Wagner,
Thomas Dratsch, Anirban Mukhopadhyay
- Abstract要約: 白内障手術の動画データを,訓練済みのツールの最悪のパフォーマンスの段階で分析する。
本モデルは,複雑なマルチクラスマルチラベル条件に基づいて,多種多様な高品質なサンプルを合成することができる。
人工的に拡張されたデータにより,ツール分類の下流タスクにおけるデータ空間の問題を改善することができる。
- 参考スコア(独自算出の注目度): 0.7577401420358975
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Cataract surgery is a frequently performed procedure that demands automation
and advanced assistance systems. However, gathering and annotating data for
training such systems is resource intensive. The publicly available data also
comprises severe imbalances inherent to the surgical process. Motivated by
this, we analyse cataract surgery video data for the worst-performing phases of
a pre-trained downstream tool classifier. The analysis demonstrates that
imbalances deteriorate the classifier's performance on underrepresented cases.
To address this challenge, we utilise a conditional generative model based on
Denoising Diffusion Implicit Models (DDIM) and Classifier-Free Guidance (CFG).
Our model can synthesise diverse, high-quality examples based on complex
multi-class multi-label conditions, such as surgical phases and combinations of
surgical tools. We affirm that the synthesised samples display tools that the
classifier recognises. These samples are hard to differentiate from real
images, even for clinical experts with more than five years of experience.
Further, our synthetically extended data can improve the data sparsity problem
for the downstream task of tool classification. The evaluations demonstrate
that the model can generate valuable unseen examples, allowing the tool
classifier to improve by up to 10% for rare cases. Overall, our approach can
facilitate the development of automated assistance systems for cataract surgery
by providing a reliable source of realistic synthetic data, which we make
available for everyone.
- Abstract(参考訳): 白内障手術は、自動化と高度な補助システムを必要とする頻繁な手術である。
しかし、そのようなシステムのトレーニングのためのデータの収集と注釈はリソース集約的です。
公開されているデータは、手術プロセスに固有の深刻な不均衡も含んでいる。
そこで本研究では,前訓練した下流ツール分類器の最悪の相に対する白内障手術ビデオデータの解析を行った。
分析の結果,不均衡が不均衡な場合における分類器の性能を低下させることが示された。
この課題を解決するために,Diffusion Implicit Models (DDIM) と Classifier-Free Guidance (CFG) に基づく条件生成モデルを利用する。
本モデルでは, 手術段階や手術器具の組み合わせなど, 複雑な多言語条件に基づいて, 多様な高品質な例を合成することができる。
合成されたサンプルは、分類器が認識するツールを表示する。
これらのサンプルは、5年以上の経験を持つ臨床専門家にとっても、実際の画像と区別が難しい。
さらに,この合成拡張データにより,ツール分類の下流タスクにおけるデータスパーシティ問題を改善できる。
評価の結果、モデルは貴重な未発見の例を生成できることが示され、稀なケースではツール分類器を最大10%改善することができる。
全体として,本手法は,現実的な合成データの信頼できる情報源を提供することにより,白内障手術の自動化支援システムの開発を促進することができる。
関連論文リスト
- DE-CGAN: Boosting rTMS Treatment Prediction with Diversity Enhancing Conditional Generative Adversarial Networks [16.850380946914946]
そこで本研究では,De-CGAN(Diversity Enhancing Conditional General Adversarial Network)による分類モデルの性能向上について述べる。
この研究は、トレーニングデータセットの多様性を高めることで、分類モデルのパフォーマンスが向上することを示している。
論文 参考訳(メタデータ) (2024-04-25T15:15:58Z) - On Sensitivity and Robustness of Normalization Schemes to Input
Distribution Shifts in Automatic MR Image Diagnosis [58.634791552376235]
深層学習(DL)モデルは、再構成画像を入力として、複数の疾患の診断において最先端のパフォーマンスを達成した。
DLモデルは、トレーニングとテストフェーズ間の入力データ分布の変化につながるため、さまざまなアーティファクトに敏感である。
本稿では,グループ正規化やレイヤ正規化といった他の正規化手法を用いて,画像のさまざまなアーチファクトに対して,モデル性能にロバスト性を注入することを提案する。
論文 参考訳(メタデータ) (2023-06-23T03:09:03Z) - Semantic Latent Space Regression of Diffusion Autoencoders for Vertebral
Fracture Grading [72.45699658852304]
本稿では,教師なし特徴抽出器として生成拡散オートエンコーダモデルを訓練するための新しい手法を提案する。
フラクチャーグレーディングを連続回帰としてモデル化し, フラクチャーのスムーズな進行を反映した。
重要なことに,本手法の創成特性は,与えられた脊椎の様々な段階を可視化し,自動グルーピングに寄与する特徴を解釈し,洞察することを可能にする。
論文 参考訳(メタデータ) (2023-03-21T17:16:01Z) - Rethinking Surgical Instrument Segmentation: A Background Image Can Be
All You Need [18.830738606514736]
データ不足と不均衡はモデルの精度に大きな影響を与え、ディープラーニングベースの手術アプリケーションの設計と展開を制限してきた。
本稿では,ロボット手術によるデータ収集とアノテーションの複雑で高価なプロセスを排除する,1対多のデータ生成ソリューションを提案する。
経験的分析から,高コストなデータ収集とアノテーションがなければ,適切な手術器具のセグメンテーション性能が達成できることが示唆された。
論文 参考訳(メタデータ) (2022-06-23T16:22:56Z) - SyntheX: Scaling Up Learning-based X-ray Image Analysis Through In
Silico Experiments [12.019996672009375]
人間のモデルからリアルなシミュレートされた画像を作成することは、大規模なIn situデータ収集の代替となることを示す。
人体モデルからの学習データの合成は、容易にスケールできるので、我々がSyntheXと呼ぶX線画像解析のためのモデル転送パラダイムが、実際のデータ学習モデルよりも優れていることが分かりました。
論文 参考訳(メタデータ) (2022-06-13T13:08:41Z) - Fast Unsupervised Brain Anomaly Detection and Segmentation with
Diffusion Models [1.6352599467675781]
脳画像における異常検出とセグメント分割のための拡散モデルに基づく手法を提案する。
拡散モデルは,2次元CTおよびMRIデータを用いた一連の実験において,自己回帰的アプローチと比較して競争性能が向上する。
論文 参考訳(メタデータ) (2022-06-07T17:30:43Z) - Contrastive Model Inversion for Data-Free Knowledge Distillation [60.08025054715192]
そこで、データ多様性を最適化可能な目的として明示的にモデル化するContrastive Model Inversionを提案します。
我々の主な観察では、同じ量のデータの制約の下では、高いデータの多様性は、通常より強いインスタンス識別を示す。
CIFAR-10, CIFAR-100, Tiny-ImageNetを用いた実験により, 生成したデータを知識蒸留に使用する場合, CMIは極めて優れた性能を示すことが示された。
論文 参考訳(メタデータ) (2021-05-18T15:13:00Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Modeling Shared Responses in Neuroimaging Studies through MultiView ICA [94.31804763196116]
被験者の大規模なコホートを含むグループ研究は、脳機能組織に関する一般的な結論を引き出す上で重要である。
グループ研究のための新しい多視点独立成分分析モデルを提案し、各被験者のデータを共有独立音源と雑音の線形結合としてモデル化する。
まず、fMRIデータを用いて、被験者間の共通音源の同定における感度の向上を示す。
論文 参考訳(メタデータ) (2020-06-11T17:29:53Z) - Self-Training with Improved Regularization for Sample-Efficient Chest
X-Ray Classification [80.00316465793702]
挑戦的なシナリオで堅牢なモデリングを可能にするディープラーニングフレームワークを提案する。
その結果,85%のラベル付きデータを用いて,大規模データ設定で学習した分類器の性能に適合する予測モデルを構築することができた。
論文 参考訳(メタデータ) (2020-05-03T02:36:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。