Fugu-MT 論文翻訳(概要): Improving Combined Detection and Classification of TEM Defects via Mask-Conditioned Latent Diffusion Augmentation

論文の概要: Improving Combined Detection and Classification of TEM Defects via Mask-Conditioned Latent Diffusion Augmentation

arxiv url: http://arxiv.org/abs/2606.02532v1
Date: Mon, 01 Jun 2026 17:38:47 GMT
ステータス: 翻訳完了
システム内更新日: 2026-06-02 21:34:32.545135
Title: Improving Combined Detection and Classification of TEM Defects via Mask-Conditioned Latent Diffusion Augmentation
Title（参考訳）: Mask-Conditioned Latent Diffusion AugmentationによるTEM欠陥の検出と分類の改善
Authors: Ni Li, Nuohao Liu, Ryan Jacobs, Ajay Annamareddy, Maciej P. Polak, Kevin Field, Izabela Szlufarska, Dane Morgan,
Abstract要約: マスク条件付き潜時拡散モデル(LDM)を用いた生成データ拡張手法を導入し,現実的なTEM画像を制御可能で自動ラベル付き欠陥マスクで合成する。以上の結果から,F1スコアの高調波平均値が最大0.02向上し,モデル全体の性能が向上することが示唆された。
参考スコア（独自算出の注目度）: 2.471708266724695
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Analyzing microstructural defects in transmission electron microscopy (TEM) images, particularly in irradiated metal alloys, is often limited by the availability of high-quality, labeled data. To address this, we introduce a generative data augmentation approach using a mask-conditioned latent diffusion model (LDM) for synthesizing realistic TEM images with controllable, automatically labeled multi-class defect masks. Without requiring manual annotations for generation, our method enables the creation of synthetic image-mask pairs by sampling distributions learned from experimental masks. These generated data were used to augment small experimental datasets of varying sizes (10, 50, and 100 labeled experimental images) to train a Mask Regional Convolutional Neural Network (R-CNN) model for defect detection and classification. Our results show that generative augmentation yields small overall model performance improvements, with up to a 0.02 gain in the harmonic mean of detection and classification F1 scores. However, we also find that the relative contributions to detection and classification improvement depend on the specific train/test data split. These findings highlight the potential of targeted generative models to enhance deep learning performance in data-scarce microscopy-based image quantification tasks.
Abstract（参考訳）: 透過電子顕微鏡(TEM)画像、特に照射された金属合金における微細構造欠陥の解析は、高品質なラベル付きデータの利用によって制限されることが多い。マスク条件付き潜時拡散モデル(LDM)を用いて,実写TEM画像を制御可能・自動ラベル付きマルチクラス欠陥マスクで合成する生成データ拡張手法を提案する。提案手法は,手動のアノテーションを生成のために必要とせず,実験マスクから学習した分布をサンプリングすることにより,合成画像マスクペアの作成を可能にする。これらの生成されたデータは、さまざまなサイズ(10, 50, 100ラベルのラベル付き実験画像)の小さな実験データセットを拡張して、欠陥検出と分類のためにMask Regional Convolutional Neural Network(R-CNN)モデルをトレーニングするために使用された。以上の結果から,F1スコアの高調波平均値が0.02まで向上し,モデル全体の性能が向上することが示唆された。しかし、検出と分類の改善に対する相対的な寄与は、特定の列車/テストデータの分割に依存していることも判明した。これらの知見は,データスカース顕微鏡による画像定量化作業におけるディープラーニング性能向上を目的とした生成モデルの可能性を明らかにするものである。

関連論文リスト

Micro-Defects Expose Macro-Fakes: Detecting AI-Generated Images via Local Distributional Shifts [48.75898711300078]
生成モデルは、非常に現実的なように見えるイメージを生成することができ、実際の画像とAI生成イメージを区別する上での課題を提起する。局所分布認識検出フレームワークであるマクロフェイク(MDMF)のマイクロ欠陥をマクロレベルの分布不規則性に増幅する。提案手法は, 局所的な法医学的信号が生成画像に存在する場合, パッチワイド・モデリングにより, 明らかな相違が生じることを示す。
論文参考訳（メタデータ） (2026-05-10T03:44:09Z)
SkinDualGen: Prompt-Driven Diffusion for Simultaneous Image-Mask Generation in Skin Lesions [0.0]
本稿では, トレーニング済み安定拡散2.0モデルを用いて, 高品質な合成皮膚病変画像を生成する手法を提案する。実データと合成データを組み合わせたハイブリッドデータセットは、分類とセグメンテーションモデルの性能を著しく向上させる。
論文参考訳（メタデータ） (2025-07-26T15:00:37Z)
MaskTerial: A Foundation Model for Automated 2D Material Flake Detection [48.73213960205105]
MaskTerialと呼ばれる深層学習モデルを提案する。このモデルでは、インスタンスセグメンテーションネットワークを用いて、2D素材のフレークを確実に識別する。このモデルは、ラベルのないデータからリアルな顕微鏡画像を生成する合成データ生成装置を用いて、広範囲に事前訓練されている。六方晶窒化ホウ素などの低コントラスト材料の検出において,既存の技術よりも顕著な改善が認められた。
論文参考訳（メタデータ） (2024-12-12T15:01:39Z)
Retinal OCT Synthesis with Denoising Diffusion Probabilistic Models for Layer Segmentation [2.4113205575263708]
本稿では,拡散確率モデル(DDPM)を用いて網膜光コヒーレンス断層撮影(OCT)画像を自動的に生成する画像合成手法を提案する。階層分割の精度を一貫して改善し,様々なニューラルネットワークを用いて検証する。これらの結果から,網膜CT画像の手動アノテーションの必要性が軽減される可能性が示唆された。
論文参考訳（メタデータ） (2023-11-09T16:09:24Z)
ArSDM: Colonoscopy Images Synthesis with Adaptive Refinement Semantic Diffusion Models [69.9178140563928]
大腸内視鏡検査は臨床診断や治療に不可欠である。注釈付きデータの不足は、既存の手法の有効性と一般化を制限する。本稿では, 下流作業に有用な大腸内視鏡画像を生成するために, 適応Refinement Semantic Diffusion Model (ArSDM)を提案する。
論文参考訳（メタデータ） (2023-09-03T07:55:46Z)
Optimizations of Autoencoders for Analysis and Classification of Microscopic In Situ Hybridization Images [68.8204255655161]
同様のレベルの遺伝子発現を持つ顕微鏡画像の領域を検出・分類するためのディープラーニングフレームワークを提案する。分析するデータには教師なし学習モデルが必要です。
論文参考訳（メタデータ） (2023-04-19T13:45:28Z)
Fast Unsupervised Brain Anomaly Detection and Segmentation with Diffusion Models [1.6352599467675781]
脳画像における異常検出とセグメント分割のための拡散モデルに基づく手法を提案する。拡散モデルは,2次元CTおよびMRIデータを用いた一連の実験において,自己回帰的アプローチと比較して競争性能が向上する。
論文参考訳（メタデータ） (2022-06-07T17:30:43Z)
Negligible effect of brain MRI data preprocessing for tumor segmentation [36.89606202543839]
我々は3つの公開データセットの実験を行い、ディープニューラルネットワークにおける異なる前処理ステップの効果を評価する。その結果、最も一般的な標準化手順は、ネットワーク性能に何の価値も与えないことが示されている。画像の規格化に伴う信号分散の低減のため,画像強度正規化手法はモデル精度に寄与しない。
論文参考訳（メタデータ） (2022-04-11T17:29:36Z)
Performance, Successes and Limitations of Deep Learning Semantic Segmentation of Multiple Defects in Transmission Electron Micrographs [9.237363938772479]
深層学習Mask Regional Convolutional Neural Network (Mask R-CNN)モデルを用いて, 電子顕微鏡によるFeCrAl合金の欠陥のセマンティックセグメンテーションを行う。本稿では, 欠陥形状の予測分布, 欠陥サイズ, 欠陥同感度などの量に着目し, キーモデルの性能統計の詳細な分析を行う。全体として、現在のモデルは、顕微鏡画像中の複数の欠陥タイプを自動解析し、定量化するための、高速で効果的なツールであることがわかった。
論文参考訳（メタデータ） (2021-10-15T17:57:59Z)
Improved Slice-wise Tumour Detection in Brain MRIs by Computing Dissimilarities between Latent Representations [68.8204255655161]
磁気共鳴画像(MRI)の異常検出は教師なし手法で行うことができる。本研究では,変分オートエンコーダの潜伏空間における相似関数の計算に基づいて,腫瘍検出のためのスライスワイズ半教師法を提案する。本研究では,高解像度画像上でのモデルをトレーニングし,再現の質を向上させることにより,異なるベースラインに匹敵する結果が得られることを示す。
論文参考訳（メタデータ） (2020-07-24T14:02:09Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。