論文の概要: Process-aware and high-fidelity microstructure generation using stable diffusion
- arxiv url: http://arxiv.org/abs/2507.00459v1
- Date: Tue, 01 Jul 2025 06:16:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-03 14:22:59.361087
- Title: Process-aware and high-fidelity microstructure generation using stable diffusion
- Title(参考訳): 安定拡散を用いたプロセス認識・高忠実微細構造生成
- Authors: Hoang Cuong Phan, Minh Tien Tran, Chihun Lee, Hoheok Kim, Sehyok Oh, Dong-Kyu Kim, Ho Won Lee,
- Abstract要約: 安定拡散3.5 Large (SD3.5-Large) に基づくプロセス認識生成モデリング手法を提案する。
本手法では,連続変数を直接モデル条件にエンコードする数値認識埋め込みを導入する。
我々は24個のラベル付きマイクログラフ上にVGG16エンコーダを備えた細調整U-Netに基づくセマンティックセグメンテーションモデルを用いてリアリズムを検証する。
- 参考スコア(独自算出の注目度): 0.8060624778923473
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Synthesizing realistic microstructure images conditioned on processing parameters is crucial for understanding process-structure relationships in materials design. However, this task remains challenging due to limited training micrographs and the continuous nature of processing variables. To overcome these challenges, we present a novel process-aware generative modeling approach based on Stable Diffusion 3.5 Large (SD3.5-Large), a state-of-the-art text-to-image diffusion model adapted for microstructure generation. Our method introduces numeric-aware embeddings that encode continuous variables (annealing temperature, time, and magnification) directly into the model's conditioning, enabling controlled image generation under specified process conditions and capturing process-driven microstructural variations. To address data scarcity and computational constraints, we fine-tune only a small fraction of the model's weights via DreamBooth and Low-Rank Adaptation (LoRA), efficiently transferring the pre-trained model to the materials domain. We validate realism using a semantic segmentation model based on a fine-tuned U-Net with a VGG16 encoder on 24 labeled micrographs. It achieves 97.1% accuracy and 85.7% mean IoU, outperforming previous methods. Quantitative analyses using physical descriptors and spatial statistics show strong agreement between synthetic and real microstructures. Specifically, two-point correlation and lineal-path errors remain below 2.1% and 0.6%, respectively. Our method represents the first adaptation of SD3.5-Large for process-aware microstructure generation, offering a scalable approach for data-driven materials design.
- Abstract(参考訳): 材料設計におけるプロセス構造関係を理解するためには, プロセスパラメータを条件としたリアルな微細構造画像の合成が不可欠である。
しかし、この課題は、限られた訓練用マイクログラフと処理変数の連続的な性質のため、依然として困難なままである。
これらの課題を克服するために、我々は、マイクロ構造生成に適応した最先端のテキスト・画像拡散モデルである、SD3.5-Large(Stable Diffusion 3.5 Large)に基づくプロセス認識生成モデルを提案する。
本手法では, 連続変数(温度, 時間, 倍率)を直接モデル条件にエンコードする数値認識埋め込みを導入し, プロセス条件下での制御画像生成とプロセス駆動型マイクロ構造変化のキャプチャを可能にする。
データ不足と計算上の制約に対処するため、DreamBooth と Low-Rank Adaptation (LoRA) を介してモデル重量のごく一部だけを微調整し、事前学習されたモデルを材料領域に効率的に転送する。
我々は24個のラベル付きマイクログラフ上にVGG16エンコーダを備えた細調整U-Netに基づくセマンティックセグメンテーションモデルを用いてリアリズムを検証する。
精度は97.1%、IoUは85.7%で、従来の手法より優れていた。
物理ディスクリプタと空間統計を用いた定量的解析は, 合成構造と実構造との強い一致を示す。
具体的には、2点相関と直線パス誤差はそれぞれ2.1%と0.6%以下である。
本手法は,SD3.5-Largeをプロセス対応マイクロ構造生成に適用し,データ駆動材料設計にスケーラブルなアプローチを提供する。
関連論文リスト
- Improving Progressive Generation with Decomposable Flow Matching [50.63174319509629]
Decomposable Flow Matching (DFM)は、ビジュアルメディアのプログレッシブな生成のためのシンプルで効果的なフレームワークである。
Imagenet-1k 512pxでは、DFMはベースアーキテクチャよりも35.2%改善され、ベースラインは26.4%向上した。
論文 参考訳(メタデータ) (2025-06-24T17:58:02Z) - Solving Inverse Problems with FLAIR [59.02385492199431]
フローベースの潜在生成モデルは、驚くべき品質の画像を生成でき、テキスト・ツー・イメージ生成も可能である。
本稿では,フローベース生成モデルを逆問題の前兆として活用する新しい学習自由変分フレームワークFLAIRを提案する。
標準画像ベンチマークの結果、FLAIRは再現性やサンプルの多様性の観点から、既存の拡散法や流れ法よりも一貫して優れていることが示された。
論文 参考訳(メタデータ) (2025-06-03T09:29:47Z) - CRISP: A Framework for Cryo-EM Image Segmentation and Processing with Conditional Random Field [0.0]
本稿では,Cryo-EMデータから高品質なセグメンテーションマップを自動生成するパイプラインを提案する。
我々のモジュラーフレームワークは、様々なセグメンテーションモデルと損失関数の選択を可能にする。
限られたマイクログラフでトレーニングすると、合成データ上で90%以上の精度、リコール、精度、インターセクション・オーバー・ユニオン(IoU)、F1スコアを達成することができる。
論文 参考訳(メタデータ) (2025-02-12T10:44:45Z) - Stable Consistency Tuning: Understanding and Improving Consistency Models [40.2712218203989]
拡散モデルは、より優れた生成品質を達成するが、復調の反復的な性質により、生成速度が遅くなる。
新しいジェネレーティブファミリーである一貫性モデルは、非常に高速なサンプリングで競争性能を達成する。
本稿では,拡散モデルの分解過程をマルコフ決定過程(MDP)としてモデル化し,時間差分学習(TD)による値推定としてフレーミング一貫性モデルのトレーニングを提案する。
論文 参考訳(メタデータ) (2024-10-24T17:55:52Z) - Model Inversion Attacks Through Target-Specific Conditional Diffusion Models [54.69008212790426]
モデル反転攻撃(MIA)は、ターゲット分類器のトレーニングセットからプライベートイメージを再構築することを目的としており、それによってAIアプリケーションにおけるプライバシー上の懸念が高まる。
従来のGANベースのMIAは、GANの固有の欠陥と潜伏空間における最適化の偏りにより、劣った遺伝子的忠実度に悩まされる傾向にある。
これらの問題を緩和するために拡散モデル反転(Diff-MI)攻撃を提案する。
論文 参考訳(メタデータ) (2024-07-16T06:38:49Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - A microstructure estimation Transformer inspired by sparse
representation for diffusion MRI [11.761543033212797]
ダウンサンプルq空間データを用いたdMRIによる微細構造推定のためのTransformerに基づく学習ベースフレームワークを提案する。
提案手法は,スキャン時間で最大11.25倍の加速を実現し,他の最先端の学習手法よりも優れていた。
論文 参考訳(メタデータ) (2022-05-13T05:14:22Z) - Normalizing Flows with Multi-Scale Autoregressive Priors [131.895570212956]
マルチスケール自己回帰前処理(mAR)を通した遅延空間におけるチャネルワイド依存性を導入する。
我々のmARは、分割結合フロー層(mAR-SCF)を持つモデルに先立って、複雑なマルチモーダルデータの依存関係をよりよく捉えます。
我々は,mAR-SCFにより画像生成品質が向上し,FIDとインセプションのスコアは最先端のフローベースモデルと比較して向上したことを示す。
論文 参考訳(メタデータ) (2020-04-08T09:07:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。