論文の概要: MicroEvoEval: A Systematic Evaluation Framework for Image-Based Microstructure Evolution Prediction
- arxiv url: http://arxiv.org/abs/2511.08955v2
- Date: Tue, 18 Nov 2025 06:31:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-19 13:59:16.496611
- Title: MicroEvoEval: A Systematic Evaluation Framework for Image-Based Microstructure Evolution Prediction
- Title(参考訳): MicroEvoEval: 画像に基づく組織進化予測のためのシステム評価フレームワーク
- Authors: Qinyi Zhang, Duanyu Feng, Ronghui Han, Yangshuai Wang, Hao Wang,
- Abstract要約: 我々は、画像ベースの進化予測のための最初の総合的なベンチマークであるMicroEvoEvalを紹介する。
ドメイン固有のアーキテクチャと汎用アーキテクチャの両方を含む14のモデルを,4つの代表的MicroEvoタスクにわたって評価した。
- 参考スコア(独自算出の注目度): 5.114987417721577
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Simulating microstructure evolution (MicroEvo) is vital for materials design but demands high numerical accuracy, efficiency, and physical fidelity. Although recent studies on deep learning (DL) offer a promising alternative to traditional solvers, the field lacks standardized benchmarks. Existing studies are flawed due to a lack of comparing specialized MicroEvo DL models with state-of-the-art spatio-temporal architectures, an overemphasis on numerical accuracy over physical fidelity, and a failure to analyze error propagation over time. To address these gaps, we introduce MicroEvoEval, the first comprehensive benchmark for image-based microstructure evolution prediction. We evaluate 14 models, encompassing both domain-specific and general-purpose architectures, across four representative MicroEvo tasks with datasets specifically structured for both short- and long-term assessment. Our multi-faceted evaluation framework goes beyond numerical accuracy and computational cost, incorporating a curated set of structure-preserving metrics to assess physical fidelity. Our extensive evaluations yield several key insights. Notably, we find that modern architectures (e.g., VMamba), not only achieve superior long-term stability and physical fidelity but also operate with an order-of-magnitude greater computational efficiency. The results highlight the necessity of holistic evaluation and identify these modern architectures as a highly promising direction for developing efficient and reliable surrogate models in data-driven materials science.
- Abstract(参考訳): マイクロエボ(MicroEvo)のシミュレーションは材料設計には不可欠であるが、高い数値的精度、効率、物理的忠実さを必要とする。
近年のディープラーニング(DL)の研究は、従来の解法に代わる有望な代替手段を提供しているが、標準化されたベンチマークは欠如している。
既存の研究は、専門のMicroEvo DLモデルと最先端の時空間アーキテクチャを比較していないこと、物理的忠実性よりも数値的精度が過大評価されていること、時間とともにエラーの伝播を分析することができないこと、などの欠点がある。
これらのギャップに対処するために、画像ベースの微細構造進化予測のための最初の総合的なベンチマークであるMicroEvoEvalを紹介する。
ドメイン固有のアーキテクチャと汎用アーキテクチャの両方を含む14のモデルを,短期的および長期的評価に特化して構築されたデータセットを持つ4つの代表的MicroEvoタスクにわたって評価する。
我々の多面的評価フレームワークは、数値的精度と計算コストを超越し、物理忠実度を評価するための構造化された構造保存指標を取り入れている。
私たちの広範な評価は、いくつかの重要な洞察をもたらします。
特に、最近のアーキテクチャ(例えばVMamba)は、より優れた長期的安定性と物理的忠実性を達成するだけでなく、より高次計算効率で動作する。
この結果は、データ駆動材料科学における効率的で信頼性の高いサロゲートモデルを開発する上で、包括的評価の必要性を強調し、これらの近代的アーキテクチャを極めて有望な方向として特定する。
関連論文リスト
- Rethinking Evaluation of Infrared Small Target Detection [105.59753496831739]
本稿では,画素レベルと目標レベルのパフォーマンスを取り入れたハイブリッドレベルのメトリクスを導入し,システム的エラー解析手法を提案し,クロスデータセット評価の重要性を強調した。
標準化されたベンチマークを容易にするオープンソースツールキットがリリースされた。
論文 参考訳(メタデータ) (2025-09-21T02:45:07Z) - Computational, Data-Driven, and Physics-Informed Machine Learning Approaches for Microstructure Modeling in Metal Additive Manufacturing [0.0]
金属添加物の製造は、前例のない設計の自由と、カスタマイズされた複雑な部品の製造を可能にする。
金属AMプロセスに固有の急激な融解と凝固のダイナミクスは、不均一で非平衡な微細構造を生成する。
空間的・時間的スケールにわたる微細構造とその進化を予測することは、プロセス最適化と欠陥軽減の重要な課題である。
論文 参考訳(メタデータ) (2025-05-02T17:59:54Z) - Benchmarks as Microscopes: A Call for Model Metrology [76.64402390208576]
現代の言語モデル(LM)は、能力評価において新たな課題を提起する。
メトリクスに自信を持つためには、モデルミアロジの新たな規律が必要です。
論文 参考訳(メタデータ) (2024-07-22T17:52:12Z) - GenBench: A Benchmarking Suite for Systematic Evaluation of Genomic Foundation Models [56.63218531256961]
我々はGenomic Foundation Modelsの有効性を評価するためのベンチマークスイートであるGenBenchを紹介する。
GenBenchはモジュラーで拡張可能なフレームワークを提供し、様々な最先端の方法論をカプセル化している。
本稿では,タスク固有性能におけるモデルアーキテクチャとデータセット特性の相互作用のニュアンス解析を行う。
論文 参考訳(メタデータ) (2024-06-01T08:01:05Z) - Rethinking model prototyping through the MedMNIST+ dataset collection [0.11999555634662634]
この作業では、MedMNIST+データセットコレクションの包括的なベンチマークを導入する。
我々は、一般的なCNN(Convolutional Neural Networks)とViT(Vision Transformer)アーキテクチャを、異なる医療データセットにわたって再評価する。
この結果から,計算効率のよいトレーニングスキームと最新の基礎モデルが,エンドツーエンドのトレーニングに有効な代替手段を提供する可能性が示唆された。
論文 参考訳(メタデータ) (2024-04-24T10:19:25Z) - Computer Vision Methods for the Microstructural Analysis of Materials:
The State-of-the-art and Future Perspectives [0.4595477728342621]
本稿では, マルチスケール画像解析に応用された最先端CNN技術について概説する。
材料科学研究へのこれらの手法の適用に関する主な課題を同定する。
論文 参考訳(メタデータ) (2022-07-29T15:27:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。