論文の概要: MatFormBench: A Benchmarking Evaluation Framework for Target-Driven Materials Formulation
- arxiv url: http://arxiv.org/abs/2605.26741v1
- Date: Tue, 26 May 2026 09:15:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:41.783914
- Title: MatFormBench: A Benchmarking Evaluation Framework for Target-Driven Materials Formulation
- Title(参考訳): MatFormBench: ターゲット駆動の材料定式化のためのベンチマーク評価フレームワーク
- Authors: Linhan Wu, Chenxi Wang, Chuhan Yang, Zhengwei Yang, Yuyang Liu,
- Abstract要約: MatFormBenchは、ターゲット駆動型定式化のための生成戦略の評価とガイドに適した、新しいベンチマークエコシステムである。
MatFormBenchは、物理駆動の定式化生成スキームを統合し、材料構造-不純物応答関係を忠実にエミュレートする合成サンプルを生成する。
我々は、39種類の逆設計アルゴリズムを評価し、古典的なサロゲート支援ブラックボックス探索、最先端の深層生成モデル、そしてより人気のあるLarge Language Model(LLM)ベースのレコメンデーション戦略を網羅して、MatFormBenchを検証する。
- 参考スコア(独自算出の注目度): 14.90227472199598
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Inverse design of materials has significantly advanced target-driven formulation optimization, yet existing materials machine learning benchmarks remain limited to forward property prediction, failing to systematically evaluate inverse optimization and generation algorithms, a critical gap that hinders the progress of target-driven materials design. To address this limitation, we propose MatFormBench, a novel benchmarking ecosystem tailored to evaluate and guide generative strategies for target-driven formulation. MatFormBench integrates a physics-driven formulation generation scheme to generate synthetic samples that faithfully emulate realistic materials structure-property response relationships, complemented by five escalating difficulty levels to quantify the complexity of these relationships. To rigorously assess algorithm performance, we further propose MatFormScore, a multi-dimensional metric that comprehensively quantifies performance across five critical axes: target success, search efficiency, exploratory capacity, robustness, and stability. We validate MatFormBench by evaluating 39 diverse inverse design algorithms, covering classical surrogate-assisted black-box search, state-of-the-art deep generative models, and increasingly popular Large Language Model (LLM)-based recommendation strategies. Across 1170 standardized algorithm-task evaluations, diffusion-based models demonstrate the strongest overall performance, while Variational Autoencoder (VAE)-based and Genetic Algorithm (GA)-based methods exhibit distinct advantages in specific scenarios. By establishing a unified evaluation standard for target-driven materials formulation, MatFormBench enables reproducible benchmarking, principled algorithm comparison, and diagnostic analysis of inverse design strategies, providing a foundational tool for advancing materials inverse design.
- Abstract(参考訳): 素材の逆設計は、ターゲット駆動型定式化の最適化が著しく進んでいるが、既存の機械学習ベンチマークは、対象駆動型材料設計の進行を妨げる重要なギャップである逆最適化と生成アルゴリズムの体系的評価に失敗し、前進特性予測に限られている。
この制限に対処するために,ターゲット駆動型定式化のための生成戦略の評価とガイドを目的とした,新しいベンチマークエコシステムであるMatFormBenchを提案する。
MatFormBenchは、物理駆動の定式化生成スキームを統合し、現実的な物質構造-不適切な応答関係を忠実にエミュレートする合成サンプルを生成する。
さらに,アルゴリズムの性能を厳密に評価するために,ターゲット成功,探索効率,探索能力,堅牢性,安定性の5つの重要な軸にまたがる性能を総合的に定量化する多次元計量MatFormScoreを提案する。
我々は、39種類の逆設計アルゴリズムを評価し、古典的なサロゲート支援ブラックボックス探索、最先端の深層生成モデル、そしてより人気のあるLarge Language Model(LLM)ベースのレコメンデーション戦略を網羅して、MatFormBenchを検証する。
1170を超える標準化されたアルゴリズムタスク評価では、拡散ベースモデルが最も高い性能を示し、変分オートエンコーダ(VAE)ベースのGAベースの手法は特定のシナリオにおいて異なる優位性を示す。
MatFormBenchは、ターゲット駆動型材料定式化のための統一的な評価基準を確立することにより、再現可能なベンチマーク、アルゴリズム比較、逆設計戦略の診断分析を可能にし、材料逆設計を進めるための基本的なツールを提供する。
関連論文リスト
- Generalized Optimal Classification Trees: A Mixed-Integer Programming Approach [17.725629133949955]
混合整数プログラミング(MIP)は高度なモデリングの柔軟性を提供する。
非線形性能指標に基づく最適分類木学習のためのMIPベースのフレームワークを提案する。
提案手法を50のベンチマークデータセットで評価した。
論文 参考訳(メタデータ) (2026-02-02T14:46:01Z) - Principled Algorithms for Optimizing Generalized Metrics in Binary Classification [53.604375124674796]
一般化されたメトリクスを最適化するアルゴリズムを導入し、$H$-consistency と finite-sample generalization bounds をサポートする。
提案手法は,メトリクス最適化を一般化したコスト依存学習問題として再検討する。
我々は,理論性能を保証する新しいアルゴリズムMETROを開発した。
論文 参考訳(メタデータ) (2025-12-29T01:33:42Z) - Deep Unfolding: Recent Developments, Theory, and Design Guidelines [99.63555420898554]
この記事では、最適化アルゴリズムを構造化されたトレーニング可能なMLアーキテクチャに変換するフレームワークであるDeep Unfoldingのチュートリアルスタイルの概要を提供する。
推論と学習のための最適化の基礎を概観し、深層展開のための4つの代表的な設計パラダイムを導入し、その反復的な性質から生じる特有なトレーニングスキームについて議論する。
論文 参考訳(メタデータ) (2025-12-03T13:16:35Z) - Benchmarking Generative AI Against Bayesian Optimization for Constrained Multi-Objective Inverse Design [0.15293427903448018]
本稿では,制約付き多目的回帰タスクを解くための生成可能な言語モデル(LLM)の性能について検討する。
最高の性能のLDM(Math-7B)は1.21の世代距離(GD)を達成した。
この知見は, 樹脂, レオロジー, 化学特性の定式化設計の最適化に, 直接工業的応用が期待できる。
論文 参考訳(メタデータ) (2025-10-29T10:37:09Z) - Exact Matrix Seriation through Mathematical Optimization: Stress and Effectiveness-Based Models [1.8843687952462742]
マトリックスセレーションは、特に空間データの可視化と解析において、データサイエンスの基本的な技術である。
本稿では,厳密なモデルベースの観点からの行列セレーションに対処するために,数学的最適化を基礎とした統一的なフレームワークを提案する。
本稿では, 非線形定式化とその線形化を含む, 局所的ストレス基準に対する新しい数学的プログラミングモデルを提案する。
論文 参考訳(メタデータ) (2025-06-24T17:35:55Z) - EVA-MILP: Towards Standardized Evaluation of MILP Instance Generation [13.49043811341421]
混合整数線形プログラミング(MILP)は、複雑な意思決定問題を解決するための基礎となる。
多様なデータセットに対する機械学習の需要により,MILPインスタンス生成手法の普及が加速し,標準化された評価手法が大幅に向上した。
本稿では,MILPインスタンス生成手法の体系的および客観的評価を目的とした総合ベンチマークフレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-30T16:42:15Z) - End-to-End Meta-Bayesian Optimisation with Transformer Neural Processes [52.818579746354665]
本稿では,ニューラルネットワークを一般化し,トランスフォーマーアーキテクチャを用いて獲得関数を学習する,エンド・ツー・エンドの差別化可能な最初のメタBOフレームワークを提案する。
我々は、この強化学習(RL)によるエンドツーエンドのフレームワークを、ラベル付き取得データの欠如に対処できるようにします。
論文 参考訳(メタデータ) (2023-05-25T10:58:46Z) - An AI-Assisted Design Method for Topology Optimization Without
Pre-Optimized Training Data [68.8204255655161]
トポロジ最適化に基づくAI支援設計手法を提示し、最適化された設計を直接的に得ることができる。
設計は、境界条件と入力データとしての充填度に基づいて、人工ニューラルネットワーク、予測器によって提供される。
論文 参考訳(メタデータ) (2020-12-11T14:33:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。