論文の概要: MEIDNet: Multimodal generative AI framework for inverse materials design
- arxiv url: http://arxiv.org/abs/2601.22009v1
- Date: Thu, 29 Jan 2026 17:16:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-30 16:22:50.035041
- Title: MEIDNet: Multimodal generative AI framework for inverse materials design
- Title(参考訳): MEIDNet:逆材料設計のための多モード生成AIフレームワーク
- Authors: Anand Babu, Rogério Almeida Gouvêa, Pierre Vandergheynst, Gian-Marco Rignanese,
- Abstract要約: 本稿では,構造情報と材料特性を共同で学習するフレームワークMEIDNetを提案する。
生成的逆設計とマルチモーダル学習を組み合わせることで,化学構造空間の探索を高速化する。
- 参考スコア(独自算出の注目度): 3.0777140479163934
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this work, we present Multimodal Equivariant Inverse Design Network (MEIDNet), a framework that jointly learns structural information and materials properties through contrastive learning, while encoding structures via an equivariant graph neural network (EGNN). By combining generative inverse design with multimodal learning, our approach accelerates the exploration of chemical-structural space and facilitates the discovery of materials that satisfy predefined property targets. MEIDNet exhibits strong latent-space alignment with cosine similarity 0.96 by fusion of three modalities through cross-modal learning. Through implementation of curriculum learning strategies, MEIDNet achieves ~60 times higher learning efficiency than conventional training techniques. The potential of our multimodal approach is demonstrated by generating low-bandgap perovskite structures at a stable, unique, and novel (SUN) rate of 13.6 %, which are further validated by ab initio methods. Our inverse design framework demonstrates both scalability and adaptability, paving the way for the universal learning of chemical space across diverse modalities.
- Abstract(参考訳): 本研究では,同変グラフニューラルネットワーク(EGNN)を用いて構造を符号化しながら,コントラスト学習を通じて構造情報と材料特性を共同で学習するフレームワークMEIDNetを提案する。
生成的逆設計とマルチモーダル学習を組み合わせることで、化学構造空間の探索を加速し、予め定義された特性目標を満たす物質の発見を容易にする。
MEIDNetは3つのモードの融合によりコサイン類似度0.96と強い潜在空間アライメントを示す。
MEIDNetはカリキュラム学習戦略の実装を通じて、従来の訓練手法の約60倍の学習効率を達成する。
マルチモーダルアプローチのポテンシャルは,低バンドギャップペロブスカイト構造を安定,一意,新規 (SUN) レート13.6 %で生成し,さらにab initio 法により検証した。
我々の逆設計フレームワークは、スケーラビリティと適応性の両方を示し、多様なモダリティにまたがる化学空間の普遍的な学習の道を開く。
関連論文リスト
- Structure-Aware Cooperative Ensemble Evolutionary Optimization on Combinatorial Problems with Multimodal Large Language Models [7.983341161975621]
本研究では,マルチモーダル大言語モデル(MLLM)を進化演算子として用いて,グラフデータに対する構造認識最適化を容易にする。
大規模ネットワークビジュアライゼーションに固有の視覚的クラッタに対処するために,グラフスペーシフィケーション手法を用いて構造を単純化する。
提案手法はMLLM駆動の進化最適化におけるソリューションの品質と信頼性を両立させる。
論文 参考訳(メタデータ) (2025-10-24T16:37:41Z) - NExT-OMNI: Towards Any-to-Any Omnimodal Foundation Models with Discrete Flow Matching [64.10695425442164]
NExT-OMNI(英語版)は、離散フローパラダイムによる統一モデリングを実現するオープンソース・オムニモーダル・ファンデーション・モデルである。
NExT-OMNIは、大規模なインターリーブ付きテキスト、画像、ビデオ、オーディオデータに基づいて訓練され、マルチモーダル生成および理解ベンチマーク上で競合するパフォーマンスを提供する。
さらなる研究を進めるために、トレーニングの詳細、データプロトコル、およびコードとモデルチェックポイントの両方をオープンソース化する。
論文 参考訳(メタデータ) (2025-10-15T16:25:18Z) - Rethinking the Role of Dynamic Sparse Training for Scalable Deep Reinforcement Learning [58.533203990515034]
ニューラルネットワークのスケーリングは機械学習における画期的な進歩をもたらしたが、このパラダイムは深層強化学習(DRL)では失敗している。
我々は、動的スパーストレーニング戦略が、アーキテクチャの改善によって確立された主要なスケーラビリティ基盤を補完するモジュール固有の利点を提供することを示す。
アーキテクチャ改善の利点を生かした実践的なフレームワークであるModule-Specific Training (MST) にこれらの知見を精査し、アルゴリズムの修正なしに様々なRLアルゴリズムをまたいだ大幅なスケーラビリティ向上を示す。
論文 参考訳(メタデータ) (2025-10-14T03:03:08Z) - MMaDA: Multimodal Large Diffusion Language Models [61.13527224215318]
マルチモーダル拡散基礎モデルの新たなクラスであるMMaDAを紹介する。
テキスト推論、マルチモーダル理解、テキスト・ツー・イメージ生成など、さまざまな領域で優れたパフォーマンスを実現するように設計されている。
論文 参考訳(メタデータ) (2025-05-21T17:59:05Z) - Creating a Microstructure Latent Space with Rich Material Information for Multiphase Alloy Design [19.10106845551149]
本研究は, 高精度CPSP関係を確立するために, 真の微細構造情報を統合する改良された合金設計アルゴリズムを提案する。
このアプローチでは、変分オートエンコーダに基づくディープラーニングフレームワークを使用して、実際のミクロ構造データを潜在空間にマッピングする。
論文 参考訳(メタデータ) (2024-09-04T12:26:19Z) - Multi-dimensional Fusion and Consistency for Semi-supervised Medical
Image Segmentation [10.628250457432499]
医用画像セグメンテーションに適した新しい半教師付き学習フレームワークを提案する。
我々のアプローチの中心は、革新的なマルチスケールテキスト対応のViT-CNN Fusionスキームである。
本稿では,ロバストな擬似ラベルを生成するためのマルチアクシス一貫性フレームワークを提案する。
論文 参考訳(メタデータ) (2023-09-12T22:21:14Z) - Multi-scale Transformer Network with Edge-aware Pre-training for
Cross-Modality MR Image Synthesis [52.41439725865149]
クロスモダリティ磁気共鳴(MR)画像合成は、与えられたモダリティから欠落するモダリティを生成するために用いられる。
既存の(教師付き学習)手法は、効果的な合成モデルを訓練するために、多くのペア化されたマルチモーダルデータを必要とすることが多い。
マルチスケールトランスフォーマーネットワーク(MT-Net)を提案する。
論文 参考訳(メタデータ) (2022-12-02T11:40:40Z) - Unpaired Multi-modal Segmentation via Knowledge Distillation [77.39798870702174]
本稿では,不対向画像分割のための新しい学習手法を提案する。
提案手法では,CTおよびMRI間での畳み込みカーネルの共有により,ネットワークパラメータを多用する。
我々は2つの多クラスセグメンテーション問題に対するアプローチを広範囲に検証した。
論文 参考訳(メタデータ) (2020-01-06T20:03:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。