論文の概要: XxaCT-NN: Structure Agnostic Multimodal Learning for Materials Science
- arxiv url: http://arxiv.org/abs/2507.01054v1
- Date: Fri, 27 Jun 2025 21:45:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-03 14:22:59.803644
- Title: XxaCT-NN: Structure Agnostic Multimodal Learning for Materials Science
- Title(参考訳): XxaCT-NN:材料科学のための構造に依存しないマルチモーダル学習
- Authors: Jithendaraa Subramanian, Linda Hung, Daniel Schweigert, Santosh Suram, Weike Ye,
- Abstract要約: 元素組成とX線回折(XRD)から直接学習するスケーラブルなフレームワークを提案する。
アーキテクチャは、モダリティ固有のエンコーダとクロスアテンション融合モジュールを統合し、500万サンプルのアレクサンドリアデータセットでトレーニングする。
本研究は, 材料科学の基礎モデルとして, 無構造, 実験的な基礎モデルへの道のりを定めている。
- 参考スコア(独自算出の注目度): 0.27185251060695437
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Recent advances in materials discovery have been driven by structure-based models, particularly those using crystal graphs. While effective for computational datasets, these models are impractical for real-world applications where atomic structures are often unknown or difficult to obtain. We propose a scalable multimodal framework that learns directly from elemental composition and X-ray diffraction (XRD) -- two of the more available modalities in experimental workflows without requiring crystal structure input. Our architecture integrates modality-specific encoders with a cross-attention fusion module and is trained on the 5-million-sample Alexandria dataset. We present masked XRD modeling (MXM), and apply MXM and contrastive alignment as self-supervised pretraining strategies. Pretraining yields faster convergence (up to 4.2x speedup) and improves both accuracy and representation quality. We further demonstrate that multimodal performance scales more favorably with dataset size than unimodal baselines, with gains compounding at larger data regimes. Our results establish a path toward structure-free, experimentally grounded foundation models for materials science.
- Abstract(参考訳): 材料発見の最近の進歩は、構造に基づくモデル、特に結晶グラフを用いたモデルによって推進されている。
計算データセットには有効であるが、これらのモデルは原子構造が未知あるいは取得が難しい実世界のアプリケーションには実用的ではない。
本稿では,X線回折(XRD)と元素組成から直接学習するスケーラブルなマルチモーダルフレームワークを提案する。
アーキテクチャは、モダリティ固有のエンコーダとクロスアテンション融合モジュールを統合し、500万サンプルのアレクサンドリアデータセットでトレーニングする。
マスク付きXRDモデリング(MXM)を提案し,MXMとコントラストアライメントを自己指導型事前学習戦略として適用した。
事前トレーニングはより高速な収束(最大4.2倍のスピードアップ)をもたらし、精度と表現品質の両方を改善する。
さらに、マルチモーダル性能は、単調なベースラインよりもデータセットサイズに好適にスケールし、より大規模なデータレシエーションでは利得が混在することを示した。
本研究は, 材料科学の基礎モデルとして, 無構造, 実験的な基礎モデルへの道のりを定めている。
関連論文リスト
- Dynamic Acoustic Model Architecture Optimization in Training for ASR [51.21112094223223]
DMAOは、Grow-and-drop戦略を使用して、トレーニング中にパラメータを自動的に再配置するアーキテクチャ最適化フレームワークである。
CTC onSpeech, TED-Lium-v2, Switchboard を用いてDMAOの評価を行った。
論文 参考訳(メタデータ) (2025-06-16T07:47:34Z) - Spectra-to-Structure and Structure-to-Spectra Inference Across the Periodic Table [60.78615287040791]
XAStructは結晶構造からXASスペクトルを予測し、XAS入力から局所構造記述子を推測できる学習フレームワークである。
XAStructは、周期表全体にわたって70以上の要素にまたがる大規模なデータセットでトレーニングされている。
論文 参考訳(メタデータ) (2025-06-13T15:58:05Z) - PolyMicros: Bootstrapping a Foundation Model for Polycrystalline Material Structure [2.030250820529959]
科学領域における超スパースで複雑な空間データから学習するための新しい機械学習手法を提案する。
私たちのコアコントリビューションは、局所生成モデルのアンサンブルを利用する物理駆動型データ拡張スキームです。
我々は, この枠組みを用いて, ポリ結晶材料の基礎モデルであるポリマイクロスを構築した。
論文 参考訳(メタデータ) (2025-05-22T16:12:20Z) - UniGenX: Unified Generation of Sequence and Structure with Autoregressive Diffusion [61.690978792873196]
既存のアプローチは自己回帰シーケンスモデルか拡散モデルのいずれかに依存している。
自己回帰的次トーケン予測と条件拡散モデルを組み合わせた統合フレームワークUniGenXを提案する。
材料および小分子生成タスクにおけるUniGenXの有効性を検証する。
論文 参考訳(メタデータ) (2025-03-09T16:43:07Z) - A new framework for X-ray absorption spectroscopy data analysis based on machine learning: XASDAML [3.26781102547109]
XASDAMLは、データ処理ワークフロー全体を統合したフレキシブルな機械学習ベースのフレームワークである。
包括的統計分析をサポートし、主成分分析やクラスタリングなどの手法を活用する。
XASDAMLの汎用性と有効性は、銅のデータセットに適用することで実証される。
論文 参考訳(メタデータ) (2025-02-23T17:50:04Z) - UniMat: Unifying Materials Embeddings through Multi-modal Learning [0.0]
材料科学における最も重要なモダリティを統一する上で,多モーダル学習(アライメントと融合)の手法を評価する。
構造グラフのモダリティはXRDパターンと整合することで向上できることを示す。
また、XRDパターンやコンポジションなどの実験的に利用できるデータフォーマットの整列と融合により、より堅牢な関節埋め込みが実現可能であることを示す。
論文 参考訳(メタデータ) (2024-11-13T14:55:08Z) - Scalable Diffusion for Materials Generation [99.71001883652211]
我々は任意の結晶構造(ユニマット)を表現できる統一された結晶表現を開発する。
UniMatはより大型で複雑な化学系から高忠実度結晶構造を生成することができる。
材料の生成モデルを評価するための追加指標を提案する。
論文 参考訳(メタデータ) (2023-10-18T15:49:39Z) - LANISTR: Multimodal Learning from Structured and Unstructured Data [33.73687295669768]
LANISTRは、LANguage、Image、STRucturedデータから学ぶための注目ベースのフレームワークである。
特に,新しい類似性に基づくマルチモーダルマスキングの損失を導入し,モダリティを欠いた大規模マルチモーダルデータからクロスモーダル関係を学習する。
論文 参考訳(メタデータ) (2023-05-26T00:50:09Z) - Intelligent multiscale simulation based on process-guided composite
database [0.0]
本稿では、プロセスモデリング、材料均質化、機械学習に基づく統合データ駆動モデリングフレームワークを提案する。
我々は, 自動車, 航空宇宙, エレクトロニクス産業において重要な材料システムとして認識されてきた, 射出成形した短繊維強化複合材料に興味を持っている。
論文 参考訳(メタデータ) (2020-03-20T20:39:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。