論文の概要: CAST: Cross Attention based multimodal fusion of Structure and Text for materials property prediction
- arxiv url: http://arxiv.org/abs/2502.06836v2
- Date: Fri, 08 Aug 2025 08:06:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-11 14:17:29.161063
- Title: CAST: Cross Attention based multimodal fusion of Structure and Text for materials property prediction
- Title(参考訳): CAST:クロスアテンションに基づく材料特性予測のための構造とテキストのマルチモーダル融合
- Authors: Jaewan Lee, Changyoung Park, Hongjun Yang, Sungbin Lim, Woohyung Lim, Sehui Han,
- Abstract要約: クロスアテンションに基づくモデルは、グラフ表現と資料のテキスト記述を統合する。
CASTは4つの重要な材料特性で既存のベースラインモデルを上回っている。
本研究は,材料科学において,より正確かつグローバルに情報を得た予測モデルを開発するためのマルチモーダル学習フレームワークの可能性を明らかにするものである。
- 参考スコア(独自算出の注目度): 5.623295547221969
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advancements in graph neural networks (GNNs) have significantly enhanced the prediction of material properties by modeling crystal structures as graphs. However, GNNs often struggle to capture global structural characteristics, such as crystal systems, limiting their predictive performance. To overcome this issue, we propose CAST, a cross-attention-based multimodal model that integrates graph representations with textual descriptions of materials, effectively preserving critical structural and compositional information. Unlike previous approaches, such as CrysMMNet and MultiMat, which rely on aggregated material-level embeddings, CAST leverages cross-attention mechanisms to combine fine-grained graph node-level and text token-level features. Additionally, we introduce a masked node prediction pretraining strategy that further enhances the alignment between node and text embeddings. Our experimental results demonstrate that CAST outperforms existing baseline models across four key material properties-formation energy, band gap, bulk modulus, and shear modulus-with average relative MAE improvements ranging from 10.2% to 35.7%. Analysis of attention maps confirms the importance of pretraining in effectively aligning multimodal representations. This study underscores the potential of multimodal learning frameworks for developing more accurate and globally informed predictive models in materials science.
- Abstract(参考訳): グラフニューラルネットワーク(GNN)の最近の進歩は、結晶構造をグラフとしてモデル化することによって、材料特性の予測を大幅に強化している。
しかしながら、GNNは結晶系のようなグローバルな構造特性を捉えるのに苦労し、その予測性能を制限している。
この問題を解決するために,我々は,グラフ表現と資料のテキスト記述を統合し,重要な構造情報や構成情報を効果的に保存するマルチモーダルモデルであるCASTを提案する。
CrysMMNetやMultiMatのような、集約された材料レベルの埋め込みに依存する従来のアプローチとは異なり、CASTは、粒度の細かいグラフノードレベルとテキストトークンレベルの機能を結合するために、クロスアテンション機構を活用する。
さらに、ノードとテキストの埋め込みのアライメントをさらに強化するマスク付きノード予測事前学習戦略を導入する。
実験の結果,CASTは4つの重要な材料特性,バンドギャップ,バルク弾性率,せん断弾性率の4つのモデルにおいて,10.2%から35.7%の範囲で既存のベースラインモデルよりも優れていた。
注意マップの解析は,マルチモーダル表現を効果的に整列させる上で,事前学習の重要性を裏付けるものである。
本研究は,材料科学において,より正確かつグローバルに情報を得た予測モデルを開発するためのマルチモーダル学習フレームワークの可能性を明らかにするものである。
関連論文リスト
- NSF-MAP: Neurosymbolic Multimodal Fusion for Robust and Interpretable Anomaly Prediction in Assembly Pipelines [0.0]
本稿では,組立パイプラインにおける多モード異常予測のためのニューロシンボリックAIと融合に基づくアプローチを提案する。
決定レベル融合技術を利用した時系列および画像ベース融合モデルを提案する。
その結果,伝達学習を用いたニューロシンボリックAIベースの融合アプローチは,時系列データと画像データの相補的強みを効果的に活用できることが示唆された。
論文 参考訳(メタデータ) (2025-05-09T16:50:42Z) - Supervised Pretraining for Material Property Prediction [0.36868085124383626]
自己教師付き学習(SSL)は、基盤モデルを開発するために、大規模でラベルなしのデータセットを事前トレーニングすることで、有望な代替手段を提供する。
そこで本研究では,教師付き事前学習を提案する。
表現学習をさらに強化するため,物質グラフを構造的に変形させることなく,ノイズを注入してロバスト性を向上させるグラフベースの拡張手法を提案する。
論文 参考訳(メタデータ) (2025-04-27T19:00:41Z) - Uncertainty Quantification in Graph Neural Networks with Shallow Ensembles [0.0]
機械学習電位(MLP)は、分子特性と材料特性の正確かつ効率的な予測を提供することによって、材料発見に革命をもたらした。
グラフニューラルネットワーク(GNN)は、複雑な原子間相互作用をキャプチャする能力のため、最先端のアプローチとして登場した。
この研究は、GNNベースの材料モデリングの堅牢性を改善するための軽量不確実性定量化(UQ)手法の可能性を強調している。
論文 参考訳(メタデータ) (2025-04-17T04:02:53Z) - Spatiotemporal Graph Learning with Direct Volumetric Information Passing and Feature Enhancement [62.91536661584656]
本稿では,CeFeGNN(CeFeGNN)とCell-embeddedとFeature-enhanced Graph Neural Networkを学習用として提案する。
学習可能なセル属性を共通ノードエッジメッセージパッシングプロセスに埋め込むことで,地域特性の空間依存性をよりよく把握する。
各種PDEシステムと1つの実世界のデータセットを用いた実験により、CeFeGNNは他のベースラインと比較して優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2024-09-26T16:22:08Z) - Characterizing Massive Activations of Attention Mechanism in Graph Neural Networks [0.9499648210774584]
近年、複雑なパターンをキャプチャする能力を改善するため、注意機構がグラフニューラルネットワーク(GNN)に統合されている。
本稿では,注意層内におけるMA(Massive Activations)の出現を明らかにした最初の総合的研究について述べる。
本研究は,ZINC,TOX21,ProteINSなどのベンチマークデータセットを用いて,GNNモデルの評価を行う。
論文 参考訳(メタデータ) (2024-09-05T12:19:07Z) - Cross-Modal Learning for Chemistry Property Prediction: Large Language Models Meet Graph Machine Learning [0.0]
グラフニューラルネットワーク(GNN)の分析能力と大規模言語モデル(LLM)の言語生成・予測能力を利用する多モード融合(MMF)フレームワークを提案する。
本フレームワークは,グラフ構造化データのモデリングにおけるGNNの有効性とLLMのゼロショットおよび少数ショット学習能力を組み合わせることにより,オーバーフィッティングのリスクを低減し,予測の改善を実現する。
論文 参考訳(メタデータ) (2024-08-27T11:10:39Z) - Enhancing material property prediction with ensemble deep graph convolutional networks [9.470117608423957]
近年の取り組みは、プロパティ予測にディープラーニングベースのグラフニューラルネットワークを含む高度なMLアルゴリズムの採用に重点を置いている。
本研究は,物質特性予測タスクを対象とする深層学習に基づくグラフニューラルネットワークにおけるアンサンブル戦略の詳細な評価を行う。
CGCNN(Crystal Graph Convolutional Neural Network)とそのマルチタスクバージョンであるMT-CGCNNを試験することにより、アンサンブル技術、特に予測平均化が従来のメトリクスを超える精度を大幅に向上することを示した。
論文 参考訳(メタデータ) (2024-07-26T16:12:06Z) - Benchmark on Drug Target Interaction Modeling from a Structure Perspective [48.60648369785105]
薬物と標的の相互作用の予測は、薬物の発見と設計に不可欠である。
グラフニューラルネットワーク(GNN)やトランスフォーマーに基づく最近の手法は、さまざまなデータセットで例外的なパフォーマンスを示している。
我々は,GNNベースと暗黙的(トランスフォーマーベース)構造学習アルゴリズムを多用することにより,構造の観点からの薬物-標的相互作用モデリングの総合的な調査とベンチマークを行う。
論文 参考訳(メタデータ) (2024-07-04T16:56:59Z) - A Pure Transformer Pretraining Framework on Text-attributed Graphs [50.833130854272774]
グラフ構造を先行として扱うことで,特徴中心の事前学習の視点を導入する。
我々のフレームワークであるGraph Sequence Pretraining with Transformer (GSPT)はランダムウォークを通してノードコンテキストをサンプリングする。
GSPTはノード分類とリンク予測の両方に容易に適応でき、様々なデータセットで有望な経験的成功を示す。
論文 参考訳(メタデータ) (2024-06-19T22:30:08Z) - TokenUnify: Scaling Up Autoregressive Pretraining for Neuron Segmentation [65.65530016765615]
本稿では,3つの相補的な学習目標を通じて,大規模依存関係をキャプチャする階層型予測コーディングフレームワークを提案する。
TokenUnifyは、ランダムトークン予測、次のトークン予測、およびすべてのトークン予測を統合して、包括的な表現空間を作成する。
また,120億個の注釈付きボクセルを付加した大規模EMデータセットを導入し,空間連続性を持つ理想的な長周期視覚データを提供する。
論文 参考訳(メタデータ) (2024-05-27T05:45:51Z) - Contextualizing MLP-Mixers Spatiotemporally for Urban Data Forecast at Scale [54.15522908057831]
本稿では,STTD予測を大規模に行うためのコンピュータ・ミクサーの適応版を提案する。
我々の結果は、この単純な効率の良いソリューションが、いくつかのトラフィックベンチマークでテストした場合、SOTAベースラインに匹敵する可能性があることを驚くほど示している。
本研究は, 実世界のSTTD予測において, 簡便な有効モデルの探索に寄与する。
論文 参考訳(メタデータ) (2023-07-04T05:19:19Z) - Disentangling Structured Components: Towards Adaptive, Interpretable and
Scalable Time Series Forecasting [52.47493322446537]
本研究では,時空間パターンの各コンポーネントを個別にモデル化する適応的,解釈可能,スケーラブルな予測フレームワークを開発する。
SCNNは、空間時間パターンの潜在構造を算術的に特徴づける、MSSの事前定義された生成プロセスで動作する。
SCNNが3つの実世界のデータセットの最先端モデルよりも優れた性能を達成できることを示すため、大規模な実験が行われた。
論文 参考訳(メタデータ) (2023-05-22T13:39:44Z) - Scalable deeper graph neural networks for high-performance materials
property prediction [1.9129213267332026]
本稿では,グループ分け可能な正規化とスキップ接続が可能な新しいグラフ注意ニューラルネットワークモデルDeeperGATGNNを提案する。
我々の研究は、結晶構造をそれらの性質にマッピングする複雑さに対処するためには、堅牢な性能を達成するために大規模な非常に深いグラフニューラルネットワークが必要であることを示している。
論文 参考訳(メタデータ) (2021-09-25T05:58:04Z) - PredRNN: A Recurrent Neural Network for Spatiotemporal Predictive
Learning [109.84770951839289]
歴史的文脈からビジュアルダイナミクスを学習するための新しいリカレントネットワークであるPredRNNを紹介する。
本手法は,3つの標準データセット上で高い競争結果が得られることを示す。
論文 参考訳(メタデータ) (2021-03-17T08:28:30Z) - Probabilistic Graph Attention Network with Conditional Kernels for
Pixel-Wise Prediction [158.88345945211185]
本稿では,画素レベルの予測を基本的側面,すなわち,技術の現状を推し進める新たなアプローチを提案する。
構造化されたマルチスケール機能学習と融合。
本論文では,マルチスケール表現を原理的に学習・融合するための新しいアテンテンションゲート条件ランダムフィールド(AG-CRFs)モデルに基づく確率的グラフアテンションネットワーク構造を提案する。
論文 参考訳(メタデータ) (2021-01-08T04:14:29Z) - Distance-aware Molecule Graph Attention Network for Drug-Target Binding
Affinity Prediction [54.93890176891602]
薬物標的結合親和性予測に適したDiStance-aware Molecule graph Attention Network (S-MAN)を提案する。
そこで,我々はまず,構築したポケットリガンドグラフに位相構造と空間位置情報を統合する位置符号化機構を提案する。
また,エッジレベルアグリゲーションとノードレベルアグリゲーションを有するエッジノード階層的アグリゲーション構造を提案する。
論文 参考訳(メタデータ) (2020-12-17T17:44:01Z) - Neural Networks Enhancement with Logical Knowledge [83.9217787335878]
関係データに対するKENNの拡張を提案する。
その結果、KENNは、存在関係データにおいても、基礎となるニューラルネットワークの性能を高めることができることがわかった。
論文 参考訳(メタデータ) (2020-09-13T21:12:20Z) - Graph Neural Network for Hamiltonian-Based Material Property Prediction [56.94118357003096]
無機材料のバンドギャップを予測できるいくつかの異なるグラフ畳み込みネットワークを提示し、比較する。
モデルは、それぞれの軌道自体の情報と相互の相互作用の2つの異なる特徴を組み込むように開発されている。
その結果,クロスバリデーションにより予測精度が期待できることがわかった。
論文 参考訳(メタデータ) (2020-05-27T13:32:10Z) - Global Attention based Graph Convolutional Neural Networks for Improved
Materials Property Prediction [8.371766047183739]
我々は,グラフニューラルネットワークに基づく無機材料特性の予測モデルであるGATGNNを開発した。
提案手法は, 従来のモデルの予測よりも優れており, 材料の結晶化に関する知見を提供することができる。
論文 参考訳(メタデータ) (2020-03-11T07:43:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。