論文の概要: CatalyticMLLM: A Graph-Text Multimodal Large Language Model for Catalytic Materials
- arxiv url: http://arxiv.org/abs/2605.17254v2
- Date: Thu, 21 May 2026 09:36:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-22 20:14:18.429944
- Title: CatalyticMLLM: A Graph-Text Multimodal Large Language Model for Catalytic Materials
- Title(参考訳): CatalyticMLLM: 触媒材料のためのグラフテキスト多モード大言語モデル
- Authors: Yanjie Li, Jian Xu, Xu-Yao Zhang, Shiming Xiang, Nian Ran, Weijun Li, Cheng-Lin Liu,
- Abstract要約: 触媒材料のためのグラフテキスト多モード大言語モデルQE-Catalytic-V2を提案する。
プロパティ予測と逆設計を同じモデルと共有表現空間に統合する。
この統合フレームワークでは、QE-Catalytic-V2は信頼性の高いプロパティ予測を行うだけでなく、物理的に実現可能なCIF候補を生成し、表示することができる。
- 参考スコア(独自算出の注目度): 61.546562658308005
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Property prediction and inverse structural design of catalytic materials are typically modeled as two independent tasks: the former predicts target properties from given structures, whereas the latter generates candidate structures according to desired properties. Although the decoupled paradigm facilitates the implementation of a ``generation--evaluation--screening'' workflow, the inconsistency between the generative model and the property prediction model in terms of representation spaces and training objectives can readily introduce data distribution shifts and evaluator bias, thereby limiting the stability of closed-loop optimization. In this work, we propose QE-Catalytic-V2, a unified graph--text multimodal large language model for catalytic materials, which integrates property prediction and inverse design within the same model and shared representation space. Under this unified framework, QE-Catalytic-V2 can not only perform reliable property prediction by leveraging three-dimensional structures and textual information, but also generate and screen physically feasible CIF candidates conditioned on target properties, thereby forming a closed-loop optimization workflow of ``inverse design--prediction--screening--redesign.'' Experimental results demonstrate that this unified paradigm outperforms decoupled baselines on both catalytic relaxed-energy prediction and inverse design tasks, validating the effectiveness of jointly modeling property prediction and structure generation within a single multimodal model.
- Abstract(参考訳): 触媒材料の特性予測と逆構造設計は通常、2つの独立したタスクとしてモデル化される。
分離されたパラダイムは、'世代評価-スクリーニング'ワークフローの実装を促進するが、表現空間やトレーニング目的の観点から生成モデルとプロパティ予測モデルの矛盾は、データ分散シフトや評価器バイアスを簡単に導入することができ、クローズドループ最適化の安定性を抑えることができる。
本研究では,同一モデルと共有表現空間に特性予測と逆設計を統合したグラフテキスト多モード大言語モデルであるQE-Catalytic-V2を提案する。
この統合された枠組みの下では、QE-Catalytic-V2は、3次元構造とテキスト情報を活用することで信頼性の高いプロパティ予測を行うだけでなく、ターゲットプロパティに条件付けられた物理的に実現可能なCIF候補を生成し、画面表示することで、"inverse design--prediction--screening--design"のクローズドループ最適化ワークフローを形成する。
実験結果から, この統一パラダイムは, 触媒緩和エネルギー予測と逆設計タスクの両面において, 疎結合ベースラインよりも優れており, 単一マルチモーダルモデルにおける共振特性予測と構造生成の有効性が検証された。
関連論文リスト
- A Unified Framework for Structured Flow Modeling: From Continuous Fields to Data-Driven Representations [0.0]
力学系は、ソース/シンクの挙動、循環力学、トポロジーに制約された輸送を結合した構造的流れで記述することができる。
この研究は、ヘルムホルツ・ホッジ分解に基づく連続的な定式化を離散的およびデータ駆動的表現と結合することによって、そのようなシステムに対する統一的な視点を提供する。
論文 参考訳(メタデータ) (2026-05-18T11:52:09Z) - SOM: Structured Opponent Modeling for LLM-based Agents via Structural Causal Model [25.22095743571866]
本稿では,対戦モデル構築と対戦モデル予測を明確に分離する2段階の対戦者モデリングフレームワークを提案する。
構築段階において、SOMは、変数間の依存関係を表現するグラフベースの形式主義である構造因果モデル(Structure Causal Model, SCM)を用いて、相手の観察と行動の間の直接リンクをキャプチャする。
予測段階では、LLMはSCMから導出される明確な経路に沿って構造化推論を行い、予測精度と安定性の両方を改善する。
論文 参考訳(メタデータ) (2026-05-08T06:11:42Z) - Matching Features, Not Tokens: Energy-Based Fine-Tuning of Language Models [102.20309135516186]
クロスエントロピー(CE)トレーニングは、言語モデルの密集したスケーラブルな監視を提供する。
言語モデル微調整のための特徴マッチング手法を提案する。
この目的を効率的に最適化するために,エネルギーベースファインチューニングを提案する。
論文 参考訳(メタデータ) (2026-03-12T17:57:50Z) - QE-Catalytic: A Graph-Language Multimodal Base Model for Relaxed-Energy Prediction in Catalytic Adsorption [44.77883047868218]
本稿では,大規模言語モデルとE(3)-同変グラフ変換器を結合したマルチモーダルフレームワークQE-Catalyticを提案する。
予測中、QE-Catalyticは3次元構造と構造化された構成テキストを共同で利用し、言語チャネルに「3次元幾何学情報」を注入する。
OC20では、QE-Catalytic は緩和された吸着エネルギーの MAE を 0.713eV から 0.486eV に還元し、ベースラインモデルより一貫して優れる。
論文 参考訳(メタデータ) (2025-12-23T06:27:30Z) - Composition and Alignment of Diffusion Models using Constrained Learning [79.36736636241564]
拡散モデルは、複雑な分布からサンプルを採取する能力により、生成的モデリングにおいて普及している。
i) 拡散モデルを微調整して報酬と整合させるアライメントと、(ii) 予め訓練された拡散モデルを組み合わせて、それぞれが生成した出力に望ましい属性を強調する合成である。
本稿では,共役モデルが報酬制約を満たすこと,あるいは(潜在的に複数の)事前学習モデルに近づき続けることを強制することによって,拡散モデルのアライメントと構成を統一する制約付き最適化フレームワークを提案する。
論文 参考訳(メタデータ) (2025-08-26T15:06:30Z) - Token-wise Decomposition of Autoregressive Language Model Hidden States
for Analyzing Model Predictions [9.909170013118775]
本研究は,各初期入力トークンに基づいて,自己回帰言語モデルから最終隠れ状態の線形分解を行う。
次単語確率の変化を重要度尺度として、まず、どの文脈語が言語モデル予測に最も貢献するかを検討する。
論文 参考訳(メタデータ) (2023-05-17T23:55:32Z) - Attentional Prototype Inference for Few-Shot Segmentation [128.45753577331422]
数発のセグメンテーションのための確率的潜在変数フレームワークである注意型プロトタイプ推論(API)を提案する。
我々は各オブジェクトカテゴリのプロトタイプを表現するためにグローバル潜在変数を定義し、確率分布としてモデル化する。
我々は4つのベンチマークで広範な実験を行い、提案手法は最先端のプロトタイプベースの手法よりも、少なくとも競争力があり、しばしば優れた性能が得られる。
論文 参考訳(メタデータ) (2021-05-14T06:58:44Z) - Self-Reflective Variational Autoencoder [21.054722609128525]
変分オートエンコーダ(VAE)は潜在変数生成モデルを学習するための強力なフレームワークである。
自己回帰推論(self-reflective inference)と呼ばれるソリューションを導入します。
実験では, 後部と後部を正確に一致させることの明確な利点を実証的に示す。
論文 参考訳(メタデータ) (2020-07-10T05:05:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。