論文の概要: Predicting Scale-Up of Metal-Organic Framework Syntheses with Large Language Models
- arxiv url: http://arxiv.org/abs/2604.20899v1
- Date: Tue, 21 Apr 2026 14:59:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-24 14:40:06.076436
- Title: Predicting Scale-Up of Metal-Organic Framework Syntheses with Large Language Models
- Title(参考訳): 大規模言語モデルを用いた金属有機フレームワークのスケールアップ予測
- Authors: Peter Walther, Hongrui Sheng, Xinxin Liu, Bin Feng, Reid Coyle, Xinhua Yan, Kyle Smith, Harrison Kayal, Shyam Chand Pal, Zhiling Zheng,
- Abstract要約: ESU-MOFは文学的なデータセットであり、大規模言語モデルを微調整して91.4%の精度でスケーラビリティを予測できる正の未ラベル学習戦略である。
- 参考スコア(独自算出の注目度): 3.042408245033256
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Scalable synthesis remains the gate between MOF discovery and industrial deployment, as scale-up know-how is fragmented across disparate reports. We introduce ESU-MOF, a literature-mined dataset and a positive-unlabeled learning strategy that fine-tunes large language models to predict scalability potential with 91.4% accuracy, enabling rapid data-driven triage for industrial MOF discovery.
- Abstract(参考訳): スケールアップノウハウは、さまざまなレポートで断片化されているため、スケーラブルな合成はMOF発見と産業展開の間のゲートのままである。
ESU-MOFは文学的なデータセットであり,大規模言語モデルを微調整して91.4%の精度でスケーラビリティを予測し,産業用MOF発見のための迅速なデータ駆動トリアージを可能にする,肯定的な学習戦略である。
関連論文リスト
- MEG-GPT: A transformer-based foundation model for magnetoencephalography data [6.336623115095147]
近年のディープラーニングの進歩は、言語や視覚などの他の領域において、大規模に基礎モデルを使用することで、大きな進歩をもたらした。
本稿では,時間アテンションと次の時間ポイント予測を用いたトランスフォーマーベース基盤モデルMEG-GPTを紹介する。
我々は大規模なMEGデータセットから抽出したトークン化された脳領域の時間軸についてMEG-GPTを訓練した。
論文 参考訳(メタデータ) (2025-10-20T20:18:38Z) - Scaling Laws of Synthetic Data for Language Models [125.41600201811417]
プレトレーニングコーパスを多種多様な高品質な合成データセットに変換するスケーラブルなフレームワークであるSynthLLMを紹介した。
提案手法は,グラフアルゴリズムを用いて複数の文書にまたがるハイレベルな概念を自動的に抽出し,再結合することで実現している。
論文 参考訳(メタデータ) (2025-03-25T11:07:12Z) - Remaining Useful Life Prediction: A Study on Multidimensional Industrial Signal Processing and Efficient Transfer Learning Based on Large Language Models [6.118896920507198]
本稿では,大言語モデル(LLM)をRUL予測に用いる革新的な回帰フレームワークを提案する。
ターボファンエンジンのRUL予測タスクの実験では、提案モデルが最先端(SOTA)法を超越していることが示されている。
微調整のための最小限のターゲットドメインデータでは、モデルは完全なターゲットドメインデータに基づいて訓練されたSOTAメソッドよりも優れている。
論文 参考訳(メタデータ) (2024-10-04T04:21:53Z) - Fine-Tuned Language Models Generate Stable Inorganic Materials as Text [53.81190146434045]
テキストエンコードされた原子構造データに基づく微調整された大規模言語モデルは、実装が簡単で信頼性が高い。
我々の最強モデルは、CDVAEの約2倍の速度で準安定であると予測された物質を生成することができる。
テキストプロンプト固有の柔軟性のため、我々のモデルは安定物質を無条件に生成するために同時に使用することができる。
論文 参考訳(メタデータ) (2024-02-06T20:35:28Z) - SOMOS: The Samsung Open MOS Dataset for the Evaluation of Neural
Text-to-Speech Synthesis [50.236929707024245]
SOMOSデータセットは、単にニューラルテキスト音声(TTS)サンプルからなる最初の大規模平均世論スコア(MOS)データセットである。
パブリックドメイン音声データセットであるLJ音声の合成発話20Kから成っている。
論文 参考訳(メタデータ) (2022-04-06T18:45:20Z) - MOFSimplify: Machine Learning Models with Extracted Stability Data of
Three Thousand Metal-Organic Frameworks [0.0]
我々は、自然言語処理を用いて、金属-有機フレームワーク(MOF)の安定性に関する文献を発掘する。
我々は、定量的不確実性のある新しいMOFの安定性を予測するために機械学習モデルを訓練する。
当社のWebインターフェースであるMOFSimplifyは、ユーザがキュレートされたデータにアクセスし、そのデータを新しいMOFの予測に利用できるようにする。
論文 参考訳(メタデータ) (2021-09-16T16:37:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。