論文の概要: Teaching and Evaluating LLMs to Reason About Polymer Design Related Tasks
- arxiv url: http://arxiv.org/abs/2601.16312v1
- Date: Thu, 22 Jan 2026 20:39:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-26 14:27:27.401259
- Title: Teaching and Evaluating LLMs to Reason About Polymer Design Related Tasks
- Title(参考訳): 高分子設計関連課題の理科教育と評価
- Authors: Dikshya Mohanty, Mohammad Saqib Hasan, Syed Mostofa Monsur, Size Zheng, Benjamin Hsiao, Niranjan Balasubramanian,
- Abstract要約: PolyBenchは125K以上のポリマー設計関連タスクの大規模なトレーニングおよびテストベンチマークデータセットである。
ポリベンチのタスクは、単純から複雑な解析的推論問題から構成される。
実験の結果、PolyBenchのデータに基づいて訓練された7Bから14Bパラメータの小さな言語モデル(SLM)が、同様のサイズのモデルより優れていることが示された。
- 参考スコア(独自算出の注目度): 10.776626089935073
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Research in AI4Science has shown promise in many science applications, including polymer design. However, current LLMs prove ineffective on this problem space because: (i) most models lack polymer-specific knowledge (ii) existing aligned models lack coverage of knowledge and capabilities relevant to polymer design. Addressing this, we introduce PolyBench, a large scale training and test benchmark dataset of more than 125K polymer design related tasks, leveraging a knowledge base of 13M+ data points obtained from experimental and synthetic sources to ensure broad coverage of polymers and their properties. For effective alignment using PolyBench, we introduce a knowledge-augmented reasoning distillation method that augments this dataset with structured CoT. Furthermore, tasks in PolyBench are organized from simple to complex analytical reasoning problems, enabling generalization tests and diagnostic probes across the problem space. Experiments show that small language models (SLMs), of 7B to 14B parameters, trained on PolyBench data outperform similar sized models, and even closed source frontier LLMs on PolyBench test dataset while demonstrating gains on other polymer benchmarks as well.
- Abstract(参考訳): AI4Scienceの研究は、高分子設計を含む多くの科学応用において有望であることが示されている。
しかし、現在のLLMは、次のように問題空間において効果がないことを証明している。
(i)ほとんどのモデルはポリマー特有の知識を欠いている
(II) 既存のアライメントモデルには, 高分子設計に関する知識や能力が不足している。
そこで本研究では, 125K以上のポリマー設計関連タスクを対象とした大規模トレーニングおよびテストベンチマークであるPolyBenchを紹介し, 実験および合成ソースから得られた13M以上のデータポイントの知識ベースを利用して, ポリマーとその特性の広範なカバレッジを確保する。
ポリベンチを用いた効率的なアライメントを実現するために,構造化CoTを用いてこのデータセットを増強する知識増強型推論蒸留法を提案する。
さらに、PolyBenchのタスクは、単純から複雑な解析的推論問題から編成され、問題空間全体にわたる一般化テストと診断プローブを可能にする。
実験では、7Bから14Bパラメータの小さな言語モデル(SLM)が、PolyBenchのデータでトレーニングされ、同様のサイズのモデルよりも優れており、PolyBenchテストデータセット上のクローズドソースフロンティアLLMでさえも、他のポリマーベンチマークでの利得を示している。
関連論文リスト
- Omics-scale polymer computational database transferable to real-world artificial intelligence applications [8.718893022299653]
PolyOmicsは、完全に自動化された分子動力学シミュレーションパイプラインによって生成されるオミクススケールの計算データベースである。
PolyOmicsで事前訓練された機械学習モデルは、広範囲の現実世界の下流タスクに対して効率的に微調整することができる。
論文 参考訳(メタデータ) (2025-11-07T09:03:07Z) - POINT$^{2}$: A Polymer Informatics Training and Testing Database [15.45788515943579]
POINT$2$ (Polymer Informatics Training and Testing) は、高分子情報学における重要な課題に対処するために設計されたベンチマークデータベースとプロトコルである。
我々は、量子ランダムフォレスト、ドロップアウト付き多層パーセプトロン、グラフニューラルネットワーク、事前訓練された大規模言語モデルを含むMLモデルのアンサンブルを開発する。
これらのモデルは、Morgan、MACCS、RDKit、Topological、Atom Pairの指紋、グラフベースの記述子といった多様なポリマー表現と結合している。
論文 参考訳(メタデータ) (2025-03-30T15:46:01Z) - Multimodal machine learning with large language embedding model for polymer property prediction [2.525624865489335]
本稿では,高分子特性予測タスクに対して,単純で効果的なマルチモーダルアーキテクチャであるPolyLLMemを提案する。
PolyLLMemは、Llama 3によって生成されたテキスト埋め込みとUni-Mol由来の分子構造埋め込みを統合する。
その性能は、グラフベースのモデルやトランスフォーマーベースのモデルと同等であり、場合によってはそれ以上である。
論文 参考訳(メタデータ) (2025-03-29T03:48:11Z) - MAPS: Advancing Multi-Modal Reasoning in Expert-Level Physical Science [62.96434290874878]
現在のMLLM(Multi-Modal Large Language Models)は、一般的な視覚的推論タスクにおいて強力な機能を示している。
我々は,MLLMに基づく物理知覚とシミュレーションによるマルチモーダル科学推論(MAPS)という新しいフレームワークを開発した。
MAPSは、専門家レベルのマルチモーダル推論タスクを物理的知覚モデル(PPM)を介して物理図理解に分解し、シミュレータを介して物理的知識で推論する。
論文 参考訳(メタデータ) (2025-01-18T13:54:00Z) - MAmmoTH-VL: Eliciting Multimodal Reasoning with Instruction Tuning at Scale [66.73529246309033]
MLLM(Multimodal large language model)は、多モーダルタスクにおいて大きな可能性を秘めている。
既存の命令チューニングデータセットは、中間的合理性のないフレーズレベルの答えのみを提供する。
そこで本研究では,大規模マルチモーダル・インストラクション・チューニング・データセットを構築するためのスケーラブルで費用対効果の高い手法を提案する。
論文 参考訳(メタデータ) (2024-12-06T18:14:24Z) - Key-Point-Driven Data Synthesis with its Enhancement on Mathematical Reasoning [110.80663974060624]
キーポイント駆動型データ合成(KPDDS)は質問応答対を合成する新しいデータ合成フレームワークである。
KPDDSは厳格な品質管理と相当なスケーラビリティを備えた新しい質問の生成を保証する。
KPMathは,800万以上の質問応答対から構成される,数学的推論に適した広範囲な合成データセットである。
論文 参考訳(メタデータ) (2024-03-04T18:58:30Z) - Compositional Representation of Polymorphic Crystalline Materials [56.80318252233511]
PCRLは,構成の確率論的モデリングを用いて,利用可能な構造情報から多型を抽出する手法である。
16のデータセットに対する広範囲な評価は、構成表現の学習におけるPCRLの有効性を示す。
論文 参考訳(メタデータ) (2023-11-17T20:34:28Z) - Polymer Informatics: Current Status and Critical Next Steps [1.3238373064156097]
サロゲートモデルは、インスタントプロパティ予測のために利用可能なポリマーデータに基づいて訓練される。
データ駆動型戦略は, 高分子の化学的, 物理的多様性から生じる特異な課題に, 小規模かつ大規模に対処するものである。
アプリケーションターゲットを満たす高度なAIアルゴリズムを用いて, 高分子レコメンデーションを行う逆問題の解法について検討している。
論文 参考訳(メタデータ) (2020-11-01T14:17:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。