論文の概要: Autonomous Multi-Agent AI for High-Throughput Polymer Informatics: From Property Prediction to Generative Design Across Synthetic and Bio-Polymers
- arxiv url: http://arxiv.org/abs/2602.00103v1
- Date: Sun, 25 Jan 2026 02:32:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-03 19:28:32.934253
- Title: Autonomous Multi-Agent AI for High-Throughput Polymer Informatics: From Property Prediction to Generative Design Across Synthetic and Bio-Polymers
- Title(参考訳): 高出力高分子インフォマティクスのための自律的多エージェントAI:特性予測から合成および生体高分子全体の生成設計へ
- Authors: Mahule Roy, Adib Bazgir, Arthur da Silva Sousa Santos, Yuwen Zhang,
- Abstract要約: 高分子発見のための統合マルチエージェントAIエコシステム。
システムは最先端の大規模言語モデルを利用した特殊エージェントを編成する。
メタ認知エージェントフレームワークはパフォーマンスを監視し、実行戦略を改善することができる。
- 参考スコア(独自算出の注目度): 4.872049308895765
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present an integrated multiagent AI ecosystem for polymer discovery that unifies high-throughput materials workflows, artificial intelligence, and computational modeling within a single Polymer Research Lifecycle (PRL) pipeline. The system orchestrates specialized agents powered by state-of-the-art large language models (DeepSeek-V2 and DeepSeek-Coder) to retrieve and reason over scientific resources, invoke external tools, execute domain-specific code, and perform metacognitive self-assessment for robust end-to-end task execution. We demonstrate three practical capabilities: a high-fidelity polymer property prediction and generative design pipeline, a fully automated multimodal workflow for biopolymer structure characterization, and a metacognitive agent framework that can monitor performance and improve execution strategies over time. On a held-out test set of 1,251 polymers, our PolyGNN agent achieves strong predictive accuracy, reaching R2 = 0.89 for glass-transition temperature (Tg ), R2 = 0.82 for tensile strength, R2 = 0.75 for elongation, and R2 = 0.91 for density. The framework also provides uncertainty estimates via multiagent consensus and scales with linear complexity to at least 10,000 polymers, enabling high-throughput screening at low computational cost. For a representative workload, the system completes inference in 16.3 s using about 2 GB of memory and 0.1 GPU hours, at an estimated cost of about $0.08. On a dedicated Tg benchmark, our approach attains R2 = 0.78, outperforming strong baselines including single-LLM prediction (R2 = 0.67), group-contribution methods (R2 = 0.71), and ChemCrow (R2 = 0.66). We further demonstrate metacognitive control in a polystyrene case study, where the system not only produces domain-level scientific outputs but continually monitors and optimizes its own behavior through tactical, strategic, and meta-strategic self-assessment.
- Abstract(参考訳): 本稿では, 高スループット材料ワークフロー, 人工知能, 計算モデリングを単一の高分子研究ライフサイクル(PRL)パイプライン内で統合する, 高分子発見のための統合マルチエージェントAIエコシステムを提案する。
このシステムは、最先端の大規模言語モデル(DeepSeek-V2とDeepSeek-Coder)を駆使した特殊エージェントを編成し、科学資源の検索と推論、外部ツールの呼び出し、ドメイン固有のコードの実行、堅牢なエンドツーエンドタスク実行のためのメタ認知的自己評価を実行する。
本稿では,高忠実度高分子特性予測と生成設計パイプライン,生体高分子構造評価のための完全自動化マルチモーダルワークフロー,時間とともに性能を監視し,実行戦略を改善するメタ認知エージェントフレームワークの3つの実用的機能を示す。
ガラス転移温度(Tg)はR2 = 0.89、引張強度はR2 = 0.82、伸張強度はR2 = 0.75、密度はR2 = 0.91となる。
このフレームワークはまた、マルチエージェントのコンセンサスによる不確実性の推定も提供し、線形複雑性を少なくとも10,000のポリマーに拡張し、計算コストの低い高スループットスクリーニングを可能にした。
典型的なワークロードでは、約2GBのメモリと0.1GPU時間を使用して16.3秒で推論を完了し、推定コストは0.08ドルである。
専用Tgベンチマークでは、R2 = 0.78に達し、単一LLM予測(R2 = 0.67)、グループ貢献法(R2 = 0.71)、ChemCrow(R2 = 0.66)など、強いベースラインを上回ります。
さらに我々は,ドメインレベルの科学的出力を生産するだけでなく,戦術的,戦略的,メタストラテジックな自己評価を通じて,自身の行動を継続的に監視し,最適化する,ポリスチレンケーススタディにおいてメタ認知制御を実証する。
関連論文リスト
- EmboCoach-Bench: Benchmarking AI Agents on Developing Embodied Robots [68.29056647487519]
Embodied AIは、高忠実度シミュレーションと大規模データ収集によって実現されている。
しかし、このスケーリング能力は、労働集約的な手作業の監視に依存しているため、いまだにボトルネックになっている。
実装ポリシーを自律的に構築するための LLM エージェントの能力を評価するベンチマークである textscEmboCoach-Bench を紹介する。
論文 参考訳(メタデータ) (2026-01-29T11:33:49Z) - GenAgent: Scaling Text-to-Image Generation via Agentic Multimodal Reasoning [54.42973725693]
我々は,エージェント型マルチモーダルモデルを用いて,視覚的理解と生成を統一したGenAgentを導入する。
GenAgentはGenEval++とWISEのベースジェネレータ(FLUX.1-dev)のパフォーマンスを大幅に向上させる。
本フレームワークは,1) 様々な機能を持つジェネレータへのクロスツール一般化,2) インタラクションラウンド間で一貫した改善を伴うテスト時間スケーリング,3) タスクに自動的に適応するタスク適応推論の3つの重要な特性を示す。
論文 参考訳(メタデータ) (2026-01-26T14:49:04Z) - Automating High Energy Physics Data Analysis with LLM-Powered Agents [6.8676809101926075]
本稿では,大規模言語モデル (LLM) エージェントを用いた代表的高エネルギー物理学 (HEP) 解析の自動化を実証する。
ヒッグス粒子二光子断面積測定をATLAS Open Dataのケーススタディとして用いて,LLMベースのスーパーバイザコーダエージェントとSnakemakeワークフローマネージャを組み合わせたハイブリッドシステムを構築した。
このアーキテクチャでは、ワークフローマネージャは決定性を強制し、エージェントはユーザーの指示に応じて分析コードを自動生成し、実行し、反復的に修正する。
論文 参考訳(メタデータ) (2025-12-08T18:13:13Z) - Chemistry Integrated Language Model using Hierarchical Molecular Representation for Polymer Informatics [0.0]
機械学習は無機化合物や小さな分子の物質発見に変化をもたらしたが、ポリマーはこれらの方法にほとんどアクセスできないままである。
本稿では,化学サブ構造をトークンとしてエンコードするHAPPYとトランスフォーマーアーキテクチャ内の数値記述子を組み合わせたフレームワークCI-LLMを紹介する。
プロパティ予測では、De$3$BERTaはSMILESベースのモデルよりも3.5倍高速で精度が向上している。
逆設計では, GPTをベースとしたジェネレータは, ターゲット特性を有するポリマーを生成し, 100%の足場保持を実現し, マルチプロパティ最適化に成功した。
論文 参考訳(メタデータ) (2025-12-06T05:07:11Z) - LoCoBench-Agent: An Interactive Benchmark for LLM Agents in Long-Context Software Engineering [90.84806758077536]
textbfLoCoBench-Agentは,大規模言語モデル(LLM)エージェントを現実的,長期的ソフトウェア工学で評価するための総合的な評価フレームワークである。
我々のフレームワークは、LoCoBenchの8000のシナリオを対話型エージェント環境に拡張し、マルチターン会話の体系的評価を可能にする。
我々のフレームワークは,8つの特殊なツール(ファイル操作,検索,コード解析)をエージェントに提供し,それを10Kから1Mトークンの範囲で評価する。
論文 参考訳(メタデータ) (2025-11-17T23:57:24Z) - ToPolyAgent: AI Agents for Coarse-Grained Topological Polymer Simulations [0.0]
ToPolyAgentは、トポロジカルポリマーの分子動力学シミュレーションを実行するためのマルチエージェントAIフレームワークである。
多様なポリマーアーキテクチャをまたいだインタラクティブなシミュレーションと自律的なシミュレーションの両方をサポートする。
自律的でマルチエージェントな科学研究エコシステムの基礎を築いている。
論文 参考訳(メタデータ) (2025-10-14T02:54:19Z) - Agentic Reinforced Policy Optimization [66.96989268893932]
検証可能な報酬付き大規模強化学習(RLVR)は,大規模言語モデル(LLM)を単一ターン推論タスクに活用する効果を実証している。
現在のRLアルゴリズムは、モデル固有のロングホライゾン推論能力と、マルチターンツールインタラクションにおけるその習熟性のバランスが不十分である。
エージェント強化ポリシー最適化(ARPO: Agentic Reinforced Policy Optimization)は,マルチターンLDMエージェントを学習するためのエージェントRLアルゴリズムである。
論文 参考訳(メタデータ) (2025-07-26T07:53:11Z) - POINT$^{2}$: A Polymer Informatics Training and Testing Database [15.45788515943579]
POINT$2$ (Polymer Informatics Training and Testing) は、高分子情報学における重要な課題に対処するために設計されたベンチマークデータベースとプロトコルである。
我々は、量子ランダムフォレスト、ドロップアウト付き多層パーセプトロン、グラフニューラルネットワーク、事前訓練された大規模言語モデルを含むMLモデルのアンサンブルを開発する。
これらのモデルは、Morgan、MACCS、RDKit、Topological、Atom Pairの指紋、グラフベースの記述子といった多様なポリマー表現と結合している。
論文 参考訳(メタデータ) (2025-03-30T15:46:01Z) - Maximize to Explore: One Objective Function Fusing Estimation, Planning,
and Exploration [87.53543137162488]
我々はtextttMEX というオンライン強化学習(オンラインRL)フレームワークを提案する。
textttMEXは、自動的に探索エクスプロイトのバランスをとりながら、見積もりと計画コンポーネントを統合する。
様々な MuJoCo 環境では,ベースラインを安定的なマージンで上回り,十分な報酬を得られる。
論文 参考訳(メタデータ) (2023-05-29T17:25:26Z) - Polymer Informatics: Current Status and Critical Next Steps [1.3238373064156097]
サロゲートモデルは、インスタントプロパティ予測のために利用可能なポリマーデータに基づいて訓練される。
データ駆動型戦略は, 高分子の化学的, 物理的多様性から生じる特異な課題に, 小規模かつ大規模に対処するものである。
アプリケーションターゲットを満たす高度なAIアルゴリズムを用いて, 高分子レコメンデーションを行う逆問題の解法について検討している。
論文 参考訳(メタデータ) (2020-11-01T14:17:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。