論文の概要: AutoLabs: Cognitive Multi-Agent Systems with Self-Correction for Autonomous Chemical Experimentation
- arxiv url: http://arxiv.org/abs/2509.25651v1
- Date: Tue, 30 Sep 2025 01:51:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-01 14:44:59.97542
- Title: AutoLabs: Cognitive Multi-Agent Systems with Self-Correction for Autonomous Chemical Experimentation
- Title(参考訳): AutoLabs: 自動化学実験のための自己補正型認知マルチエージェントシステム
- Authors: Gihan Panapitiya, Emily Saldanha, Heather Job, Olivia Hess,
- Abstract要約: AutoLabsは、自然言語命令を自動で実行可能なプロトコルに変換するように設計された、自己修正型マルチエージェントアーキテクチャである。
複雑化に関する5つのベンチマーク実験を特徴とする総合評価フレームワークを提案する。
以上の結果から,エージェント推論能力が成功の最も重要な要因であることが示唆された。
- 参考スコア(独自算出の注目度): 0.10999592665107412
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The automation of chemical research through self-driving laboratories (SDLs) promises to accelerate scientific discovery, yet the reliability and granular performance of the underlying AI agents remain critical, under-examined challenges. In this work, we introduce AutoLabs, a self-correcting, multi-agent architecture designed to autonomously translate natural-language instructions into executable protocols for a high-throughput liquid handler. The system engages users in dialogue, decomposes experimental goals into discrete tasks for specialized agents, performs tool-assisted stoichiometric calculations, and iteratively self-corrects its output before generating a hardware-ready file. We present a comprehensive evaluation framework featuring five benchmark experiments of increasing complexity, from simple sample preparation to multi-plate timed syntheses. Through a systematic ablation study of 20 agent configurations, we assess the impact of reasoning capacity, architectural design (single- vs. multi-agent), tool use, and self-correction mechanisms. Our results demonstrate that agent reasoning capacity is the most critical factor for success, reducing quantitative errors in chemical amounts (nRMSE) by over 85% in complex tasks. When combined with a multi-agent architecture and iterative self-correction, AutoLabs achieves near-expert procedural accuracy (F1-score > 0.89) on challenging multi-step syntheses. These findings establish a clear blueprint for developing robust and trustworthy AI partners for autonomous laboratories, highlighting the synergistic effects of modular design, advanced reasoning, and self-correction to ensure both performance and reliability in high-stakes scientific applications. Code: https://github.com/pnnl/autolabs
- Abstract(参考訳): 自動運転車研究所(SDL)による化学研究の自動化は、科学的な発見を加速することを約束するが、基礎となるAIエージェントの信頼性と粒度のパフォーマンスは、重要で過小評価されていない課題のままである。
本研究では,自動修正型マルチエージェントアーキテクチャであるAutoLabsを導入し,自然言語命令を高スループット液体ハンドラ用の実行可能プロトコルに自動翻訳する。
本システムは,対話にユーザを巻き込み,実験目標を特殊エージェントの個別のタスクに分解し,ツールによる確率的計算を行い,ハードウェア対応ファイルを生成する前に,その出力を反復的に自己補正する。
本報告では, 単純試料調製から多板時間合成まで, 複雑化に関する5つのベンチマーク実験を特徴とする総合評価フレームワークを提案する。
20のエージェント構成の体系的アブレーション研究を通じて、推論能力、アーキテクチャ設計(シングル対マルチエージェント)、ツール使用、自己補正メカニズムの影響を評価する。
以上の結果から, エージェント推論能力は, 化学量(nRMSE)の量的誤差を85%以上低減し, 成功の最も重要な要因であることが示唆された。
マルチエージェントアーキテクチャと反復自己補正を組み合わせると、AutoLabsは、挑戦的なマルチステップ合成において、ほぼ精巧な手続き精度(F1-score > 0.89)を達成する。
これらの発見は、自律的な研究所のための堅牢で信頼性の高いAIパートナーを開発するための明確な青写真を確立し、高度の科学的応用におけるパフォーマンスと信頼性の両方を保証するために、モジュール設計、高度な推論、自己補正の相乗効果を強調している。
コード:https://github.com/pnnl/autolabs
関連論文リスト
- BioMARS: A Multi-Agent Robotic System for Autonomous Biological Experiments [8.317138109309967]
大規模言語モデル(LLM)と視覚言語モデル(VLM)は、自律的な実験を可能にすることによって生物学的研究を変革する可能性がある。
ここでは、LLM、VLM、モジュールロボットを統合し、自律的に設計、計画、実行を行うインテリジェントプラットフォームであるBioMARSを紹介する。
Webインターフェースはリアルタイムの人間とAIのコラボレーションを可能にし、モジュール化されたバックエンドは実験室のハードウェアとのスケーラブルな統合を可能にする。
論文 参考訳(メタデータ) (2025-07-02T08:47:02Z) - ChemActor: Enhancing Automated Extraction of Chemical Synthesis Actions with LLM-Generated Data [53.78763789036172]
ケミカルエグゼキュータとして完全微調整された大規模言語モデル(LLM)であるChemActorを紹介し,非構造化実験手順と構造化動作シーケンスを変換する。
このフレームワークは、分散分散に基づくデータ選択モジュールと汎用LLMを統合し、単一の分子入力からマシン実行可能なアクションを生成する。
反応記述(R2D)と記述記述処理(D2A)のタスクの実験により、ChemActorは最先端のパフォーマンスを達成し、ベースラインモデルよりも10%高い性能を示した。
論文 参考訳(メタデータ) (2025-06-30T05:11:19Z) - ScienceBoard: Evaluating Multimodal Autonomous Agents in Realistic Scientific Workflows [82.07367406991678]
大規模言語モデル(LLM)は自然言語処理を超えてその影響を拡大している。
これらのうち、コンピュータ利用エージェントは、人間がしているようにオペレーティングシステムと対話することができる。
我々はScienceBoardを紹介し、ダイナミックで視覚的にリッチな科学ソフトウェアを特徴とする現実的でマルチドメイン環境を包含する。
論文 参考訳(メタデータ) (2025-05-26T12:27:27Z) - DrugPilot: LLM-based Parameterized Reasoning Agent for Drug Discovery [54.79763887844838]
大規模言語モデル(LLM)と自律エージェントの統合は、自動推論とタスク実行を通じて科学的発見を促進する大きな可能性を秘めている。
本稿では,薬物発見におけるエンドツーエンド科学のために設計されたパラメータ化推論アーキテクチャを備えたLSMベースのエージェントシステムであるDrarmPilotを紹介する。
DrugPilot は ReAct や LoT のような最先端のエージェントよりも優れており、タスク完了率は98.0%、93.5%、64.0%である。
論文 参考訳(メタデータ) (2025-05-20T05:18:15Z) - El Agente: An Autonomous Agent for Quantum Chemistry [3.6593051631801106]
El Agente Qは、自然言語のユーザプロンプトから量子化学を生成し、実行するマルチエージェントシステムである。
El Agente Qは6つの大学レベルのコース演習と2つのケーススタディでベンチマークされ、堅牢な問題解決性能を示している。
論文 参考訳(メタデータ) (2025-05-05T09:07:22Z) - Autonomous Microscopy Experiments through Large Language Model Agents [4.241267255764773]
大規模言語モデル(LLM)は、材料研究のための自己運転実験室(SDL)に革命をもたらしている。
LLM駆動エージェントによる原子間力顕微鏡の自動化フレームワークであるArtificially Intelligent Lab Assistant (AILA)を紹介する。
アートモデルの現状が,基本的なタスクや調整シナリオに苦労していることに気付きました。
論文 参考訳(メタデータ) (2024-12-18T09:35:28Z) - Chemist-X: Large Language Model-empowered Agent for Reaction Condition Recommendation in Chemical Synthesis [55.30328162764292]
Chemist-Xは、化学合成における反応条件最適化(RCO)タスクを自動化する包括的なAIエージェントである。
このエージェントは、検索強化世代(RAG)技術とAI制御のウェットラブ実験を実行する。
我々の自動ウェットラブ実験の結果は、LLMが制御するエンドツーエンドの操作を、ロボットに人間がいない状態で行うことで達成され、Chemist-Xの自動運転実験における能力が証明された。
論文 参考訳(メタデータ) (2023-11-16T01:21:33Z) - Integrated Benchmarking and Design for Reproducible and Accessible
Evaluation of Robotic Agents [61.36681529571202]
本稿では,開発とベンチマークを統合した再現性ロボット研究の新しい概念について述べる。
このセットアップの中心的なコンポーネントの1つはDuckietown Autolabであり、これは比較的低コストで再現可能な標準化されたセットアップである。
本研究では,インフラを用いて実施した実験の再現性を解析し,ロボットのハードウェアや遠隔実験室間でのばらつきが低いことを示す。
論文 参考訳(メタデータ) (2020-09-09T15:31:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。