論文の概要: LabUtopia: High-Fidelity Simulation and Hierarchical Benchmark for Scientific Embodied Agents
- arxiv url: http://arxiv.org/abs/2505.22634v1
- Date: Wed, 28 May 2025 17:50:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-29 17:35:50.775164
- Title: LabUtopia: High-Fidelity Simulation and Hierarchical Benchmark for Scientific Embodied Agents
- Title(参考訳): LabUtopia: サイエンボダイドエージェントの高忠実度シミュレーションと階層的ベンチマーク
- Authors: Rui Li, Zixuan Hu, Wenxi Qu, Jinouwen Zhang, Zhenfei Yin, Sha Zhang, Xuantuo Huang, Hanqing Wang, Tai Wang, Jiangmiao Pang, Wanli Ouyang, Lei Bai, Wangmeng Zuo, Ling-Yu Duan, Dongzhan Zhou, Shixiang Tang,
- Abstract要約: LabUtopiaは、一般化可能な推論可能なエンボディエージェントの開発を容易にするために設計された総合的なシミュレーションとベンチマークスイートである。
30の異なるタスクをサポートし、200以上のシーンと楽器の資産を含んでいる。
LabUtopiaは、科学的目的のエージェントにおける知覚、計画、制御の統合を促進する強力なプラットフォームを提供していることを実証する。
- 参考スコア(独自算出の注目度): 103.65422553044816
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Scientific embodied agents play a crucial role in modern laboratories by automating complex experimental workflows. Compared to typical household environments, laboratory settings impose significantly higher demands on perception of physical-chemical transformations and long-horizon planning, making them an ideal testbed for advancing embodied intelligence. However, its development has been long hampered by the lack of suitable simulator and benchmarks. In this paper, we address this gap by introducing LabUtopia, a comprehensive simulation and benchmarking suite designed to facilitate the development of generalizable, reasoning-capable embodied agents in laboratory settings. Specifically, it integrates i) LabSim, a high-fidelity simulator supporting multi-physics and chemically meaningful interactions; ii) LabScene, a scalable procedural generator for diverse scientific scenes; and iii) LabBench, a hierarchical benchmark spanning five levels of complexity from atomic actions to long-horizon mobile manipulation. LabUtopia supports 30 distinct tasks and includes more than 200 scene and instrument assets, enabling large-scale training and principled evaluation in high-complexity environments. We demonstrate that LabUtopia offers a powerful platform for advancing the integration of perception, planning, and control in scientific-purpose agents and provides a rigorous testbed for exploring the practical capabilities and generalization limits of embodied intelligence in future research.
- Abstract(参考訳): 科学的実施剤は複雑な実験ワークフローを自動化することで、現代の研究室において重要な役割を担っている。
典型的な家庭環境と比較すると、実験室の設定は物理化学変換と長期計画の認識にかなり高い要求を課し、エンボディドインテリジェンスを推進するための理想的なテストベッドとなった。
しかし、その開発は適切なシミュレータとベンチマークの欠如によって長い間妨げられてきた。
本稿では,実験室環境における汎用的,推論可能なエンボディエージェントの開発を容易にするための総合的なシミュレーションおよびベンチマークスイートであるLabUtopiaを導入することで,このギャップに対処する。
具体的には
一 多重物理及び化学的に有意な相互作用を支える高忠実度シミュレーター
二 多様な科学的場面のためのスケーラブルな手続き生成装置、ラボシーン及び
iii) LabBenchは、原子の作用から長距離移動操作までの5段階の複雑さにまたがる階層的なベンチマークである。
LabUtopiaは30の異なるタスクをサポートし、200以上のシーンと楽器の資産を含み、大規模トレーニングと高複雑さ環境での原則的評価を可能にしている。
我々は,LabUtopiaが科学的エージェントにおける知覚,計画,制御の統合を促進する強力なプラットフォームを提供し,将来の研究における具体的インテリジェンスの実現能力と一般化限界を探求するための厳密なテストベッドを提供することを示した。
関連論文リスト
- ScienceBoard: Evaluating Multimodal Autonomous Agents in Realistic Scientific Workflows [82.07367406991678]
大規模言語モデル(LLM)は自然言語処理を超えてその影響を拡大している。
これらのうち、コンピュータ利用エージェントは、人間がしているようにオペレーティングシステムと対話することができる。
我々はScienceBoardを紹介し、ダイナミックで視覚的にリッチな科学ソフトウェアを特徴とする現実的でマルチドメイン環境を包含する。
論文 参考訳(メタデータ) (2025-05-26T12:27:27Z) - Autonomous Microscopy Experiments through Large Language Model Agents [4.241267255764773]
大規模言語モデル(LLM)は、材料研究のための自動運転研究所(SDL)の開発を加速させた。
本稿では,原子間力顕微鏡(AFM)を自動化するフレームワークであるAILA(Artificially Intelligent Lab Assistant)を紹介する。
我々の体系的な評価は、最先端の言語モデルがドキュメント検索のような基本的なタスクに悩まされていることを示している。
論文 参考訳(メタデータ) (2024-12-18T09:35:28Z) - Agents for self-driving laboratories applied to quantum computing [2.840384720502993]
本稿では,実験者の実験知識の組織化とエージェントによる実験の自動化を支援するため,k-agentsフレームワークを提案する。
本フレームワークでは,実験結果の分析方法を含む実験室の知識をカプセル化するために,大規模言語モデルに基づくエージェントを用いている。
実験を自動化するために,複数ステップの実験手順をステートマシンに分割し,他のエージェントと対話して各ステップの実行を行い,実験結果を解析する実行エージェントを導入する。
論文 参考訳(メタデータ) (2024-12-10T23:30:44Z) - AlabOS: A Python-based Reconfigurable Workflow Management Framework for Autonomous Laboratories [3.8330070166920556]
実験のオーケストレーションとリソース管理のための汎用ソフトウェアフレームワークであるAlabOSを紹介する。
AlabOSは再構成可能な実験ワークフローモデルとリソース予約機構を備えており、様々なタスクの同時実行を可能にする。
1.5年間に約3,500のサンプルを合成したA-Labの試作実験室で,AlabOSの実装を実演した。
論文 参考訳(メタデータ) (2024-05-22T18:59:39Z) - MLXP: A Framework for Conducting Replicable Experiments in Python [63.37350735954699]
MLXPはPythonをベースとした,オープンソースの,シンプルで,軽量な実験管理ツールである。
実験プロセスを最小限のオーバーヘッドで合理化し、高いレベルの実践的オーバーヘッドを確保します。
論文 参考訳(メタデータ) (2024-02-21T14:22:20Z) - Chemist-X: Large Language Model-empowered Agent for Reaction Condition Recommendation in Chemical Synthesis [55.30328162764292]
Chemist-Xは、化学合成における反応条件最適化(RCO)タスクを自動化する包括的なAIエージェントである。
このエージェントは、検索強化世代(RAG)技術とAI制御のウェットラブ実験を実行する。
我々の自動ウェットラブ実験の結果は、LLMが制御するエンドツーエンドの操作を、ロボットに人間がいない状態で行うことで達成され、Chemist-Xの自動運転実験における能力が証明された。
論文 参考訳(メタデータ) (2023-11-16T01:21:33Z) - Octopus: Embodied Vision-Language Programmer from Environmental Feedback [58.04529328728999]
身体視覚言語モデル(VLM)は多モード認識と推論において大きな進歩を遂げた。
このギャップを埋めるために、我々は、計画と操作を接続する媒体として実行可能なコード生成を使用する、具体化された視覚言語プログラマであるOctopusを紹介した。
Octopusは、1)エージェントの視覚的およびテキスト的タスクの目的を正確に理解し、2)複雑なアクションシーケンスを定式化し、3)実行可能なコードを生成するように設計されている。
論文 参考訳(メタデータ) (2023-10-12T17:59:58Z) - An in-depth experimental study of sensor usage and visual reasoning of
robots navigating in real environments [20.105395754497202]
実物的エージェントの性能と推論能力について検討し、シミュレーションで訓練し、2つの異なる物理的環境に展開する。
我々は,PointGoalタスクに対して,多種多様なタスクを事前訓練し,対象環境の模擬バージョンを微調整したエージェントが,sim2real転送をモデル化せずに競争性能に達することを示す。
論文 参考訳(メタデータ) (2021-11-29T16:27:29Z) - BEHAVIOR: Benchmark for Everyday Household Activities in Virtual,
Interactive, and Ecological Environments [70.18430114842094]
本稿では,シミュレーションにおける100のアクティビティを持つAIのベンチマークであるBEHAVIORを紹介する。
これらの活動は現実的で多様性があり、複雑であるように設計されています。
われわれは、バーチャルリアリティー(VR)における500件の人間デモを含む。
論文 参考訳(メタデータ) (2021-08-06T23:36:23Z) - Empirica: a virtual lab for high-throughput macro-level experiments [4.077787659104315]
Empiricaはモジュール型の仮想ラボで、ユーザビリティ-機能トレードオフに対するソリューションを提供する。
Empiricaのアーキテクチャはパラメータ化可能な実験設計、再利用可能なプロトコル、迅速な開発を可能にするように設計されている。
論文 参考訳(メタデータ) (2020-06-19T21:28:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。