論文の概要: Grounding LLMs in Scientific Discovery via Embodied Actions
- arxiv url: http://arxiv.org/abs/2602.20639v1
- Date: Tue, 24 Feb 2026 07:37:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-25 17:34:53.651837
- Title: Grounding LLMs in Scientific Discovery via Embodied Actions
- Title(参考訳): 身体的行動による科学的発見におけるLLMの接地
- Authors: Bo Zhang, Jinfeng Zhou, Yuxuan Chen, Jianing Yin, Minlie Huang, Hongning Wang,
- Abstract要約: 大規模言語モデル (LLMs) は科学的発見に大きな可能性を示しているが、理論的推論と物理シミュレーションのギャップを埋めるのに苦労している。
EmbodiedActは、確立された科学ソフトウェアを、密着した知覚・実行ループによる実施行動の基盤化により、アクティブな実施エージェントに変換するフレームワークである。
- 参考スコア(独自算出の注目度): 84.11877211907647
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large Language Models (LLMs) have shown significant potential in scientific discovery but struggle to bridge the gap between theoretical reasoning and verifiable physical simulation. Existing solutions operate in a passive "execute-then-response" loop and thus lacks runtime perception, obscuring agents to transient anomalies (e.g., numerical instability or diverging oscillations). To address this limitation, we propose EmbodiedAct, a framework that transforms established scientific software into active embodied agents by grounding LLMs in embodied actions with a tight perception-execution loop. We instantiate EmbodiedAct within MATLAB and evaluate it on complex engineering design and scientific modeling tasks. Extensive experiments show that EmbodiedAct significantly outperforms existing baselines, achieving SOTA performance by ensuring satisfactory reliability and stability in long-horizon simulations and enhanced accuracy in scientific modeling.
- Abstract(参考訳): 大規模言語モデル (LLM) は科学的発見に大きな可能性を示しているが、理論的推論と検証可能な物理シミュレーションのギャップを埋めるのに苦労している。
既存のソリューションはパッシブな「実行時応答(execute-then-Response)」ループで動作し、実行時認識、エージェントを過渡的な異常(例えば、数値不安定性や発振のばらつき)に隠蔽する。
この制限に対処するために、我々は、確立された科学ソフトウェアを活発なエンボディエージェントに変換するフレームワークであるEmbodiedActを提案する。
我々は、MATLAB内でEmbodiedActをインスタンス化し、複雑なエンジニアリング設計および科学モデリングタスクで評価する。
大規模な実験により、EmbodiedActは既存のベースラインを著しく上回り、長期間のシミュレーションにおいて良好な信頼性と安定性を確保し、科学的モデリングにおける精度を向上することでSOTA性能を達成することが示されている。
関連論文リスト
- SIMPACT: Simulation-Enabled Action Planning using Vision-Language Models [60.80050275581661]
VLM(Vision-Language Models)は、目覚しい常識と意味論的推論能力を示す。
物理力学に関する基礎的な理解は欠如している。
テストタイムでシミュレーション可能な ACTion Planning フレームワークである S を提案する。
本手法は,5つの難易度,実世界の剛体および変形可能な操作課題に対して,最先端の性能を示す。
論文 参考訳(メタデータ) (2025-12-05T18:51:03Z) - Leveraging LLM-based agents for social science research: insights from citation network simulations [132.4334196445918]
CiteAgentフレームワークを導入し、人間-行動シミュレーションに基づく引用ネットワークを生成する。
CiteAgentは、実世界の引用ネットワークにおける主要な現象を捉えている。
社会科学において2つのLCMに基づく研究パラダイムを確立し,既存の理論の検証と挑戦を可能にした。
論文 参考訳(メタデータ) (2025-11-05T08:47:04Z) - NewtonBench: Benchmarking Generalizable Scientific Law Discovery in LLM Agents [65.85967483058705]
科学法発見のための強力なツールとして、大規模な言語モデルが登場している。
このタスクの既存のベンチマークは、基本的な方法論のトリレンマに悩まされている。
12の物理領域にわたる324の科学法発見タスクからなるベンチマークであるNewtonBenchを紹介する。
論文 参考訳(メタデータ) (2025-10-08T16:12:11Z) - LLMPhy: Complex Physical Reasoning Using Large Language Models and World Models [35.01842161084472]
そこで我々は,TraySimという物理推論タスクとデータセットを提案する。
私たちのタスクは、外部の影響を受けるトレイ上のいくつかのオブジェクトのダイナミクスを予測することです。
LLMの物理知識とプログラム合成能力を活用するゼロショットブラックボックス最適化フレームワークであるLLMPhyを提案する。
この結果から,LLMと物理エンジンの組み合わせにより,最先端のゼロショット物理推論性能が得られることがわかった。
論文 参考訳(メタデータ) (2024-11-12T18:56:58Z) - Reliable edge machine learning hardware for scientific applications [34.87898436984149]
極端なデータレートの科学実験は、効率的なMLエッジ処理を必要とする大量のデータを生成する。
このような厳密なレイテンシ、リソース、パワー、および領域要件の下で、科学的なエッジで信頼できるアルゴリズムを開発し、検証するためのアプローチについて議論する。
論文 参考訳(メタデータ) (2024-06-27T20:45:08Z) - LLM and Simulation as Bilevel Optimizers: A New Paradigm to Advance Physical Scientific Discovery [141.39722070734737]
本稿では,大規模言語モデルの知識駆動型抽象推論能力をシミュレーションの計算力で強化することを提案する。
本稿では,2段階最適化フレームワークであるSGA(Scientific Generative Agent)を紹介する。
法発見と分子設計における枠組みの有効性を実証するための実験を行った。
論文 参考訳(メタデータ) (2024-05-16T03:04:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。