論文の概要: Managing Uncertainty in LLM-Generated Procedural Knowledge for Virtual Laboratory Planning
- arxiv url: http://arxiv.org/abs/2605.26333v1
- Date: Mon, 25 May 2026 21:12:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:41.471545
- Title: Managing Uncertainty in LLM-Generated Procedural Knowledge for Virtual Laboratory Planning
- Title(参考訳): 仮想実験室計画におけるLLM生成手続き知識の不確実性管理
- Authors: Polychronis Karpodinis, Dimitris Kalles,
- Abstract要約: 仮想実験室計画のためのLLM生成手続き的知識の不確実性を管理するためのプロトタイプフレームワークを提案する。
このフレームワークは、構造化されたドメイン表現と不確実なLCM生成状態遷移サンプルを使用することで、手続き的不確実性を低減することを目的としている。
本稿では,実験器具,容器,工具,物質移動動作を含む仮想実験室領域におけるアプローチについて述べる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Educational virtual laboratories can make experimental training more scala-ble, adaptive, and accessible, especially when students have limited access to physical laboratory facilities. However, authoring new simulated laboratory procedures remains costly: educators must describe new equipment, define how instruments and materials interact, and specify valid procedural flows that can be executed or assessed inside the virtual environment. Large lan-guage models can assist in this authoring process by generating detailed ex-perimental procedures, but their output should not be treated as directly exe-cutable plans. They may omit necessary actions, arrange steps in the wrong order, or produce instructions that are logically incorrect or incompatible with the laboratory equipment. This paper presents a prototype framework for managing uncertainty in LLM-generated procedural knowledge for virtu-al laboratory planning. The framework aims to reduce procedural uncertainty by using structured domain representations and uncertain LLM-generated state-transition samples to extract candidate procedural rules, transform them into explicit and inspectable constraints, and use them to repair uncertain procedural steps. Although the motivating domain refers to educational vir-tual laboratories, the underlying problem is more general: managing uncer-tain procedural knowledge for action planning in structured interactive envi-ronments. We illustrate the approach in a virtual laboratory domain involving laboratory instruments, containers, tools, and material-transfer actions.
- Abstract(参考訳): 教育用バーチャル・ラボラトリーは、特に学生が物理的な実験施設に限られたアクセス権を持つ場合に、より頭皮を生やし、適応し、アクセスしやすくする実験訓練を行うことができる。
教育者は、新しい機器を記述し、楽器や材料がどのように相互作用するかを定義し、仮想環境内で実行または評価できる有効な手続きフローを特定する必要がある。
大規模なランゲージモデルは、詳細な外周手順を生成することで、このオーサリングプロセスを支援することができるが、それらのアウトプットを直接実行可能なプランとして扱うべきではない。
必要な動作を省略したり、間違った順序でステップを配置したり、論理的に不正確あるいは実験装置と互換性のない命令を作成できる。
仮想実験室計画のためのLLM生成手続き的知識の不確実性を管理するためのプロトタイプフレームワークを提案する。
このフレームワークは、構造化されたドメイン表現と不確実なLLM生成状態遷移サンプルを用いて、プロシージャ規則を抽出し、それらを明示的で検査可能な制約に変換し、不確実なプロシージャステップの修復に使用することにより、プロシージャの不確実性を低減することを目的としている。
モチベーション領域は教育用仮想実験室を指すが、その根底にある問題は、構造化された対話的環境論における行動計画のための未確定の手続き的知識を管理することである。
本稿では,実験器具,容器,工具,物質移動動作を含む仮想実験室領域におけるアプローチについて述べる。
関連論文リスト
- BioProVLA-Agent: An Affordable, Protocol-Driven, Vision-Enhanced VLA-Enabled Embodied Multi-Agent System with Closed-Loop-Capable Reasoning for Biological Laboratory Manipulation [15.461936066333633]
BioProVLA-Agent(バイオプロVLA-Agent)は、生物学的操作のためのプロトコル駆動型、ビジョン駆動型多エージェントシステムである。
クローズドループワークフローでは、プロトコル解析、視覚的状態検証、具体的実行を統合している。
本研究では,15の原子タスク,6つの複合タスク,3つのバイマニュアルタスクを網羅した階層的ベンチマークによるシステム評価を行った。
論文 参考訳(メタデータ) (2026-05-08T06:15:40Z) - LabBuilder: Protocol-Grounded 3D Layout Generation for Interactable and Safe Laboratory [93.63620478256063]
本稿では,簡潔なテキスト仕様から3次元実験室レイアウトを生成し検証するエンドツーエンドシステムであるLabBuilderを提案する。
LabBuilderは、既存の最先端メソッドを大きく上回っている。
論文 参考訳(メタデータ) (2026-05-04T07:24:56Z) - Sci-VLA: Agentic VLA Inference Plugin for Long-Horizon Tasks in Scientific Experiments [49.02509634515056]
最近のビジョン言語アクションモデルは、ロボット研究所にとって有望な基盤を提供する。
実験は通常、複数の原子タスクからなる長い水平タスクを含む。
科学的なタスクのために微調整されたVLAモデルは、原子実験的なアクションを確実に実行することができるが、これらの既知の原子のアクションを再順序付けして構成することによって形成される複合的なタスクの実行に失敗することが多い。
論文 参考訳(メタデータ) (2026-02-10T05:50:19Z) - CAPER: Constrained and Procedural Reasoning for Robotic Scientific Experiments [8.099293110920486]
本稿では,ロボット科学実験のための制約付きおよびプロデューラル推論のためのフレームワークであるCAPERを提案する。
解釈可能な中間表現を通じて手続き的なコミットメントを符号化することにより、CAPERは実験ロジックの実行時違反を防止する。
科学ワークフローベンチマークとパブリックな長期操作データセットの実験は、成功率と手続き的正確性において一貫した改善を示す。
論文 参考訳(メタデータ) (2026-02-10T03:18:41Z) - PRISM: Protocol Refinement through Intelligent Simulation Modeling [4.839327116611717]
本稿では,実験プロトコルの設計,検証,実行を自動化するフレームワークであるPRISMを紹介する。
PRISMは言語モデルに基づくエージェントのセットを使用し、共同で実験的なステップを生成し、洗練する。
我々は、PRISMを言語ベースのプロトコル生成、シミュレーションベースの検証、自動ロボット実行をブリッジする実用的なエンドツーエンドワークフローとして実証する。
論文 参考訳(メタデータ) (2026-01-08T20:15:28Z) - LabUtopia: High-Fidelity Simulation and Hierarchical Benchmark for Scientific Embodied Agents [103.65422553044816]
LabUtopiaは、一般化可能な推論可能なエンボディエージェントの開発を容易にするために設計された総合的なシミュレーションとベンチマークスイートである。
30の異なるタスクをサポートし、200以上のシーンと楽器の資産を含んでいる。
LabUtopiaは、科学的目的のエージェントにおける知覚、計画、制御の統合を促進する強力なプラットフォームを提供していることを実証する。
論文 参考訳(メタデータ) (2025-05-28T17:50:53Z) - ProgPrompt: Generating Situated Robot Task Plans using Large Language
Models [68.57918965060787]
大規模言語モデル(LLM)は、タスク計画中の潜在的な次のアクションを評価するために使用することができる。
本稿では, プログラム型LCMプロンプト構造を用いて, 配置環境間での計画生成機能を実現する。
論文 参考訳(メタデータ) (2022-09-22T20:29:49Z) - Chain of Thought Imitation with Procedure Cloning [129.62135987416164]
本稿では,一連の専門家計算を模倣するために,教師付きシーケンス予測を適用したプロシージャクローニングを提案する。
本研究では、専門家の行動の中間計算を模倣することで、プロシージャのクローン化により、未知の環境構成に顕著な一般化を示すポリシーを学習できることを示す。
論文 参考訳(メタデータ) (2022-05-22T13:14:09Z) - Language Models as Zero-Shot Planners: Extracting Actionable Knowledge
for Embodied Agents [111.33545170562337]
自然言語で表現された高レベルなタスクを、選択された実行可能なステップのセットに基底付ける可能性について検討する。
事前学習したLMが十分に大きく、適切に誘導された場合、ハイレベルなタスクを効果的に低レベルな計画に分解できることがわかった。
本稿では,既存の実演の条件を規定し,計画が許容可能な行動に意味的に変換される手順を提案する。
論文 参考訳(メタデータ) (2022-01-18T18:59:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。