論文の概要: Bridging the Experimental Last Mile: Digitizing Laboratory Know-How for Safe AI-Assisted Support
- arxiv url: http://arxiv.org/abs/2604.16345v1
- Date: Mon, 16 Mar 2026 11:19:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 02:32:13.911176
- Title: Bridging the Experimental Last Mile: Digitizing Laboratory Know-How for Safe AI-Assisted Support
- Title(参考訳): 実験ラストマイルのブリッジ:安全なAI支援のための実験室のノウハウ
- Authors: Akira Miura, Yuki Sasahara, Momoka Demura, Yuji Masubuchi, Tetsuya Asai, Chikahiko Mitsui,
- Abstract要約: 我々は、一人称実験ビデオ、マルチモーダルAI、検索強化世代(RAG)を組み合わせた、ループ内AIアシスタントを開発する。
このシステムは、物理技術や従来のマニュアルが省略できるという可聴性確認を含む、記録された手順から、サイト固有の実験室の知識を抽出する。
そして、結果のマニュアルに基づいて、接地された応答を提供する。
- 参考スコア(独自算出の注目度): 0.2045130722535742
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Advances in Materials Informatics have accelerated the development of Self-Driving Laboratories (SDLs), yet human-led experiments remain standard in many educational and exploratory research settings. In such environments, practical know-how, including operational details and site-specific rules, is essential for safe and reliable laboratory work. In this proof-of-concept study, we developed a human-in-the-loop AI assistant that combines first-person experimental video, multimodal AI, and retrieval-augmented generation (RAG). Using powder X-ray diffraction experiments and student-recorded video data as inputs, the system extracts site-specific laboratory knowledge from recorded procedures, including physical techniques and audible confirmation that conventional manuals could omit. It then provides grounded responses based on the resulting manual. To reduce the risk of unsupported outputs, the system employs a two-layer safety design: source restriction through RAG and strict system-prompt constraints. Instructor-based evaluation showed alignment with expected guidance for questions covered by the manual. For out-of-scope queries, the system appropriately refused to answer, indicating a reduced risk of hallucination. Expert evaluation further indicated that the generated advisory reports were useful and safe (utility: 3.25/4.00; safety: 4.00/4.00). These results suggest a framework in which AI supports laboratory practice under explicit human supervision rather than replacing human judgment.
- Abstract(参考訳): 材料インフォマティクスの進歩は、SDL(Self-Driving Laboratories)の開発を加速させたが、多くの教育および探索的な研究環境において、人間主導の実験は標準のままである。
このような環境では、運用の詳細やサイト固有のルールを含む実践的なノウハウは、安全で信頼性の高い研究室作業に不可欠である。
この概念実証研究において、我々は、一人称実験ビデオ、マルチモーダルAI、検索強化世代(RAG)を組み合わせた、ループ内AIアシスタントを開発した。
このシステムは、粉末X線回折実験と学生が記録したビデオデータを入力として使用し、物理技術や従来のマニュアルが省略可能であることの確認を含む、記録された手順からサイト固有の実験室の知識を抽出する。
そして、結果のマニュアルに基づいて、接地された応答を提供する。
不要な出力のリスクを低減するため、RAGによるソース制限と厳格なシステムプロンプト制約という2層安全設計を採用している。
インストラクタに基づく評価では,マニュアルによる質問に対する予測ガイダンスと整合性を示した。
スコープ外の質問に対して、システムは適切な回答を拒み、幻覚のリスクを減らした。
専門家による評価は、生成された勧告報告は有用で安全であることを示している(実用性:3.25/4.00、安全性:4.00/4.00)。
これらの結果は、AIが人間の判断を置き換えるのではなく、明示的な人間の監督の下で実験室の実践を支援する枠組みを示唆している。
関連論文リスト
- RCTs & Human Uplift Studies: Methodological Challenges and Practical Solutions for Frontier AI Evaluation [7.662976269800995]
人間アップリフト研究は、現状に対する人間のパフォーマンスにAIが与える影響を測定する。
これらの研究は、フロンティアAIシステムのデプロイメント、ガバナンス、安全性決定にますます役立っている。
これらの研究の基礎となる手法は確立されているが、フロンティアAIシステムの特徴的な性質との相互作用はいまだに過小評価されていない。
論文 参考訳(メタデータ) (2026-03-11T17:25:03Z) - RAG-RUSS: A Retrieval-Augmented Robotic Ultrasound for Autonomous Carotid Examination [42.034503215067524]
臨床ワークフローに応じて完全な頸動脈検査を行うことができる解釈可能なフレームワークであるRAG-RUSSを紹介した。
医療データの不足を鑑み,一般化を促進するために検索強化世代を取り入れた。
その結果,現在の走査段階を解明し,頸動脈検査を完了するためのプローブ動作を自律的に計画できることが示唆された。
論文 参考訳(メタデータ) (2026-03-01T15:37:44Z) - SelfAI: Building a Self-Training AI System with LLM Agents [79.10991818561907]
SelfAIは、高レベルの研究目的を標準化された実験構成に変換するためのUser Agentを組み合わせた、一般的なマルチエージェントプラットフォームである。
実験マネージャは、連続的なフィードバックのための構造化知識ベースを維持しながら、異種ハードウェアをまたいだ並列かつフォールトトレラントなトレーニングを編成する。
回帰、コンピュータビジョン、科学計算、医用画像、薬物発見ベンチマークなどを通じて、SelfAIは一貫して高いパフォーマンスを達成し、冗長な試行を減らしている。
論文 参考訳(メタデータ) (2025-11-29T09:18:39Z) - Measuring skill-based uplift from AI in a real biological laboratory [0.0]
我々は,AI推論モデルへのアクセスによって引き起こされるEmphskillsベースの隆起の大きさを実証的に測定しようとしたパイロット研究の結果を報告する。
これらの結果は,AIとグローバルバイオセキュリティの進化的関係に関する今後の研究の文脈において論じる。
論文 参考訳(メタデータ) (2025-10-29T16:34:57Z) - ExpVid: A Benchmark for Experiment Video Understanding & Reasoning [65.17173232816818]
科学実験ビデオ上でMLLMを体系的に評価する最初のベンチマークであるExpVidを紹介する。
ExpVid 上で 19 個のMLLM を評価し, 粗粒度認識に優れる一方で, 詳細さの曖昧化, 時間経過による状態変化の追跡, 実験手順と科学的成果のリンクに苦慮していることがわかった。
この結果から,特に高次推論において,プロプライエタリモデルとオープンソースモデルとの顕著なパフォーマンスギャップが明らかとなった。
論文 参考訳(メタデータ) (2025-10-13T16:45:28Z) - AGENTSAFE: Benchmarking the Safety of Embodied Agents on Hazardous Instructions [64.85086226439954]
本稿では,有害な指示に対するVLMエージェントの安全性を評価するためのベンチマークであるSAFEを提案する。
SAFEは、SAFE−THOR、SAFE−VERSE、SAFE−DIAGNOSEの3つの成分からなる。
我々は、ハザード認識を安全な計画と実行に翻訳する体系的な失敗を明らかにする。
論文 参考訳(メタデータ) (2025-06-17T16:37:35Z) - Setup-Invariant Augmented Reality for Teaching by Demonstration with Surgical Robots [49.26692555627371]
本稿では,dV-STEARというオープンソースのシステムについて紹介する。
dV-STEARは腹腔鏡下手術の基本課題の初級成績を有意に改善した。
両課題とも,dV-STEARを用いた被験者では,手指使用のバランスが有意に改善し,フラストレーションの低下が報告された。
論文 参考訳(メタデータ) (2025-04-09T08:34:25Z) - LabSafety Bench: Benchmarking LLMs on Safety Issues in Scientific Labs [78.99703366417661]
大規模言語モデル(LLM)は、手続き的なガイダンスから自律的な実験オーケストレーションまで、タスクをますます支援している。
このような過度な信頼性は、リスク識別やリスクアセスメントの失敗が重大事故を引き起こす高リスクな実験室環境では特に危険である。
実験室安全ベンチマーク (LabSafety Bench) を提案し, 潜在的な危険を識別し, リスクを評価し, 実験室環境における安全でない行動の結果を予測する。
論文 参考訳(メタデータ) (2024-10-18T05:21:05Z) - ProKnow: Process Knowledge for Safety Constrained and Explainable
Question Generation for Mental Health Diagnostic Assistance [11.716131800914445]
現在の仮想メンタルヘルスアシスタント(VMHA)はカウンセリングと推奨ケアを提供している。
彼らは、安全に制約された専門的な臨床プロセス知識の訓練が欠如しているため、患者の診断支援を控える。
我々はProknowを、エビデンスベースのガイドラインやドメインの専門家に対する概念的理解のカテゴリにマップする、順序付けられた情報の集合として定義する。
患者からの診断情報を対話的に収集する自然言語質問生成法(NLG)を開発した。
論文 参考訳(メタデータ) (2023-05-13T21:31:02Z) - Search-based Test-Case Generation by Monitoring Responsibility Safety
Rules [2.1270496914042996]
本研究では,シミュレーションに基づく運転テストデータのスクリーニングと分類を行う手法を提案する。
本フレームワークは,S-TALIROおよびSim-ATAVツールとともに配布されている。
論文 参考訳(メタデータ) (2020-04-25T10:10:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。