論文の概要: CPS-LLM: Large Language Model based Safe Usage Plan Generator for Human-in-the-Loop Human-in-the-Plant Cyber-Physical System
- arxiv url: http://arxiv.org/abs/2405.11458v1
- Date: Sun, 19 May 2024 06:00:18 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-21 17:28:11.745501
- Title: CPS-LLM: Large Language Model based Safe Usage Plan Generator for Human-in-the-Loop Human-in-the-Plant Cyber-Physical System
- Title(参考訳): CPS-LLM:大規模言語モデルに基づくヒューマン・イン・ザ・ループ・ヒューマン・イン・ザ・プラット・サイバー物理システムのための安全な使用計画生成装置
- Authors: Ayan Banerjee, Aranyak Maity, Payal Kamboj, Sandeep K. S. Gupta,
- Abstract要約: 本研究は,大規模言語モデル (LLM) を用いたヒト・イン・ザ・ループ・ヒューマン・イン・ザ・プラントのサイバー物理システムについて検討する。
LLMのコンテキスト化は比較的容易で、ドメイン固有のプランを生成することができる。
CPS-LLMは、命令チューニングフレームワークを用いて再訓練されたLCMであり、生成した計画が物理系力学と整合することを保証する。
- 参考スコア(独自算出の注目度): 5.3052849646510225
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We explore the usage of large language models (LLM) in human-in-the-loop human-in-the-plant cyber-physical systems (CPS) to translate a high-level prompt into a personalized plan of actions, and subsequently convert that plan into a grounded inference of sequential decision-making automated by a real-world CPS controller to achieve a control goal. We show that it is relatively straightforward to contextualize an LLM so it can generate domain-specific plans. However, these plans may be infeasible for the physical system to execute or the plan may be unsafe for human users. To address this, we propose CPS-LLM, an LLM retrained using an instruction tuning framework, which ensures that generated plans not only align with the physical system dynamics of the CPS but are also safe for human users. The CPS-LLM consists of two innovative components: a) a liquid time constant neural network-based physical dynamics coefficient estimator that can derive coefficients of dynamical models with some unmeasured state variables; b) the model coefficients are then used to train an LLM with prompts embodied with traces from the dynamical system and the corresponding model coefficients. We show that when the CPS-LLM is integrated with a contextualized chatbot such as BARD it can generate feasible and safe plans to manage external events such as meals for automated insulin delivery systems used by Type 1 Diabetes subjects.
- Abstract(参考訳): 我々は、人間とループの人間によるサイバー物理システム(CPS)における大規模言語モデル(LLM)の利用について検討し、ハイレベルなプロンプトをパーソナライズされた行動計画に変換するとともに、その計画を現実世界のCPSコントローラによる逐次的意思決定の自動推論に変換し、制御目標を達成する。
LLMのコンテキスト化は比較的容易であり,ドメイン固有のプランを生成することができることを示す。
しかし、これらの計画は物理的なシステムが実行できない場合や、計画が人間のユーザーにとって安全でない場合もあります。
そこで本研究では,命令チューニングフレームワークを用いて再訓練したLCMであるCPS-LLMを提案する。
CPS-LLMは2つの革新的なコンポーネントから構成されている。
a) 測定されていない状態変数を有する力学モデルの係数を導出することができる液時定数ニューラルネットワークに基づく物理力学係数推定器
b) モデル係数を用いて、力学系及び対応するモデル係数からのトレースを具現化したプロンプトでLPMを訓練する。
CPS-LLMがBARDなどのコンテキスト対応チャットボットと統合された場合,Type 1糖尿病患者が使用するインスリン自動デリバリーシステムにおいて,食事などの外部イベントを管理するための,実用的で安全なプランを作成できることを示す。
関連論文リスト
- Dropout MPC: An Ensemble Neural MPC Approach for Systems with Learned Dynamics [0.0]
そこで本研究では,モンテカルロのドロップアウト手法を学習システムモデルに応用した,サンプリングベースアンサンブルニューラルMPCアルゴリズムを提案する。
この手法は一般に複雑な力学を持つ不確実なシステムを対象としており、第一原理から派生したモデルは推論が難しい。
論文 参考訳(メタデータ) (2024-06-04T17:15:25Z) - Parameter-Adaptive Approximate MPC: Tuning Neural-Network Controllers without Retraining [50.00291020618743]
この研究は、大規模なデータセットを再計算し、再トレーニングすることなくオンラインチューニングが可能な、新しいパラメータ適応型AMPCアーキテクチャを導入している。
資源制約の厳しいマイクロコントローラ(MCU)を用いた2種類の実カートポールシステムの揺らぎを制御し,パラメータ適応型AMPCの有効性を示す。
これらの貢献は、現実世界のシステムにおけるAMPCの実践的応用に向けた重要な一歩である。
論文 参考訳(メタデータ) (2024-04-08T20:02:19Z) - SPSysML: A meta-model for quantitative evaluation of Simulation-Physical
Systems [0.0]
最近のシミュレーション手法は、Digital Twin(DT)の概念の実現を可能にする。
システム開発の間、その部品は模擬モックアップから実際のハードウェアにデプロイされたソフトウェアを実行する物理部品へと進化した。
我々は,CPSのシミュレートされた部品と物理部品の統合を,様々な設定で最大化することを目的としている。
論文 参考訳(メタデータ) (2023-03-17T16:56:48Z) - Formal Controller Synthesis for Markov Jump Linear Systems with
Uncertain Dynamics [64.72260320446158]
マルコフジャンプ線形系に対する制御器の合成法を提案する。
本手法は,MJLSの離散(モードジャンピング)と連続(確率線形)の両方の挙動を捉える有限状態抽象化に基づいている。
本手法を複数の現実的なベンチマーク問題,特に温度制御と航空機の配送問題に適用する。
論文 参考訳(メタデータ) (2022-12-01T17:36:30Z) - Active Predicting Coding: Brain-Inspired Reinforcement Learning for
Sparse Reward Robotic Control Problems [79.07468367923619]
ニューラルジェネレーティブ・コーディング(NGC)の神経認知計算フレームワークによるロボット制御へのバックプロパゲーションフリーアプローチを提案する。
我々は、スパース報酬から動的オンライン学習を容易にする強力な予測符号化/処理回路から完全に構築されたエージェントを設計する。
提案するActPCエージェントは,スパース(外部)報酬信号に対して良好に動作し,複数の強力なバックプロップベースのRLアプローチと競合し,性能が優れていることを示す。
論文 参考訳(メタデータ) (2022-09-19T16:49:32Z) - Combining Machine Learning and Agent-Based Modeling to Study Biomedical
Systems [0.0]
エージェントベースモデリング(エージェントベースモデリング、ABM)は、構成体間の相互作用を通じて複雑なシステムをシミュレートするためのよく確立されたパラダイムである。
機械学習(ML)は、統計アルゴリズムがシステム行動の事前理論を課すことなく、自身のデータから'学習する'アプローチを指す。
論文 参考訳(メタデータ) (2022-06-02T15:19:09Z) - Modular Deep Reinforcement Learning for Continuous Motion Planning with
Temporal Logic [59.94347858883343]
本稿では,マルコフ決定過程(MDP)をモデルとした自律動的システムの運動計画について検討する。
LDGBA と MDP の間に組込み製品 MDP (EP-MDP) を設計することである。
モデルフリー強化学習(RL)のためのLDGBAベースの報酬形成と割引スキームは、EP-MDP状態にのみ依存する。
論文 参考訳(メタデータ) (2021-02-24T01:11:25Z) - Controlling nonlinear dynamical systems into arbitrary states using
machine learning [77.34726150561087]
機械学習(ML)を活用した,新しい完全データ駆動制御方式を提案する。
最近開発されたMLに基づく複雑なシステムの予測機能により、非線形系は任意の初期状態から来る任意の動的対象状態に留まることが証明された。
必要なデータ量が少なく,柔軟性の高いコントロールスキームを備えることで,工学から医学まで幅広い応用の可能性について簡単に議論する。
論文 参考訳(メタデータ) (2021-02-23T16:58:26Z) - Automated Adversary Emulation for Cyber-Physical Systems via
Reinforcement Learning [4.763175424744536]
我々は,サイバー物理システムに対する敵エミュレーションに対するドメイン認識の自動化手法を開発した。
我々は、マルコフ決定プロセス(MDP)モデルを定式化し、ハイブリッドアタックグラフ上で最適なアタックシーケンスを決定する。
モデルベースおよびモデルフリー強化学習(RL)法を用いて,離散連続型MDPをトラクタブルな方法で解く。
論文 参考訳(メタデータ) (2020-11-09T18:44:29Z) - Modular Transfer Learning with Transition Mismatch Compensation for
Excessive Disturbance Rejection [29.01654847752415]
本研究では,水中ロボットの過剰な外乱拒絶に対する制御ポリシーに適応する移動学習フレームワークを提案する。
共通制御ポリシ(GCP)とオンライン外乱識別モデル(ODI)からなる学習ポリシーのモジュラーネットワークを適用した。
論文 参考訳(メタデータ) (2020-07-29T07:44:38Z) - Model-based Reinforcement Learning for Decentralized Multiagent
Rendezvous [66.6895109554163]
目標を他のエージェントと整合させる人間の能力の下にあるのは、他人の意図を予測し、自分たちの計画を積極的に更新する能力である。
分散型マルチエージェントレンデブーのためのモデルに基づく強化学習手法である階層型予測計画(HPP)を提案する。
論文 参考訳(メタデータ) (2020-03-15T19:49:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。