論文の概要: Beyond touch-based HMI: Control your machines in natural language by utilizing large language models and OPC UA
- arxiv url: http://arxiv.org/abs/2510.11300v1
- Date: Mon, 13 Oct 2025 11:46:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 20:23:38.959081
- Title: Beyond touch-based HMI: Control your machines in natural language by utilizing large language models and OPC UA
- Title(参考訳): タッチベースのHMIを超えて:大規模言語モデルとOPC UAを利用して自然言語でマシンを制御する
- Authors: Bernd Hofmann, Sven Kreitlein, Joerg Franke, Patrick Bruendl,
- Abstract要約: 本稿では,人間と機械のより自然なインターフェースへのエージェントベースのアプローチを提案する。
現在、操作におけるインタラクションのための最先端メディアであるタッチインタラクションの代わりに、提案手法により、オペレータがマシンと通信したり、テキストを送信したりすることができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper proposes an agent-based approach toward a more natural interface between humans and machines. Large language models equipped with tools and the communication standard OPC UA are utilized to control machines in natural language. Instead of touch interaction, which is currently the state-of-the-art medium for interaction in operations, the proposed approach enables operators to talk or text with machines. This allows commands such as 'Please decrease the temperature by 20 % in machine 1 and set the motor speed to 5000 rpm in machine 2.' The large language model receives the user input and selects one of three predefined tools that connect to an OPC UA server and either change or read the value of a node. Afterwards, the result of the tool execution is passed back to the language model, which then provides a final response to the user. The approach is universally designed and can therefore be applied to any machine that supports the OPC UA standard. The large language model is neither fine-tuned nor requires training data, only the relevant machine credentials and a parameter dictionary are included within the system prompt. The approach is evaluated on a Siemens S7-1500 programmable logic controller with four machine parameters in a case study of fifty synthetically generated commands on five different models. The results demonstrate high success rate, with proprietary GPT 5 models achieving accuracies between 96.0 % and 98.0 %, and open-weight models reaching up to 90.0 %. The proposed approach of this empirical study contributes to advancing natural interaction in industrial human-machine interfaces.
- Abstract(参考訳): 本稿では,人間と機械のより自然なインターフェースへのエージェントベースのアプローチを提案する。
ツールと通信標準OPC UAを備えた大規模言語モデルは、自然言語の機械を制御するために使用される。
現在、操作におけるインタラクションの最先端メディアであるタッチインタラクションの代わりに、提案手法により、オペレータがマシンと通信したり、テキストを送信したりすることができる。
これにより、「機械1の温度を20%減らし、機械2の運動速度を5000rpmに設定する」といったコマンドが可能となる。
大きな言語モデルはユーザ入力を受け取り、OPC UAサーバに接続し、ノードの値の変更または読み取りを行う3つの事前定義されたツールのうちの1つを選択する。
その後、ツールの実行結果が言語モデルに渡され、ユーザに対して最終的なレスポンスが提供される。
このアプローチは普遍的に設計されており、OPC UA標準をサポートする任意のマシンに適用することができる。
大きな言語モデルは微調整も訓練データも必要とせず、関連するマシン認証情報とパラメータ辞書だけがシステムプロンプトに含まれる。
この手法は、S7-1500プログラム可能な4つのマシンパラメータを持つSiemens S7-1500プログラム論理コントローラを用いて、5つの異なるモデル上で50の合成生成されたコマンドをケーススタディとして評価する。
その結果、プロプライエタリなGPT 5モデルは96.0%から98.0%の精度を実現し、オープンウェイトモデルは90.0%に達するという高い成功率を示した。
この実証研究のアプローチは、産業用人-機械界面における自然な相互作用の促進に寄与する。
関連論文リスト
- Interpretable Robot Control via Structured Behavior Trees and Large Language Models [0.14990005092937678]
本稿では,自然言語理解とロボット実行を橋渡しする新しい枠組みを提案する。
提案手法は実世界のシナリオでは実用的であり、平均的な認識と実行の精度は約94%である。
論文 参考訳(メタデータ) (2025-08-13T08:53:13Z) - Generative Language Models Potential for Requirement Engineering Applications: Insights into Current Strengths and Limitations [5.001689778344014]
本稿では,ChatGPT と Gemini の多種多様な要求工学応用への応用の可能性について検討する。
両方の言語モデルのパフォーマンスを、既存のタスク固有の機械学習予測器と従来の言語モデルと比較する。
我々の実験によると、GeminiはChatGPTよりも精密な迅速なエンジニアリングを必要としている。
論文 参考訳(メタデータ) (2024-12-01T20:20:58Z) - Surfer: Progressive Reasoning with World Models for Robotic Manipulation [51.26109827779267]
本稿では,新しいシンプルなロボット操作フレームワークであるSurferを紹介する。
Surferは、ロボット操作を視覚シーンの状態伝達として扱い、それをアクションとシーンという2つの部分に分割する。
これは世界モデルに基づいており、ロボット操作を視覚シーンの状態伝達として扱い、アクションとシーンの2つの部分に分けられる。
論文 参考訳(メタデータ) (2023-06-20T07:06:04Z) - PanGu-{\Sigma}: Towards Trillion Parameter Language Model with Sparse
Heterogeneous Computing [64.53242758625922]
PanGu-SigmaはAscend 910 AIプロセッサとMindSporeフレームワークのクラスタでトレーニングされている。
さまざまな中国のNLPダウンストリームタスクのゼロショット学習において、最先端のパフォーマンスを提供する。
論文 参考訳(メタデータ) (2023-03-20T03:39:27Z) - A Conversational Paradigm for Program Synthesis [110.94409515865867]
本稿では,大規模言語モデルを用いた対話型プログラム合成手法を提案する。
私たちは、自然言語とプログラミング言語のデータに基づいて、CodeGenと呼ばれる大規模な言語モデルのファミリーを訓練します。
本研究は,会話能力の出現と,提案した会話プログラム合成パラダイムの有効性を示すものである。
論文 参考訳(メタデータ) (2022-03-25T06:55:15Z) - Reshaping Robot Trajectories Using Natural Language Commands: A Study of
Multi-Modal Data Alignment Using Transformers [33.7939079214046]
我々は、人間とロボットのコラボレーションのための柔軟な言語ベースのインタフェースを提供する。
我々は、ユーザコマンドをエンコードする大規模言語モデルの分野における最近の進歩を生かしている。
言語コマンドによって修正されたロボット軌跡を含むデータセット上で、模倣学習を用いてモデルを訓練する。
論文 参考訳(メタデータ) (2022-03-25T01:36:56Z) - GenNI: Human-AI Collaboration for Data-Backed Text Generation [102.08127062293111]
Table2Textシステムは、機械学習を利用した構造化データに基づいてテキスト出力を生成する。
GenNI (Generation Negotiation Interface) は、対話型ビジュアルシステムである。
論文 参考訳(メタデータ) (2021-10-19T18:07:07Z) - Accelerating Natural Language Understanding in Task-Oriented Dialog [6.757982879080109]
構造化プルーニングにより圧縮された単純な畳み込みモデルは,ATIS や Snips のBERT にほぼ匹敵する結果となり,100K 以下のパラメータが得られた。
また、CPU上でのアクセラレーション実験を行い、マルチタスクモデルでDistilBERTの約63倍の速度でインテントやスロットを予測する。
論文 参考訳(メタデータ) (2020-06-05T21:36:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。