論文の概要: Bridging Industrial Expertise and XR with LLM-Powered Conversational Agents
- arxiv url: http://arxiv.org/abs/2504.05527v1
- Date: Mon, 07 Apr 2025 22:02:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-09 13:31:39.921664
- Title: Bridging Industrial Expertise and XR with LLM-Powered Conversational Agents
- Title(参考訳): LLM型対話エージェントによる産業エキスパートのブリッジ化とXR
- Authors: Despina Tomkou, George Fatouros, Andreas Andreou, Georgios Makridis, Fotis Liarokapis, Dimitrios Dardanis, Athanasios Kiourtis, John Soldatos, Dimosthenis Kyriazis,
- Abstract要約: 本稿では,大規模言語モデル(LLM)と拡張現実感(XR)との新たな統合を提案する。
提案システムは、自然言語インタフェースを通じて、ドメイン固有の産業知識をXR環境に組み込み、労働者のためのハンズフリーでコンテキスト対応のエキスパートガイダンスを可能にする。
- 参考スコア(独自算出の注目度): 2.526333884960815
- License:
- Abstract: This paper introduces a novel integration of Retrieval-Augmented Generation (RAG) enhanced Large Language Models (LLMs) with Extended Reality (XR) technologies to address knowledge transfer challenges in industrial environments. The proposed system embeds domain-specific industrial knowledge into XR environments through a natural language interface, enabling hands-free, context-aware expert guidance for workers. We present the architecture of the proposed system consisting of an LLM Chat Engine with dynamic tool orchestration and an XR application featuring voice-driven interaction. Performance evaluation of various chunking strategies, embedding models, and vector databases reveals that semantic chunking, balanced embedding models, and efficient vector stores deliver optimal performance for industrial knowledge retrieval. The system's potential is demonstrated through early implementation in multiple industrial use cases, including robotic assembly, smart infrastructure maintenance, and aerospace component servicing. Results indicate potential for enhancing training efficiency, remote assistance capabilities, and operational guidance in alignment with Industry 5.0's human-centric and resilient approach to industrial development.
- Abstract(参考訳): 本稿では,大規模言語モデル(LLM)と拡張現実感(XR)技術を統合し,産業環境における知識伝達問題に対処する。
提案システムは、自然言語インタフェースを通じて、ドメイン固有の産業知識をXR環境に組み込み、労働者のためのハンズフリーでコンテキスト対応のエキスパートガイダンスを可能にする。
本稿では,動的ツールオーケストレーションを備えたLLM Chat Engineと,音声によるインタラクションを特徴とするXRアプリケーションからなるシステムアーキテクチャを提案する。
様々なチャンキング戦略,埋め込みモデル,ベクトルデータベースの性能評価は,セマンティックチャンキング,バランスの取れた埋め込みモデル,効率的なベクトルストアが産業知識検索に最適な性能を提供することを示す。
このシステムのポテンシャルは、ロボット組立、スマートインフラストラクチャのメンテナンス、航空宇宙コンポーネントのサービスなど、複数の産業ユースケースで初期の実装によって実証されている。
その結果,産業開発への人間中心的かつレジリエンスなアプローチに則って,訓練効率の向上,遠隔支援能力の向上,運用指導の実施の可能性が示唆された。
関連論文リスト
- A Layered Architecture for Developing and Enhancing Capabilities in Large Language Model-based Software Systems [18.615283725693494]
本稿では,Large Language Models (LLM) ソフトウェアシステムの開発を異なるレイヤにまとめる階層アーキテクチャを提案する。
これらのレイヤと機能を整合させることで、このフレームワークは、効果的かつ効率的な方法で機能の体系的な実装を奨励します。
論文 参考訳(メタデータ) (2024-11-19T09:18:20Z) - Large Language Model as a Catalyst: A Paradigm Shift in Base Station Siting Optimization [62.16747639440893]
大規模言語モデル(LLM)とその関連技術は、特に迅速な工学とエージェント工学の領域において進歩している。
提案するフレームワークは、検索拡張生成(RAG)を組み込んで、ドメイン固有の知識を取得してソリューションを生成するシステムの能力を高める。
論文 参考訳(メタデータ) (2024-08-07T08:43:32Z) - AI-Powered Immersive Assistance for Interactive Task Execution in Industrial Environments [0.11545092788508222]
我々は,産業環境における複雑なタスクの実行を支援するAIを活用した没入型支援システムを実演する。
我々のシステムは、ジュースミキサーのセットアップに似たVR環境を活用している。
このデモでは、私たちのAIアシスタントが、認知負荷を減らし、生産性を高め、産業環境の安全性を高める可能性を示しています。
論文 参考訳(メタデータ) (2024-07-12T10:30:45Z) - Inference Optimization of Foundation Models on AI Accelerators [68.24450520773688]
トランスフォーマーアーキテクチャを備えた大規模言語モデル(LLM)を含む強力な基礎モデルは、ジェネレーティブAIの新たな時代を支えている。
モデルパラメータの数が数十億に達すると、実際のシナリオにおける推論コストと高いレイテンシーが排除される。
このチュートリアルでは、AIアクセラレータを用いた補完推論最適化テクニックに関する包括的な議論を行っている。
論文 参考訳(メタデータ) (2024-07-12T09:24:34Z) - ROS-LLM: A ROS framework for embodied AI with task feedback and structured reasoning [74.58666091522198]
非専門家による直感的なロボットプログラミングのためのフレームワークを提案する。
ロボットオペレーティングシステム(ROS)からの自然言語のプロンプトと文脈情報を活用する
我々のシステムは,大規模言語モデル (LLM) を統合し,非専門家がチャットインタフェースを通じてシステムにタスク要求を記述できるようにする。
論文 参考訳(メタデータ) (2024-06-28T08:28:38Z) - Autonomous Workflow for Multimodal Fine-Grained Training Assistants Towards Mixed Reality [28.27036270001756]
この作業は、AIエージェントを詳細にトレーニングするための拡張現実(XR)アプリケーションにシームレスに統合するための自律ワークフローを設計する。
パイロットXR環境におけるLEGOブロック組立のためのマルチモーダルきめ細粒度トレーニングアシスタントのデモンストレーションを行う。
論文 参考訳(メタデータ) (2024-05-16T14:20:30Z) - LEARN: Knowledge Adaptation from Large Language Model to Recommendation for Practical Industrial Application [54.984348122105516]
Llm-driven knowlEdge Adaptive RecommeNdation (LEARN)フレームワークは、オープンワールドの知識と協調的な知識をシナジする。
オープンワールドの知識と協調的な知識を相乗化するLlm-driven knowlEdge Adaptive RecommeNdation (LEARN) フレームワークを提案する。
論文 参考訳(メタデータ) (2024-05-07T04:00:30Z) - The Survey on Multi-Source Data Fusion in Cyber-Physical-Social Systems:Foundational Infrastructure for Industrial Metaverses and Industries 5.0 [31.600740278783242]
産業5.0の概念は発展し、産業メタバースは実際の産業プロセスと並行して運用されることが期待されている。
ソーシャルメディアデータに隠されたカスタマイズされたユーザニーズは、ソーシャルメディア技術によって見つけることができる。
本研究では,産業メタバースのためのマルチソースデータ融合駆動型運用アーキテクチャを提案する。
論文 参考訳(メタデータ) (2024-04-11T05:09:32Z) - Agent AI: Surveying the Horizons of Multimodal Interaction [83.18367129924997]
エージェントAI(Agent AI)とは、視覚刺激や言語入力、その他の環境データを知覚できる対話型システムである。
我々は,バーチャルリアリティやシミュレートされたシーンを容易に作成し,仮想環境内に具体化されたエージェントと対話できる未来を構想する。
論文 参考訳(メタデータ) (2024-01-07T19:11:18Z) - Technology Readiness Levels for Machine Learning Systems [107.56979560568232]
機械学習システムの開発とデプロイは、現代のツールで簡単に実行できますが、プロセスは一般的に急ぎ、エンドツーエンドです。
私たちは、機械学習の開発と展開のための実証済みのシステムエンジニアリングアプローチを開発しました。
当社の「機械学習技術準備レベル」フレームワークは、堅牢で信頼性が高く、責任あるシステムを確保するための原則的なプロセスを定義します。
論文 参考訳(メタデータ) (2021-01-11T15:54:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。