論文の概要: Bridging Industrial Expertise and XR with LLM-Powered Conversational Agents
- arxiv url: http://arxiv.org/abs/2504.05527v1
- Date: Mon, 07 Apr 2025 22:02:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-17 03:28:15.45928
- Title: Bridging Industrial Expertise and XR with LLM-Powered Conversational Agents
- Title(参考訳): LLM型対話エージェントによる産業エキスパートのブリッジ化とXR
- Authors: Despina Tomkou, George Fatouros, Andreas Andreou, Georgios Makridis, Fotis Liarokapis, Dimitrios Dardanis, Athanasios Kiourtis, John Soldatos, Dimosthenis Kyriazis,
- Abstract要約: 本稿では,大規模言語モデル(LLM)と拡張現実感(XR)との新たな統合を提案する。
提案システムは、自然言語インタフェースを通じて、ドメイン固有の産業知識をXR環境に組み込み、労働者のためのハンズフリーでコンテキスト対応のエキスパートガイダンスを可能にする。
- 参考スコア(独自算出の注目度): 2.526333884960815
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper introduces a novel integration of Retrieval-Augmented Generation (RAG) enhanced Large Language Models (LLMs) with Extended Reality (XR) technologies to address knowledge transfer challenges in industrial environments. The proposed system embeds domain-specific industrial knowledge into XR environments through a natural language interface, enabling hands-free, context-aware expert guidance for workers. We present the architecture of the proposed system consisting of an LLM Chat Engine with dynamic tool orchestration and an XR application featuring voice-driven interaction. Performance evaluation of various chunking strategies, embedding models, and vector databases reveals that semantic chunking, balanced embedding models, and efficient vector stores deliver optimal performance for industrial knowledge retrieval. The system's potential is demonstrated through early implementation in multiple industrial use cases, including robotic assembly, smart infrastructure maintenance, and aerospace component servicing. Results indicate potential for enhancing training efficiency, remote assistance capabilities, and operational guidance in alignment with Industry 5.0's human-centric and resilient approach to industrial development.
- Abstract(参考訳): 本稿では,大規模言語モデル(LLM)と拡張現実感(XR)技術を統合し,産業環境における知識伝達問題に対処する。
提案システムは、自然言語インタフェースを通じて、ドメイン固有の産業知識をXR環境に組み込み、労働者のためのハンズフリーでコンテキスト対応のエキスパートガイダンスを可能にする。
本稿では,動的ツールオーケストレーションを備えたLLM Chat Engineと,音声によるインタラクションを特徴とするXRアプリケーションからなるシステムアーキテクチャを提案する。
様々なチャンキング戦略,埋め込みモデル,ベクトルデータベースの性能評価は,セマンティックチャンキング,バランスの取れた埋め込みモデル,効率的なベクトルストアが産業知識検索に最適な性能を提供することを示す。
このシステムのポテンシャルは、ロボット組立、スマートインフラストラクチャのメンテナンス、航空宇宙コンポーネントのサービスなど、複数の産業ユースケースで初期の実装によって実証されている。
その結果,産業開発への人間中心的かつレジリエンスなアプローチに則って,訓練効率の向上,遠隔支援能力の向上,運用指導の実施の可能性が示唆された。
関連論文リスト
- An LLM-enabled Multi-Agent Autonomous Mechatronics Design Framework [49.633199780510864]
本研究は, 機械設計, 最適化, エレクトロニクス, ソフトウェア工学の専門知識を統合した多エージェント自律メカトロニクス設計フレームワークを提案する。
このフレームワークは、言語駆動のワークフローを通じて運用され、構造化された人間のフィードバックを組み込んで、現実世界の制約下での堅牢なパフォーマンスを保証する。
完全に機能する自律型容器は、最適化された推進、コスト効率の高い電子機器、高度な制御を備えていた。
論文 参考訳(メタデータ) (2025-04-20T16:57:45Z) - Rethinking industrial artificial intelligence: a unified foundation framework [0.32885740436059047]
産業人工知能(AI)の最近の進歩は、よりスマートな製造、予測保守、インテリジェントな意思決定を推進し、産業を変革している。
既存のアプローチは、ドメイン知識、データ、モデルを体系的に統合することの重要性を見越しながら、主にアルゴリズムとモデルに焦点を当てることが多い。
本稿では,従来の研究をレビューし,産業AIの役割を再考し,統一産業AI基盤フレームワークを提案する。
論文 参考訳(メタデータ) (2025-04-02T15:05:32Z) - Exploring the Roles of Large Language Models in Reshaping Transportation Systems: A Survey, Framework, and Roadmap [51.198001060683296]
大型言語モデル(LLM)は、輸送上の課題に対処するための変革的な可能性を提供する。
LLM4TRは,交通におけるLSMの役割を体系的に分類する概念的枠組みである。
それぞれの役割について,交通予測や自律運転,安全分析,都市移動最適化など,さまざまな応用について検討した。
論文 参考訳(メタデータ) (2025-03-27T11:56:27Z) - Towards Agentic Recommender Systems in the Era of Multimodal Large Language Models [75.4890331763196]
大規模言語モデル(LLM)の最近のブレークスルーは、エージェントAIシステムの出現につながっている。
LLMベースのAgentic RS(LLM-ARS)は、よりインタラクティブで、コンテキストを認識し、プロアクティブなレコメンデーションを提供する。
論文 参考訳(メタデータ) (2025-03-20T22:37:15Z) - Large Language Model as a Catalyst: A Paradigm Shift in Base Station Siting Optimization [62.16747639440893]
大規模言語モデル(LLM)とその関連技術は、特に迅速な工学とエージェント工学の領域において進歩している。
提案するフレームワークは、検索拡張生成(RAG)を組み込んで、ドメイン固有の知識を取得してソリューションを生成するシステムの能力を高める。
論文 参考訳(メタデータ) (2024-08-07T08:43:32Z) - AI-Powered Immersive Assistance for Interactive Task Execution in Industrial Environments [0.11545092788508222]
我々は,産業環境における複雑なタスクの実行を支援するAIを活用した没入型支援システムを実演する。
我々のシステムは、ジュースミキサーのセットアップに似たVR環境を活用している。
このデモでは、私たちのAIアシスタントが、認知負荷を減らし、生産性を高め、産業環境の安全性を高める可能性を示しています。
論文 参考訳(メタデータ) (2024-07-12T10:30:45Z) - Inference Optimization of Foundation Models on AI Accelerators [68.24450520773688]
トランスフォーマーアーキテクチャを備えた大規模言語モデル(LLM)を含む強力な基礎モデルは、ジェネレーティブAIの新たな時代を支えている。
モデルパラメータの数が数十億に達すると、実際のシナリオにおける推論コストと高いレイテンシーが排除される。
このチュートリアルでは、AIアクセラレータを用いた補完推論最適化テクニックに関する包括的な議論を行っている。
論文 参考訳(メタデータ) (2024-07-12T09:24:34Z) - Autonomous Workflow for Multimodal Fine-Grained Training Assistants Towards Mixed Reality [28.27036270001756]
この作業は、AIエージェントを詳細にトレーニングするための拡張現実(XR)アプリケーションにシームレスに統合するための自律ワークフローを設計する。
パイロットXR環境におけるLEGOブロック組立のためのマルチモーダルきめ細粒度トレーニングアシスタントのデモンストレーションを行う。
論文 参考訳(メタデータ) (2024-05-16T14:20:30Z) - LEARN: Knowledge Adaptation from Large Language Model to Recommendation for Practical Industrial Application [54.984348122105516]
Llm-driven knowlEdge Adaptive RecommeNdation (LEARN)フレームワークは、オープンワールドの知識と協調的な知識をシナジする。
オープンワールドの知識と協調的な知識を相乗化するLlm-driven knowlEdge Adaptive RecommeNdation (LEARN) フレームワークを提案する。
論文 参考訳(メタデータ) (2024-05-07T04:00:30Z) - The Survey on Multi-Source Data Fusion in Cyber-Physical-Social Systems:Foundational Infrastructure for Industrial Metaverses and Industries 5.0 [31.600740278783242]
産業5.0の概念は発展し、産業メタバースは実際の産業プロセスと並行して運用されることが期待されている。
ソーシャルメディアデータに隠されたカスタマイズされたユーザニーズは、ソーシャルメディア技術によって見つけることができる。
本研究では,産業メタバースのためのマルチソースデータ融合駆動型運用アーキテクチャを提案する。
論文 参考訳(メタデータ) (2024-04-11T05:09:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。