論文の概要: EduSim-LLM: An Educational Platform Integrating Large Language Models and Robotic Simulation for Beginners
- arxiv url: http://arxiv.org/abs/2601.01196v1
- Date: Sat, 03 Jan 2026 14:40:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:40.617667
- Title: EduSim-LLM: An Educational Platform Integrating Large Language Models and Robotic Simulation for Beginners
- Title(参考訳): EduSim-LLM:大規模言語モデルとロボットシミュレーションを統合した教育用プラットフォーム
- Authors: Shenqi Lu, Liangwei Zhang,
- Abstract要約: 本稿では,大規模言語モデルとロボットシミュレーションを統合した教育プラットフォームであるEduSim-LLMを紹介する。
我々は、直接制御と自律制御という2つの人間ロボット相互作用モデルの設計、複数の言語モデルに基づく体系的なシミュレーション、マルチロボット協調、運動計画、操作能力の評価を行う。
- 参考スコア(独自算出の注目度): 0.22917707112773592
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recent years, the rapid development of Large Language Models (LLMs) has significantly enhanced natural language understanding and human-computer interaction, creating new opportunities in the field of robotics. However, the integration of natural language understanding into robotic control is an important challenge in the rapid development of human-robot interaction and intelligent automation industries. This challenge hinders intuitive human control over complex robotic systems, limiting their educational and practical accessibility. To address this, we present the EduSim-LLM, an educational platform that integrates LLMs with robot simulation and constructs a language-drive control model that translates natural language instructions into executable robot behavior sequences in CoppeliaSim. We design two human-robot interaction models: direct control and autonomous control, conduct systematic simulations based on multiple language models, and evaluate multi-robot collaboration, motion planning, and manipulation capabilities. Experiential results show that LLMs can reliably convert natural language into structured robot actions; after applying prompt-engineering templates instruction-parsing accuracy improves significantly; as task complexity increases, overall accuracy rate exceeds 88.9% in the highest complexity tests.
- Abstract(参考訳): 近年,Large Language Models (LLMs) の急速な発展により,自然言語理解と人間とコンピュータの相互作用が大幅に向上し,ロボット工学の分野で新たな機会が生まれている。
しかし、ロボット制御への自然言語理解の統合は、人間とロボットの相互作用とインテリジェントな自動化産業の急速な発展において重要な課題である。
この課題は、複雑なロボットシステムに対する直感的な人間の制御を妨げ、教育的かつ実用的なアクセシビリティを制限する。
そこで本研究では,LLMとロボットシミュレーションを統合した教育プラットフォームであるEduSim-LLMを紹介し,自然言語命令をCoppeliaSimで実行可能なロボット動作シーケンスに変換する言語駆動制御モデルを構築した。
我々は、直接制御と自律制御という2つの人間ロボット相互作用モデルの設計、複数の言語モデルに基づく体系的なシミュレーション、マルチロボット協調、運動計画、操作能力の評価を行う。
実験の結果、LLMは自然言語を構造化されたロボット動作に変換することができ、プロンプトエンジニアリングテンプレートを適用すると、命令パーシング精度が大幅に向上し、タスクの複雑さが増大するにつれて、全体的な精度が88.9%を超える。
関連論文リスト
- $π_0$: A Vision-Language-Action Flow Model for General Robot Control [77.32743739202543]
本稿では,インターネット規模のセマンティック知識を継承するために,事前学習された視覚言語モデル(VLM)上に構築された新しいフローマッチングアーキテクチャを提案する。
我々は,事前訓練後のタスクをゼロショットで実行し,人からの言語指導に追従し,微調整で新たなスキルを習得する能力の観点から,我々のモデルを評価した。
論文 参考訳(メタデータ) (2024-10-31T17:22:30Z) - Exploring Large Language Models to Facilitate Variable Autonomy for Human-Robot Teaming [4.779196219827508]
本稿では,VR(Unity Virtual Reality)設定に基づく,GPTを利用したマルチロボットテストベッド環境のための新しいフレームワークを提案する。
このシステムにより、ユーザーは自然言語でロボットエージェントと対話でき、それぞれが個々のGPTコアで動く。
12人の参加者によるユーザスタディでは、GPT-4の有効性と、さらに重要なのは、マルチロボット環境で自然言語で会話する機会を与えられる際のユーザ戦略について検討している。
論文 参考訳(メタデータ) (2023-12-12T12:26:48Z) - Incremental Learning of Humanoid Robot Behavior from Natural Interaction and Large Language Models [23.945922720555146]
本研究では,自然相互作用から複雑な行動の漸進的な学習を実現するシステムを提案する。
本システムは,ヒューマノイドロボットARMAR-6のロボット認知アーキテクチャに組み込まれている。
論文 参考訳(メタデータ) (2023-09-08T13:29:05Z) - WALL-E: Embodied Robotic WAiter Load Lifting with Large Language Model [92.90127398282209]
本稿では,最新のLarge Language Models(LLM)と既存のビジュアルグラウンドとロボットグルーピングシステムを統合する可能性について検討する。
本稿では,この統合の例としてWALL-E (Embodied Robotic WAiter load lifting with Large Language model)を紹介する。
我々は,このLCMを利用したシステムを物理ロボットに展開し,よりユーザフレンドリなインタフェースで指導誘導型把握タスクを実現する。
論文 参考訳(メタデータ) (2023-08-30T11:35:21Z) - Surfer: Progressive Reasoning with World Models for Robotic Manipulation [51.26109827779267]
本稿では,新しいシンプルなロボット操作フレームワークであるSurferを紹介する。
Surferは、ロボット操作を視覚シーンの状態伝達として扱い、それをアクションとシーンという2つの部分に分割する。
これは世界モデルに基づいており、ロボット操作を視覚シーンの状態伝達として扱い、アクションとシーンの2つの部分に分けられる。
論文 参考訳(メタデータ) (2023-06-20T07:06:04Z) - Reshaping Robot Trajectories Using Natural Language Commands: A Study of
Multi-Modal Data Alignment Using Transformers [33.7939079214046]
我々は、人間とロボットのコラボレーションのための柔軟な言語ベースのインタフェースを提供する。
我々は、ユーザコマンドをエンコードする大規模言語モデルの分野における最近の進歩を生かしている。
言語コマンドによって修正されたロボット軌跡を含むデータセット上で、模倣学習を用いてモデルを訓練する。
論文 参考訳(メタデータ) (2022-03-25T01:36:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。