論文の概要: RoboNeuron: A Modular Framework Linking Foundation Models and ROS for Embodied AI
- arxiv url: http://arxiv.org/abs/2512.10394v1
- Date: Thu, 11 Dec 2025 07:58:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-12 16:15:42.264497
- Title: RoboNeuron: A Modular Framework Linking Foundation Models and ROS for Embodied AI
- Title(参考訳): RoboNeuron: ファンデーションモデルをリンクするモジュラーフレームワークと、エボダイドAIのためのROS
- Authors: Weifan Guan, Huasen Xi, Chenxiao Zhang, Aosheng Li, Qinghao Hu, Jian Cheng,
- Abstract要約: RoboNeuronは、インテリジェンスの普遍的なデプロイフレームワークである。
ロボット・オペレーティング・システム(ROS)のリアルタイム実行バックボーンに、LLM(Large Language Models)とVLA(Vision-Language-Action)モデルの認知能力を深く統合する最初のフレームワークである。
- 参考スコア(独自算出の注目度): 13.74517467087138
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Current embodied AI systems face severe engineering impediments, primarily characterized by poor cross-scenario adaptability, rigid inter-module coupling, and fragmented inference acceleration. To overcome these limitations, we propose RoboNeuron, a universal deployment framework for embodied intelligence. RoboNeuron is the first framework to deeply integrate the cognitive capabilities of Large Language Models (LLMs) and Vision-Language-Action (VLA) models with the real-time execution backbone of the Robot Operating System (ROS). We utilize the Model Context Protocol (MCP) as a semantic bridge, enabling the LLM to dynamically orchestrate underlying robotic tools. The framework establishes a highly modular architecture that strictly decouples sensing, reasoning, and control by leveraging ROS's unified communication interfaces. Crucially, we introduce an automated tool to translate ROS messages into callable MCP functions, significantly streamlining development. RoboNeuron significantly enhances cross-scenario adaptability and component flexibility, while establishing a systematic platform for horizontal performance benchmarking, laying a robust foundation for scalable real-world embodied applications.
- Abstract(参考訳): 現在の実施AIシステムは、主にクロスシナリオ適応性の貧弱、モジュール間結合の剛性、および断片化推論アクセラレーションを特徴とする、厳しいエンジニアリング障害に直面している。
これらの制限を克服するために,我々は,インテリジェンスを具体化する汎用的なデプロイメントフレームワークであるRoboNeuronを提案する。
RoboNeuronは、Large Language Models(LLM)とVision-Language-Action(VLA)モデルの認知能力を、ロボットオペレーティングシステム(ROS)のリアルタイム実行バックボーンと深く統合する最初のフレームワークである。
モデルコンテキストプロトコル(MCP)をセマンティックブリッジとして利用し、LLMが基盤となるロボットツールを動的にオーケストレーションできるようにする。
このフレームワークは、ROSの統一通信インタフェースを活用することによって、センシング、推論、制御を厳密に分離する高度にモジュール化されたアーキテクチャを確立する。
重要なことに、我々はROSメッセージを呼び出し可能なMPP関数に変換する自動化ツールを導入し、開発を大幅に効率化した。
RoboNeuronは、水平パフォーマンスベンチマークのための体系的なプラットフォームを確立しながら、クロスシナリオ適応性とコンポーネントの柔軟性を大幅に向上させ、スケーラブルな現実世界の具体化アプリケーションのための堅牢な基盤を構築している。
関連論文リスト
- ROS-related Robotic Systems Development with V-model-based Application of MeROS Metamodel [0.49259062564301753]
ロボット・オペレーティング・システム(ROS)上に構築されたシステムは、組み立てがますます簡単になるが、制御し、確実に調整することは困難である。
本稿では,モバイルと操作機能を組み合わせた小型ヘテロジニアスロボットシステム(HeROS)を実証車両として使用する。
本稿では,モデルベースシステム工学(MBSE)ワークフローの焦点にROSベースのシステムを配置するために開発されたSysMLメタモデルであるMeROSに基づく構造化手法を提案する。
論文 参考訳(メタデータ) (2025-06-10T11:44:00Z) - RoBridge: A Hierarchical Architecture Bridging Cognition and Execution for General Robotic Manipulation [90.81956345363355]
RoBridgeは、一般的なロボット操作のための階層的なインテリジェントアーキテクチャである。
大規模事前学習型視覚言語モデル(VLM)に基づくハイレベル認知プランナー(HCP)で構成されている。
強化学習の手続き的スキルを解き放ち、認知と実行のギャップを効果的に埋める。
論文 参考訳(メタデータ) (2025-05-03T06:17:18Z) - Phoenix: A Motion-based Self-Reflection Framework for Fine-grained Robotic Action Correction [10.38090975412416]
ロボットが障害から回復するためには、一般化可能な自己補正システムの構築が不可欠である。
我々は,高レベルな意味的反射と低レベルなロボット動作補正を接続するブリッジとして動作指示を利用するPhoenixフレームワークを構築した。
RoboMimicシミュレーションと実世界のシナリオの両方で実施された実験は、我々のフレームワークのより優れた一般化とロバスト性を証明する。
論文 参考訳(メタデータ) (2025-04-20T12:30:43Z) - CoinRobot: Generalized End-to-end Robotic Learning for Physical Intelligence [12.629888401901418]
当社のフレームワークはクロスプラットフォーム適応性をサポートし,産業用ロボット,協調アーム,タスク固有の変更を伴わない新しい実施形態をシームレスに展開する。
我々は,7つの操作タスクに関する広範囲な実験を通じて,我々のフレームワークを検証する。特に,我々のフレームワークで訓練された拡散モデルは,LeRobotフレームワークと比較して優れた性能と一般化性を示した。
論文 参考訳(メタデータ) (2025-03-07T10:50:58Z) - ROS-LLM: A ROS framework for embodied AI with task feedback and structured reasoning [74.58666091522198]
非専門家による直感的なロボットプログラミングのためのフレームワークを提案する。
ロボットオペレーティングシステム(ROS)からの自然言語のプロンプトと文脈情報を活用する
我々のシステムは,大規模言語モデル (LLM) を統合し,非専門家がチャットインタフェースを通じてシステムにタスク要求を記述できるようにする。
論文 参考訳(メタデータ) (2024-06-28T08:28:38Z) - Modular Customizable ROS-Based Framework for Rapid Development of Social
Robots [3.6622737533847936]
本稿では、このニーズに対処するオープンソースのフレームワークである、SROS(Socially-Interactive Robot Software Platform)について述べる。
特殊な知覚と対話のスキルは、任意のロボットに再利用可能な配置のためのROSサービスとして実装されている。
コンピュータビジョン, 音声処理, GPT2 自動補完音声をプラグアンドプレイ ROS サービスとして実装し, SROS のコア技術の有効性を実験的に検証した。
論文 参考訳(メタデータ) (2023-11-27T12:54:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。