論文の概要: Harness Engineering for Physical AI: Robot Middleware Is the Harness Layer
- arxiv url: http://arxiv.org/abs/2606.09416v1
- Date: Mon, 08 Jun 2026 12:29:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:06.986445
- Title: Harness Engineering for Physical AI: Robot Middleware Is the Harness Layer
- Title(参考訳): 物理AIのためのハーネスエンジニアリング:ロボットミドルウェアはハーネス層
- Authors: Sanghoon Lee, Jiyeong Chae, Kyung-Joon Park,
- Abstract要約: 物理AIハーネスは、制御、コンピューティング、通信を同時に仲介する必要がある。
プロジェクションは各出力を出力時にゲートし、分離はモデルの実行と送信スロットをバウンドし、Transferはチェックが失敗したときに検証されたベースラインにフォールバックする。
私たちはこれを、AIモデルの宣言された出力領域、推論予算、運用体制を含むデプロイメントアーティファクトであるROS 2 Profileとしてスケッチします。
- 参考スコア(独自算出の注目度): 14.262395972290564
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Robot middleware faces a new role in the era of Physical AI. Learned policies, planners, and vision-language-action (VLA) models now enter deployed robots as causal participants on the control path, but the layer that integrates them with timing, scheduling, and network has not been named. Recent language-agent work names this layer the harness, the external system that mediates tools, manages state, bounds resources, and records execution. The robotics community has not yet adopted this framing, and we propose that robot middleware is that harness. A Physical AI harness differs from a software harness in where it intervenes. A software harness mediates at tool-call boundaries. A Physical AI harness must mediate at control, computing, and communication simultaneously, because a learned policy's output crosses all three: its commands shift the trajectory, its inference time shifts the schedule, and its payload shifts the bandwidth. Robot middleware is the lowest robot-stack layer with mediating abstractions over all three, so it is best positioned to compose their enforcement. It already provides most of what a harness needs but lacks the enforcement for an AI model. We name this missing enforcement as three functions: Projection gates each output at emission, Isolation bounds the model's execution and transmission slot, and Transfer falls back to a verified baseline when checks fail. Each appears today as hand-built application code in deployed robot systems, built on surfaces robot middleware already provides. Robot middleware should host them not as the best single-axis enforcer but as the layer that composes all three. We sketch this as a ROS 2 Harness Profile, a deployment artifact that carries an AI model's declared output region, inference budget, and operating regime while the middleware enforces them across ROS 2, DDS, and Zenoh.
- Abstract(参考訳): ロボットミドルウェアは、物理AIの時代において新しい役割を担っている。
学習されたポリシー、プランナー、ビジョン言語アクション(VLA)モデルは、現在、制御パス上の因果的参加者としてデプロイされたロボットに入力されている。
ツールを仲介し、状態を管理し、リソースをバウンドし、実行を記録する外部システムである。
ロボットコミュニティはまだこの枠組みを採用していません。
物理AIハーネスは、介入するソフトウェアハーネスとは異なる。
ソフトウェアはツールコール境界を仲介する。
物理AIハーネスは、学習されたポリシーの出力が3つ全てを横切るため、制御、計算、通信を同時に仲介しなければならない。
ロボットミドルウェアは,3つすべてを抽象化した最小のロボットスタック層である。
ハーネスが必要とするものの大部分をすでに提供していますが、AIモデルの強制力に欠けています。
射影ゲートは各出力の出力をゲートし、分離はモデルの実行と送信スロットをバウンドし、Transferはチェックが失敗したときに検証されたベースラインにフォールバックする。
それぞれが、すでにロボットミドルウェアが提供している表面上に構築された、デプロイされたロボットシステムに手作りのアプリケーションコードとして今日登場した。
ロボットミドルウェアは、それらを最高の単軸執行者としてではなく、3つすべてを構成する層としてホストすべきである。
私たちはこれをROS 2 Harness Profileとしてスケッチします。これはAIモデルの宣言された出力領域、推論予算、オペレーティングシステムを含むデプロイメントアーティファクトで、ミドルウェアはROS 2 DDS、Zenohにまたがってそれらを強制します。
関連論文リスト
- RACAS: Controlling Diverse Robots With a Single Agentic System [26.695876900159373]
RACAS(Robot-Agnostic Control via Agentic Systems)は、3つのモジュールが自然言語でのみ通信してクローズドループロボット制御を実現する協調型エージェントアーキテクチャである。
RACASは、ロボットの自然言語記述、利用可能なアクションの定義、タスク仕様のみを必要とする。
我々は、車輪付き地上ロボット、最近発表された新しい多関節ロボットアーム、水中車両を用いて、複数のタスクにおけるRACASを評価した。RACASは、これらの過激な異なるプラットフォームをまたいだ全てのタスクを一貫して解決し、その可能性を実証している。
論文 参考訳(メタデータ) (2026-03-05T19:25:01Z) - GR00T N1: An Open Foundation Model for Generalist Humanoid Robots [133.23509142762356]
汎用ロボットには多目的体と知的な心が必要だ。
近年のヒューマノイドロボットの進歩は、汎用的な自律性を構築するためのハードウェアプラットフォームとして大きな可能性を秘めている。
我々はヒューマノイドロボットのオープン基盤モデルであるGR00T N1を紹介する。
論文 参考訳(メタデータ) (2025-03-18T21:06:21Z) - Jailbreaking LLM-Controlled Robots [82.04590367171932]
大規模言語モデル(LLM)は、文脈推論と直感的な人間とロボットの相互作用を可能にすることによって、ロボット工学の分野に革命をもたらした。
LLMは脱獄攻撃に弱いため、悪意のあるプロンプトはLLMの安全ガードレールをバイパスすることで有害なテキストを誘発する。
LLM制御ロボットをジェイルブレイクするアルゴリズムであるRoboPAIRを紹介する。
論文 参考訳(メタデータ) (2024-10-17T15:55:36Z) - CyberCortex.AI: An AI-based Operating System for Autonomous Robotics and Complex Automation [0.0]
我々は、異種AIベースのロボティクスと複雑な自動化アプリケーションを実現するために設計されたロボットOSであるCyberCortex AIを紹介する。
CyberCortex AIは、分散化された分散OSで、ロボットが互いに通信し、クラウドの高性能コンピュータと通信することを可能にする。
ロボットのセンサーと制御データは、その後ロボットにデプロイされるAIアルゴリズムのトレーニングを目的として、HPCシステムに向けてストリームされる。
論文 参考訳(メタデータ) (2024-09-02T13:14:50Z) - GRUtopia: Dream General Robots in a City at Scale [65.08318324604116]
本稿では,各種ロボットを対象とした対話型3D社会「GRUtopia」について紹介する。
GRScenesには100万のインタラクティブな微妙な注釈付きシーンが含まれており、都市規模の環境に自由に組み合わせることができる。
GRResidentsはLarge Language Model (LLM)によって駆動されるNon-Player Character (NPC)システムである。
論文 参考訳(メタデータ) (2024-07-15T17:40:46Z) - RoboScript: Code Generation for Free-Form Manipulation Tasks across Real
and Simulation [77.41969287400977]
本稿では,コード生成を利用したデプロイ可能なロボット操作パイプラインのためのプラットフォームである textbfRobotScript を提案する。
自由形自然言語におけるロボット操作タスクのためのコード生成ベンチマークも提案する。
我々は,Franka と UR5 のロボットアームを含む,複数のロボットエボディメントにまたがるコード生成フレームワークの適応性を実証した。
論文 参考訳(メタデータ) (2024-02-22T15:12:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。