論文の概要: vAccSOL: Efficient and Transparent AI Vision Offloading for Mobile Robots
- arxiv url: http://arxiv.org/abs/2603.16685v1
- Date: Tue, 17 Mar 2026 15:44:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-18 17:42:07.383219
- Title: vAccSOL: Efficient and Transparent AI Vision Offloading for Mobile Robots
- Title(参考訳): vAccSOL: 移動ロボットのための効率的で透明なAIビジョンのオフロード
- Authors: Adam Zahir, Michele Gucciardom Falk Selker, Anastasios Nanos, Kostis Papazafeiropoulos, Carlos J. Bernardos, Nicolas Weber, Roberto Gonzalez,
- Abstract要約: ロボットとエッジプラットフォームをまたいだAIベースのビジョンワークロードの効率的かつ透過的な実行のためのフレームワークであるvAccSOLを提案する。
商用四足歩行ロボットと12種類のディープラーニングモデルを用いた実世界のテストベッド上でのvAccSOLの評価を行った。
エッジオフロードにより、vAccSOLはロボット側の消費電力を最大80%削減し、エッジ側の電力を最大60%削減すると同時に、ビジョンパイプラインのフレームレートを最大24倍に向上させる。
- 参考スコア(独自算出の注目度): 1.784741753796716
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Mobile robots are increasingly deployed for inspection, patrol, and search-and-rescue operations, relying on computer vision for perception, navigation, and autonomous decision-making. However, executing modern vision workloads onboard is challenging due to limited compute resources and strict energy constraints. While some platforms include embedded accelerators, these are typically tied to proprietary software stacks, leaving user-defined workloads to run on resource-constrained companion computers. We present vAccSOL, a framework for efficient and transparent execution of AI-based vision workloads across heterogeneous robotic and edge platforms. vAccSOL integrates two components: SOL, a neural network compiler that generates optimized inference libraries with minimal runtime dependencies, and vAccel, a lightweight execution framework that transparently dispatches inference locally on the robot or to nearby edge infrastructure. This combination enables hardware-optimized inference and flexible execution placement without requiring modifications to robot applications. We evaluate vAccSOL on a real-world testbed with a commercial quadruped robot and twelve deep learning models covering image classification, video classification, and semantic segmentation. Compared to a PyTorch compiler baseline, SOL achieves comparable or better inference performance. With edge offloading, vAccSOL reduces robot-side power consumption by up to 80% and edge-side power by up to 60% compared to PyTorch, while increasing vision pipeline frame rate by up to 24x, extending the operating lifetime of battery-powered robots.
- Abstract(参考訳): モバイルロボットは、視界、ナビゲーション、自律的な意思決定にコンピュータビジョンを頼りに、検査、パトロール、捜索および救助活動のためにますます配備されている。
しかし、コンピュータリソースの制限と厳格なエネルギー制約のため、モダンなビジョンワークロードのオンボードの実行は困難である。
組み込みアクセラレータを含むプラットフォームもあるが、それらは一般的にプロプライエタリなソフトウェアスタックに結びついており、リソースに制約のあるコンパニオンコンピュータ上で実行されるようにユーザ定義のワークロードを残している。
我々は、異種ロボットとエッジプラットフォームにまたがるAIベースのビジョンワークロードを効率的かつ透過的に実行するためのフレームワークであるvAccSOLを提案する。
vAccSOLは、最小ランタイム依存で最適化された推論ライブラリを生成するニューラルネットワークコンパイラであるSOLと、ロボットまたは近くのエッジインフラストラクチャ上で推論を透過的にディスパッチする軽量実行フレームワークであるvAccelの2つのコンポーネントを統合している。
この組み合わせにより、ロボットアプリケーションを変更することなく、ハードウェア最適化推論と柔軟な実行配置が可能になる。
商用四足ロボットと12種類のディープラーニングモデルを用いた実世界のテストベッド上でのvAccSOLの評価を行い,画像分類,ビデオ分類,セマンティックセグメンテーションについて検討した。
PyTorchコンパイラのベースラインと比較して、SOLは同等またはより良い推論性能を達成する。
エッジオフロードにより、vAccSOLはPyTorchと比較して、ロボット側の消費電力を最大80%削減し、エッジ側の電力を最大60%削減する。
関連論文リスト
- LEVIO: Lightweight Embedded Visual Inertial Odometry for Resource-Constrained Devices [18.91672527573445]
この研究は、超低消費電力計算プラットフォーム向けに最適化された完全なVIOパイプラインであるLEVIOを提示する。
LEVIOにはOriented FASTやRotated BRIEF (ORB)といった既存のVIOコンポーネントが組み込まれている。
本稿では,アルゴリズム設計の選択とハードウェア-ソフトウェア協調最適化手法を提案し,資源制約のあるハードウェア上でのリアルタイム性能を示す。
論文 参考訳(メタデータ) (2026-02-03T09:20:57Z) - OS-Symphony: A Holistic Framework for Robust and Generalist Computer-Using Agent [58.07447442040785]
私たちはOS-Symphonyを紹介します。これは、堅牢な自動化のための2つの重要なイノベーションをコーディネートするOrchestratorを含む包括的なフレームワークです。
結果は、OS-Symphonyが様々なモデルスケールで大幅なパフォーマンス向上をもたらすことを示した。
論文 参考訳(メタデータ) (2026-01-12T17:55:51Z) - Lite VLA: Efficient Vision-Language-Action Control on CPU-Bound Edge Robots [0.6119773373677944]
本研究は,移動ロボットに小型視覚言語モデル(VLM)を配置し,厳密な計算制約の下でリアルタイムのシーン理解と推論を実現することの実現可能性を示す。
移動性から知覚を分離する従来のアプローチとは異なり、提案フレームワークはオンボードハードウェアのみを使用して動的環境の同時移動と推論を可能にする。
論文 参考訳(メタデータ) (2025-11-07T17:49:14Z) - Ark: An Open-source Python-based Framework for Robot Learning [20.131425969692256]
ARKは、そのギャップを埋めるために設計された、オープンソースのPythonファーストのロボティクスフレームワークである。
ARKは、ユーザがデータを収集し、前処理し、ポリシーをトレーニングできる、Gymスタイルの環境インターフェースを提供する。
ARKには、コントロール、SLAM、モーションプランニング、システム識別、可視化のための再利用可能なモジュールが付属している。
論文 参考訳(メタデータ) (2025-06-24T20:23:39Z) - SparseGrasp: Robotic Grasping via 3D Semantic Gaussian Splatting from Sparse Multi-View RGB Images [125.66499135980344]
オープンボキャブラリ型ロボットグリップシステムであるSparseGraspを提案する。
SparseGraspはスパースビューのRGBイメージで効率的に動作し、シーン更新を高速に処理する。
SparseGraspは, 高速化と適応性の両方の観点から, 最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-12-03T03:56:01Z) - DeeR-VLA: Dynamic Inference of Multimodal Large Language Models for Efficient Robot Execution [114.61347672265076]
実世界のロボットのためのMLLMの開発は、ロボットプラットフォームで利用可能な計算能力とメモリ容量が典型的に限られているため、難しい。
活性化MLLMのサイズを自動的に調整するロボットビジョンランゲージ・アクション・モデル(DeeR)の動的早期実行フレームワークを提案する。
DeeR は LLM の計算コストを 5.2-6.5x に削減し、GPU のメモリを 2-6x に削減した。
論文 参考訳(メタデータ) (2024-11-04T18:26:08Z) - Accelerating AI and Computer Vision for Satellite Pose Estimation on the Intel Myriad X Embedded SoC [3.829322478948514]
本稿では,インテルのMovidius Myriad Xを用いたハイブリッドAI/CVシステムを構築し,衛星の宇宙ミッションにおける姿勢を初期化・追跡する。
提案したシングルチップ,ロバスト推定,リアルタイムソリューションは,2Wの限られたパワーエンベロープ内で,1メガピクセルのRGB画像に対して最大5FPSのスループットを提供する。
論文 参考訳(メタデータ) (2024-09-19T17:50:50Z) - RoboScript: Code Generation for Free-Form Manipulation Tasks across Real
and Simulation [77.41969287400977]
本稿では,コード生成を利用したデプロイ可能なロボット操作パイプラインのためのプラットフォームである textbfRobotScript を提案する。
自由形自然言語におけるロボット操作タスクのためのコード生成ベンチマークも提案する。
我々は,Franka と UR5 のロボットアームを含む,複数のロボットエボディメントにまたがるコード生成フレームワークの適応性を実証した。
論文 参考訳(メタデータ) (2024-02-22T15:12:00Z) - Fast GraspNeXt: A Fast Self-Attention Neural Network Architecture for
Multi-task Learning in Computer Vision Tasks for Robotic Grasping on the Edge [80.88063189896718]
アーキテクチャと計算の複雑さが高いと、組み込みデバイスへのデプロイに適さない。
Fast GraspNeXtは、ロボットグルーピングのためのコンピュータビジョンタスクに埋め込まれたマルチタスク学習に適した、高速な自己認識型ニューラルネットワークアーキテクチャである。
論文 参考訳(メタデータ) (2023-04-21T18:07:14Z) - Deep Learning for Real Time Satellite Pose Estimation on Low Power Edge
TPU [58.720142291102135]
本稿では,ニューラルネットワークアーキテクチャを利用したポーズ推定ソフトウェアを提案する。
我々は、低消費電力の機械学習アクセラレーターが宇宙での人工知能の活用を可能にしていることを示す。
論文 参考訳(メタデータ) (2022-04-07T08:53:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。