Fugu-MT 論文翻訳(概要): Threading Optimization for Vision-Language-Action Model Inference in Low-Cost Smart Agricultural Manipulation

論文の概要: Threading Optimization for Vision-Language-Action Model Inference in Low-Cost Smart Agricultural Manipulation

arxiv url: http://arxiv.org/abs/2606.00966v1
Date: Sun, 31 May 2026 02:49:50 GMT
ステータス: 翻訳完了
システム内更新日: 2026-06-09 14:52:55.099314
Title: Threading Optimization for Vision-Language-Action Model Inference in Low-Cost Smart Agricultural Manipulation
Title（参考訳）: 低コストスマート農業マニピュレーションにおけるビジョンランゲージ・アクションモデル推論のためのスレッド最適化
Authors: Keith Truongcao, Christopher Nhu, Zijian An, Phong Nguyen, Siwei Cai, Lifeng Zhou,
Abstract要約: これらのボトルネックに対処するためにRTAC(Real-Time Action Chunking)が提案されている。本稿では,低コストなロボット操作システムに適したRTACのシステムレベル実装について述べる。
参考スコア（独自算出の注目度）: 9.383033161646255
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Vision-Language Action (VLA) models continue to face challenges such as slow inference speed and difficulty performing fine-grained motion adjustments, limiting their widespread adoption in industry. While the Real-Time Action Chunking (RTAC) algorithm has been proposed to address these bottlenecks, bridging the gap between the algorithm provided in pseudocode to a stable, real-world deployment on a low-cost robotic arm remains a challenge. In this work, we present a complete system-level implementation of RTAC tailored for a low-cost robotic manipulation system. We advance beyond the original high-level pseudocode by optimizing the threading implementation for the policy inference and control pipeline, reducing end-to-end latency and improving responsiveness without modifying the underlying policy. We evaluate this system on tasks involving the manipulation of agricultural produce, specifically garlic bulbs and walnuts. Experimental results demonstrate that our custom threading implementation significantly improves control stability and speed compared to the base implementation of RTAC.
Abstract（参考訳）: VLA(Vision-Language Action)モデルは、推論速度の遅さや微粒な運動調整の難しさといった課題に直面し、業界における普及を制限している。リアルタイムアクションチャンキング(RTAC)アルゴリズムはこれらのボトルネックに対処するために提案されているが、擬似コードで提供されるアルゴリズムと、低コストのロボットアームへの安定的で現実的なデプロイの間のギャップを埋めることは依然として課題である。本研究では,低コストなロボット操作システムに適したRTACのシステムレベル実装を提案する。我々は、ポリシー推論と制御パイプラインのスレッド実装を最適化し、エンドツーエンドのレイテンシを減らし、基礎となるポリシーを変更することなく応答性を改善することで、元のハイレベルな擬似コードを超えて前進する。本システムは,農作物,特にニンニク球根とクルミの操作に関わる作業において評価される。実験により,RTACのベース実装と比較して制御の安定性と速度が大幅に向上することが確認された。

関連論文リスト

VADF: Vision-Adaptive Diffusion Policy Framework for Efficient Robotic Manipulation [26.316939305877145]
拡散政策はロボット操作において主流になりつつあるが、一様サンプリングとサンプル難易度認識の欠如により、強い負のクラス不均衡に悩まされている。本稿では,視覚駆動型デュアルアダプティブフレームワークであるVADF(Vision-Adaptive Diffusion Policy Framework)を提案する。
論文参考訳（メタデータ） (2026-04-17T10:56:59Z)
Generative Control as Optimization: Time Unconditional Flow Matching for Adaptive and Robust Robotic Control [33.03635235189535]
動作合成を反復的最適化に変換する時間非条件フレームワークGeCOについて紹介する。テスト時間推論は、単純な状態に対して収束開始早期に基づいて計算を割り当てる適応的なプロセスとなり、難しい状態に対してはより長く精製する。我々は,GeCOを標準シミュレーションベンチマークで検証し,pi0シリーズのVision-Language-Action(VLA)モデルにシームレスなスケーリングを示す。
論文参考訳（メタデータ） (2026-03-18T15:27:17Z)
OMP: One-step Meanflow Policy with Directional Alignment [26.114675928221974]
高忠実でリアルタイムな操作のために設計されたワンステップ平均フローポリシー(OMP)。 AdroitとMeta-Worldベンチマークの実験では、OMPは成功率と軌道精度において最先端の手法より優れていることが示された。
論文参考訳（メタデータ） (2025-12-22T12:45:35Z)
Stabilizing Policy Gradients for Sample-Efficient Reinforcement Learning in LLM Reasoning [77.92320830700797]
強化学習は、大規模言語モデルの推論機能を実現する上で中心的な役割を果たしてきた。本稿では,ポリシー更新時の曲率情報を追跡し,活用するトラクタブルな計算フレームワークを提案する。アルゴリズムであるCurvature-Aware Policy Optimization (CAPO)は、不安定な更新に寄与するサンプルを特定し、それらをマスクアウトする。
論文参考訳（メタデータ） (2025-10-01T12:29:32Z)
Efficient Transformed Gaussian Process State-Space Models for Non-Stationary High-Dimensional Dynamical Systems [49.819436680336786]
本研究では,高次元非定常力学系のスケーラブルかつ柔軟なモデリングのための効率的な変換ガウス過程状態空間モデル(ETGPSSM)を提案する。具体的には、ETGPSSMは、単一の共有GPと入力依存の正規化フローを統合し、複雑な非定常遷移ダイナミクスを捉える前に、表現的な暗黙のプロセスを生成する。 ETGPSSMは、計算効率と精度の観点から、既存のGPSSMとニューラルネットワークベースのSSMより優れています。
論文参考訳（メタデータ） (2025-03-24T03:19:45Z)
Lyapunov-stable Neural Control for State and Output Feedback: A Novel Formulation [67.63756749551924]
学習ベースのニューラルネットワーク(NN)制御ポリシは、ロボット工学と制御の幅広いタスクにおいて、印象的な経験的パフォーマンスを示している。非線形力学系を持つNNコントローラのトラクション領域(ROA)に対するリアプノフ安定性の保証は困難である。我々は、高速な経験的ファルシフィケーションと戦略的正則化を用いて、Lyapunov証明書とともにNNコントローラを学習するための新しいフレームワークを実証する。
論文参考訳（メタデータ） (2024-04-11T17:49:15Z)
Integrating DeepRL with Robust Low-Level Control in Robotic Manipulators for Non-Repetitive Reaching Tasks [0.24578723416255746]
ロボット工学では、現代の戦略は学習に基づくもので、複雑なブラックボックスの性質と解釈可能性の欠如が特徴である。本稿では, 深部強化学習(DRL)に基づく衝突のない軌道プランナと, 自動調整型低レベル制御戦略を統合することを提案する。
論文参考訳（メタデータ） (2024-02-04T15:54:03Z)
Dealing with Sparse Rewards in Continuous Control Robotics via Heavy-Tailed Policies [64.2210390071609]
本稿では,連続制御問題におけるスパース報酬の課題に対処するため,HT-PSG(Heavy-Tailed Policy Gradient)アルゴリズムを提案する。高平均累積報酬の観点から,全タスクに一貫したパフォーマンス向上を示す。
論文参考訳（メタデータ） (2022-06-12T04:09:39Z)
Pushing the Envelope of Rotation Averaging for Visual SLAM [69.7375052440794]
視覚SLAMシステムのための新しい最適化バックボーンを提案する。従来の単分子SLAMシステムの精度, 効率, 堅牢性を向上させるために, 平均化を活用している。我々のアプローチは、公開ベンチマークの最先端技術に対して、同等の精度で最大10倍高速に表示することができる。
論文参考訳（メタデータ） (2020-11-02T18:02:26Z)
Guided Constrained Policy Optimization for Dynamic Quadrupedal Robot Locomotion [78.46388769788405]
我々は,制約付きポリシー最適化(CPPO)の実装に基づくRLフレームワークであるGCPOを紹介する。誘導制約付きRLは所望の最適値に近い高速収束を実現し,正確な報酬関数チューニングを必要とせず,最適かつ物理的に実現可能なロボット制御動作を実現することを示す。
論文参考訳（メタデータ） (2020-02-22T10:15:53Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。