論文の概要: A Factory-Floor Deployment Case Study of VLA Pipelines for Industrial Packaging Task: Workflow, Failures, and Lessons
- arxiv url: http://arxiv.org/abs/2605.27461v1
- Date: Mon, 25 May 2026 20:46:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-28 17:38:55.296426
- Title: A Factory-Floor Deployment Case Study of VLA Pipelines for Industrial Packaging Task: Workflow, Failures, and Lessons
- Title(参考訳): 産業包装作業用VLAパイプラインの工場床展開事例:ワークフロー,失敗,教訓
- Authors: Brian Zhu, Philipp Schmitt, Philine Meister, Lukas Gensler, Momen Khalil, Emmanuele Poggi, Johannes Hechtl, Carsten Braunroth, Kai Wurm, Gokul Narayanan, Eugen Solowjow, Georg von Wichert, Andre Scholz, Felix Albrecht, Maxmillian Metzner,
- Abstract要約: VLA(Vision-Language-Action)ポリシは、期待できる操作能力を示しているが、現実のデプロイメントの信頼性要求によって、その実践的影響は制限されることが多い。
本稿では,Siemens Factory (GWE, Erlangen, Germany) における産業用包装作業の展開について述べる。そこでは,ロボットが透明なアクセサリバッグをバラバラの山から取り出し,それを段ボールパッケージの残りの空洞に挿入し,その袋とその内容が閉面下にあることを保証する。
我々のゴールは、反復的な微調整により、事前訓練済みのPi0.5ポリシーを1つの工場フロアタスクに適応させるために必要な実践的努力を理解することである。
- 参考スコア(独自算出の注目度): 2.4341902779357536
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Vision-Language-Action (VLA) policies have shown promising manipulation capabilities, yet their practical impact is often limited by the reliability demands of real-world deployment. We present a deployment study of an industrial packaging task at Siemens Factory (GWE, Erlangen, Germany), where a robot must pick a transparent accessory bag from a cluttered pile, insert it into the remaining cavity of a cardboard package, and ensure that the bag and its contents remain below the closing plane. Our goal is to understand the practical effort required to adapt a pretrained Pi0.5 policy to a single factory-floor task through iterative fine-tuning and deployment-driven refinement. The pipeline consists of repeated loops of data collection, curation, fine-tuning, evaluation, and targeted recovery data collection. We have accumulated 2535 episodes (10 hours) from the on-site factory settings. In this paper, we contribute an empirical account of a factory-floor VLA deployment, highlighting recurring failure modes and lessons that inform how to improve the deployment workflow.
- Abstract(参考訳): VLA(Vision-Language-Action)ポリシーは、期待できる操作能力を示しているが、現実のデプロイメントの信頼性要求によって、その実践的影響は制限されることが多い。
本稿では,Siemens Factory (GWE, Erlangen, Germany) における産業用包装作業の展開について述べる。そこでは,ロボットが透明なアクセサリバッグをバラバラの山から取り出し,それを段ボールパッケージの残りの空洞に挿入し,その袋とその内容が閉面下にあることを保証する。
我々のゴールは、反復的な微調整と展開駆動の精錬により、事前訓練済みのPi0.5ポリシーを1つの工場フロアタスクに適合させるために必要な実践的努力を理解することである。
パイプラインは、データ収集、キュレーション、微調整、評価、ターゲットとするリカバリデータ収集の繰り返しループで構成されている。
現場の工場設定から2535エピソード(10時間)を蓄積しました。
本稿では,ファクトリフロアのVLAデプロイメントに関する実証的な説明として,繰り返し発生する障害モードと,デプロイメントワークフローを改善するための教訓を紹介する。
関連論文リスト
- EXPO-FT: Sample-Efficient Reinforcement Learning Finetuning for Vision-Language-Action Models [84.73890225707264]
提案するEXPO-FTは,事前学習したVLAポリシーの安定かつサンプル効率の良いRL微調整システムである。
本システムは,オンラインロボットデータの平均19.1分以内の全ての評価課題に対して,完全なタスク性能(30/30の成功)を実現する。
我々は、ロボット工学におけるVLAモデルのより広範なRLファインタニング導入を促進することを目的とした、オープンソースのロバスト性をリリースする。
論文 参考訳(メタデータ) (2026-05-25T06:31:03Z) - Beyond Action Residuals: Real-World Robot Policy Steering via Bottleneck Latent Reinforcement Learning [42.74142065376427]
本稿では,Z-Perturbation Reinforcement Learning (ZPRL)を提案する。
現実世界では、ZPRLは模倣ベースポリシーよりも4つのタスクの平均成功率を33.7%向上させる。
論文 参考訳(メタデータ) (2026-05-19T14:43:26Z) - BatchWeave: A Consistent Object-Store-Native Data Plane for Large Foundation Model Training [13.09314762856332]
BatchWeaveは、分散FMトレーニングのためのオブジェクトストアネイティブなトレーニングデータプレーンである。
バージョン管理されたマニフェストと条件付きオブジェクト書き込みを実装し、バッチパブリッシュ、リカバリ、ライフサイクル管理を調整する。
完全な障害分離を提供し、Apache Kafkaの取り込みスループットを上回り、Kafkaよりもコンシューマの読み取りレイテンシを低くする。
論文 参考訳(メタデータ) (2026-05-11T05:10:16Z) - On-the-Fly VLA Adaptation via Test-Time Reinforcement Learning [61.38273866396522]
ビジョン・ランゲージ・アクションモデルが汎用ロボット学習の強力なパラダイムとして登場した。
現在の手法は、シミュレーションや物理世界の展開に挑戦するには相変わらず適していない。
本稿では,VLA フレームワークのテスト時間強化学習について紹介する。
論文 参考訳(メタデータ) (2026-01-11T01:51:30Z) - Steering Vision-Language-Action Models as Anti-Exploration: A Test-Time Scaling Approach [78.4812458793128]
動作チャンクの高忠実度検証に軽量な擬数推定器を適用したテスト時間スケーリングフレームワークである textbfTACO を提案する。
我々の手法は、オフライン強化学習(RL)における古典的な反探索原理に似ており、勾配のないため、計算上の大きな恩恵をもたらす。
論文 参考訳(メタデータ) (2025-12-02T14:42:54Z) - Towards Deploying VLA without Fine-Tuning: Plug-and-Play Inference-Time VLA Policy Steering via Embodied Evolutionary Diffusion [8.05008302748311]
VLA-Pilotは、事前訓練されたVLAポリシーのゼロショット展開のための、プラグアンドプレイの推論時ポリシーステアリング手法である。
実験結果から,VLA-Pilotは市販のVLA政策の成功率を大幅に向上させることが示された。
論文 参考訳(メタデータ) (2025-11-18T06:30:52Z) - Latent Plan Transformer for Trajectory Abstraction: Planning as Latent Space Inference [53.419249906014194]
オフライン強化学習から得られたデータセットを用いた計画のための生成モデルについて検討する。
本稿では,Transformerベースのトラジェクトリジェネレータと最終戻り値との接続に潜時変数を利用する新しいモデルであるLatent Plan Transformerを紹介する。
論文 参考訳(メタデータ) (2024-02-07T08:18:09Z) - A Modular Test Bed for Reinforcement Learning Incorporation into
Industrial Applications [1.5136939451642133]
本稿では、あらかじめ定義されたルールに従って、モデルファクトリを通じて商品を輸送・組み立てする作業を行うユースケースを提案する。
目的は、商品を組立ステーションに搬送し、各製品に2つのリベットを設置し、上部を下部に接続することである。
本研究は, この課題に対処し, 生産プロセスの効率化を図るため, 強化学習技術の応用に焦点を当てた。
論文 参考訳(メタデータ) (2023-06-02T11:00:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。