論文の概要: Towards Logic-Aware Manipulation: A Knowledge Primitive for VLM-Based Assistants in Smart Manufacturing
- arxiv url: http://arxiv.org/abs/2512.11275v1
- Date: Fri, 12 Dec 2025 04:36:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:40.296369
- Title: Towards Logic-Aware Manipulation: A Knowledge Primitive for VLM-Based Assistants in Smart Manufacturing
- Title(参考訳): 論理認識マニピュレーションに向けて:スマートマニュファクチャリングにおけるVLMベースのアシスタントの知識プリミティブ
- Authors: Suchang Chen, Daqiang Guo,
- Abstract要約: オブジェクト中心の操作論理モデルを形式化し、8フィールドとしてシリアライズする。
オブジェクト、インターフェース、トラジェクトリ、トレランス、および第一級知識信号としてフォース/インピーダンス情報を公開する。
我々は、最近のVLM/LLM計画ベンチマークから適応した計画品質指標を用いて、条件付きVLM計画を分析する。
スマートマニュファクチャリング企業におけるアシスタントシステムのビルディングブロックとして,同じスキーマがトレーニング時に分類タグ付きデータ拡張をサポートし,テスト時に論理認識検索が促進されることを示す。
- 参考スコア(独自算出の注目度): 0.552480439325792
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing pipelines for vision-language models (VLMs) in robotic manipulation prioritize broad semantic generalization from images and language, but typically omit execution-critical parameters required for contact-rich actions in manufacturing cells. We formalize an object-centric manipulation-logic schema, serialized as an eight-field tuple τ, which exposes object, interface, trajectory, tolerance, and force/impedance information as a first-class knowledge signal between human operators, VLM-based assistants, and robot controllers. We instantiate τ and a small knowledge base (KB) on a 3D-printer spool-removal task in a collaborative cell, and analyze τ-conditioned VLM planning using plan-quality metrics adapted from recent VLM/LLM planning benchmarks, while demonstrating how the same schema supports taxonomy-tagged data augmentation at training time and logic-aware retrieval-augmented prompting at test time as a building block for assistant systems in smart manufacturing enterprises.
- Abstract(参考訳): ロボット操作における既存の視覚言語モデル(VLM)のパイプラインは、画像や言語から広範囲なセマンティックな一般化を優先するが、通常、製造細胞におけるコンタクトリッチな動作に必要な実行クリティカルパラメータを省略する。
オブジェクト,インターフェース,トラジェクトリ,トレランス,力/インピーダンス情報を人間の操作者,VLMベースのアシスタント,ロボットコントローラ間で一級知識信号として公開する8フィールドタプルτとしてシリアライズされたオブジェクト中心の操作論理スキーマを形式化する。
近年のVLM/LLM計画ベンチマークに適合した計画品質指標を用いて、協調セル内の3Dプリンダースプール除去タスク上でτと小さな知識ベース(KB)をインスタンス化し、同じスキーマがトレーニング時に分類タグ付きデータ拡張をサポートし、スマート製造企業におけるアシスタントシステムのビルディングブロックとしてテスト時に論理認識検索が促されることを示しながら、τ条件付きVLMプランニングを解析する。
関連論文リスト
- From Code to Action: Hierarchical Learning of Diffusion-VLM Policies [8.0703783175731]
ロボット操作の模倣学習はしばしば、限られた一般化とデータ不足に悩まされる。
本稿では,コード生成型視覚言語モデル(VLM)を活用した階層型フレームワークを提案する。
この設計は、解釈可能なポリシーの分解を可能にし、フラットなポリシーと比較して一般化を改善し、高レベルの計画と低レベルの制御を別々に評価できるようにする。
論文 参考訳(メタデータ) (2025-09-29T15:22:18Z) - VerifyLLM: LLM-Based Pre-Execution Task Plan Verification for Robots [44.99833362998488]
本研究では,シミュレータや実環境で実行する前に,タスクプランを自動的に検証するアーキテクチャを提案する。
このモジュールは、Large Language Modelsの推論機能を使用して、論理的一貫性を評価し、計画の潜在的なギャップを特定する。
我々は,タスク計画の信頼性と効率の向上に寄与し,自律システムにおける堅牢な事前実行検証の必要性に対処する。
論文 参考訳(メタデータ) (2025-07-07T15:31:36Z) - RoboCerebra: A Large-scale Benchmark for Long-horizon Robotic Manipulation Evaluation [59.9896841079005]
長距離ロボット操作における高レベル推論評価のためのベンチマークであるRoboCerebraを紹介する。
データセットはトップダウンパイプラインを通じて構築され、GPTはタスク命令を生成し、それらをサブタスクシーケンスに分解する。
以前のベンチマークと比較すると、RoboCerebraはアクションシーケンスが大幅に長く、アノテーションがより密度が高い。
論文 参考訳(メタデータ) (2025-06-07T06:15:49Z) - Logical Specifications-guided Dynamic Task Sampling for Reinforcement Learning Agents [9.529492371336286]
強化学習(Reinforcement Learning、RL)は、人工エージェントが多様な振る舞いを学習できるようにするために大きな進歩を遂げてきた。
論理仕様誘導動的タスクサンプリング(LSTS)と呼ばれる新しい手法を提案する。
LSTSは、エージェントを初期状態から目標状態へ誘導するRLポリシーのセットを、ハイレベルなタスク仕様に基づいて学習する。
論文 参考訳(メタデータ) (2024-02-06T04:00:21Z) - TaskBench: Benchmarking Large Language Models for Task Automation [82.2932794189585]
タスク自動化における大規模言語モデル(LLM)の機能を評価するためのフレームワークであるTaskBenchを紹介する。
具体的には、タスクの分解、ツールの選択、パラメータ予測を評価する。
提案手法は, 自動構築と厳密な人的検証を組み合わせることで, 人的評価との整合性を確保する。
論文 参考訳(メタデータ) (2023-11-30T18:02:44Z) - ChatGPT as your Personal Data Scientist [0.9689893038619583]
本稿では,ChatGPTを用いた対話型データサイエンスフレームワークについて紹介する。
データビジュアライゼーション、タスクの定式化、予測エンジニアリング、結果概要と勧告の4つのダイアログ状態を中心に、私たちのモデルが中心になっています。
要約して,会話データ科学の新たな概念が実現可能であることを証明するとともに,複雑なタスクを解く上でLLMが有効であることを示すエンド・ツー・エンド・エンド・システムを開発した。
論文 参考訳(メタデータ) (2023-05-23T04:00:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。