論文の概要: Goal-oriented Communication for Fast and Robust Robotic Fault Detection and Recovery
- arxiv url: http://arxiv.org/abs/2601.18765v1
- Date: Mon, 26 Jan 2026 18:32:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:40.956843
- Title: Goal-oriented Communication for Fast and Robust Robotic Fault Detection and Recovery
- Title(参考訳): 高速かつロバストなロボット故障検出と回復のためのゴール指向通信
- Authors: Shutong Chen, Adnan Aijaz, Yansha Deng,
- Abstract要約: ロボット故障検出・回復のための新しいゴールコミュニケーション(GoC)フレームワークを提案する。
GoCフレームワークは、一般化とビジョン言語フレームワークに依存するフレームワークと比較して、FDR時間を最大82.6%短縮する。
当社のGoCフレームワークでは,一般化に依存するフレームワークと比較して,タスク成功率を最大76%向上しています。
- 参考スコア(独自算出の注目度): 22.4294506019676
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autonomous robotic systems are widely deployed in smart factories and operate in dynamic, uncertain, and human-involved environments that require low-latency and robust fault detection and recovery (FDR). However, existing FDR frameworks exhibit various limitations, such as significant delays in communication and computation, and unreliability in robot motion/trajectory generation, mainly because the communication-computation-control (3C) loop is designed without considering the downstream FDR goal. To address this, we propose a novel Goal-oriented Communication (GoC) framework that jointly designs the 3C loop tailored for fast and robust robotic FDR, with the goal of minimising the FDR time while maximising the robotic task (e.g., workpiece sorting) success rate. For fault detection, our GoC framework innovatively defines and extracts the 3D scene graph (3D-SG) as the semantic representation via our designed representation extractor, and detects faults by monitoring spatial relationship changes in the 3D-SG. For fault recovery, we fine-tune a small language model (SLM) via Low-Rank Adaptation (LoRA) and enhance its reasoning and generalization capabilities via knowledge distillation to generate recovery motions for robots. We also design a lightweight goal-oriented digital twin reconstruction module to refine the recovery motions generated by the SLM when fine-grained robotic control is required, using only task-relevant object contours for digital twin reconstruction. Extensive simulations demonstrate that our GoC framework reduces the FDR time by up to 82.6% and improves the task success rate by up to 76%, compared to the state-of-the-art frameworks that rely on vision language models for fault detection and large language models for fault recovery.
- Abstract(参考訳): 自律型ロボットシステムはスマートファクトリーに広く展開されており、低レイテンシと堅牢な障害検出と回復(FDR)を必要とする動的で不確実で人間に関わる環境で運用されている。
しかし、既存のFDRフレームワークは、通信や計算の大幅な遅延、ロボットの動き/軌道生成の信頼性の欠如など、様々な制限が示されており、主に、下流FDRの目標を考慮せずに通信制御(3C)ループが設計されている。
そこで本研究では,高速かつ堅牢なロボットFDRに適した3Cループを協調設計し,ロボット作業(例えばワークピースソート)の成功率を最大化しつつ,FDR時間を最小化する,新たな目標指向通信(GoC)フレームワークを提案する。
故障検出のためのGoCフレームワークは,設計した表現抽出器を通じて3Dシーングラフ(3D-SG)を意味表現として革新的に定義・抽出し,空間的関係の変化を監視して故障を検出する。
故障回復のために,ローランド適応(LoRA)を介して小言語モデル(SLM)を微調整し,知識蒸留による推論と一般化機能を強化し,ロボットの回復動作を生成する。
また,デジタル双対再構成のためのタスク関連オブジェクト輪郭のみを用いて,細粒度ロボット制御が必要な場合のSLMが生成する回復動作を改良する,軽量な目標指向ディジタル双対再構成モジュールを設計する。
大規模なシミュレーションにより、GoCフレームワークはFDR時間を最大82.6%削減し、タスク成功率を最大76%改善した。
関連論文リスト
- Robo3R: Enhancing Robotic Manipulation with Accurate Feed-Forward 3D Reconstruction [70.06600045165905]
3D空間認識は、一般的なロボット操作の基本であるが、信頼性が高く高品質な3D形状の取得は依然として困難である。
本稿では,RGB画像やロボットの状態から直接,正確な距離スケールのシーン形状をリアルタイムで予測する操作可能な3次元再構成モデルであるRobo3Rを紹介する。
我々は、ロボット操作のためのこの代替3Dセンシングモジュールの約束を示唆し、パフォーマンスの連続的な向上を観察する。
論文 参考訳(メタデータ) (2026-02-10T18:58:15Z) - Fiducial Exoskeletons: Image-Centric Robot State Estimation [21.491677821308688]
画像に基づく3次元ロボット状態推定の再構成であるFiducial Exoskeletonsを紹介する。
まず,1枚のRGB画像から各リンクの6次元ポーズ推定として,ロボットの状態推定を行った。
第2に、学習することなく、リンクごとの6Dポーズ推定を堅牢でシンプルなものにします。
論文 参考訳(メタデータ) (2026-01-12T22:04:25Z) - Guardian: Detecting Robotic Planning and Execution Errors with Vision-Language Models [53.20969621498248]
本稿では,多種多様な計画および実行障害を生成するために,軌道を手続き的に乱す自動ロボット故障合成手法を提案する。
RLBench-Fail, BridgeDataV2-Fail, UR5-Failの3つの新しい故障検出ベンチマークを構築した。
次に、詳細な障害推論と検出のためのマルチビューイメージを備えたVLMであるGuardianをトレーニングします。
論文 参考訳(メタデータ) (2025-12-01T17:57:27Z) - STORM: Segment, Track, and Object Re-Localization from a Single 3D Model [35.39496117133769]
STORMはオープンソースの堅牢なリアルタイム6Dポーズ推定システムで、手動のアノテーションを必要としない。
STORMは、視覚監督型理解と自己言語機能マッチングを組み合わせた、新しい3段階パイプラインを採用している。
論文 参考訳(メタデータ) (2025-11-12T22:06:51Z) - 3D-Grounded Vision-Language Framework for Robotic Task Planning: Automated Prompt Synthesis and Supervised Reasoning [2.6670748466660523]
視覚言語モデル(VLM)はシーン理解と知覚タスクにおいて顕著な成功を収めた。
VLMにはロバストな3Dシーンのローカライズ機能がなく、ロボット操作の精度を制限している。
本稿では,2次元画像を点雲にマッピングすることで,2次元プロンプト合成モジュールを統合し,VLM出力を監視するための小さな言語モデル(SLM)を組み込む新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2025-02-13T02:40:19Z) - Multi-robot autonomous 3D reconstruction using Gaussian splatting with Semantic guidance [18.631273098468384]
暗黙の神経表現と3次元ガウススプラッティング(3DGS)はシーン再構成に大きな可能性を示している。
近年,タスク割り当て手法による自律的再構築への応用が拡大している。
本稿では,最初の3DGSに基づく集中型マルチロボット自律型3D再構築フレームワークを提案する。
論文 参考訳(メタデータ) (2024-12-03T08:27:17Z) - Exploring the Adversarial Vulnerabilities of Vision-Language-Action Models in Robotics [68.36528819227641]
本稿では,ビジョン・ランゲージ・アクション(VLA)モデルのロバスト性を体系的に評価する。
本研究では,ロボット行動の不安定化に空間的基盤を活用する2つの未目標攻撃目標と,ロボット軌道を操作する目標攻撃目標を導入する。
我々は、カメラの視野に小さなカラフルなパッチを配置し、デジタルと物理の両方の環境で効果的に攻撃を実行する逆パッチ生成アプローチを設計する。
論文 参考訳(メタデータ) (2024-11-18T01:52:20Z) - FILP-3D: Enhancing 3D Few-shot Class-incremental Learning with Pre-trained Vision-Language Models [59.13757801286343]
クラス増分学習(class-incremental learning)は、モデルが限られたデータで漸進的にトレーニングされている場合、破滅的な忘れの問題を軽減することを目的としている。
本稿では,特徴空間の不整合のための冗長特徴除去器 (RFE) と,重要な雑音に対する空間ノイズ補償器 (SNC) の2つの新しいコンポーネントを備えたFILP-3Dフレームワークを紹介する。
論文 参考訳(メタデータ) (2023-12-28T14:52:07Z) - Amodal 3D Reconstruction for Robotic Manipulation via Stability and
Connectivity [3.359622001455893]
学習に基づく3Dオブジェクト再構成により、3Dオブジェクトモデルの単一または少数ショット推定が可能となる。
既存の3D再構成技術は、通常、シャムファー距離またはボクセルIOUによって測定される視覚的再構成忠実度を最適化する。
本稿では,オブジェクト形状よりも先に安定性を導入するアモーダル3D再構成システムARMと,接続前の接続,マルチチャネル入力表現を提案する。
論文 参考訳(メタデータ) (2020-09-28T08:52:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。