論文の概要: Continual Hand-Eye Calibration for Open-world Robotic Manipulation
- arxiv url: http://arxiv.org/abs/2604.15814v1
- Date: Fri, 17 Apr 2026 08:11:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-20 22:00:19.813692
- Title: Continual Hand-Eye Calibration for Open-world Robotic Manipulation
- Title(参考訳): オープンワールドロボットマニピュレーションのための連続的ハンドアイ校正
- Authors: Fazeng Li, Gan Sun, Chenxi Liu, Yao He, Wei Cong, Yang Cong,
- Abstract要約: 視覚的位置決めによる目視の校正は、オープンワールド環境におけるロボット操作にとって重要である。
ほとんどのディープラーニングベースのキャリブレーションモデルは、オープンワールドのシーンの変化の中で目に見えないデータに適応するとき、破滅的な忘れに苦しむ。
本研究では,ロボットが連続的に遭遇するオープンワールドの操作シーンに適応できる連続的手目校正フレームワークを提案する。
- 参考スコア(独自算出の注目度): 37.99491137671598
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Hand-eye calibration through visual localization is a critical capability for robotic manipulation in open-world environments. However, most deep learning-based calibration models suffer from catastrophic forgetting when adapting into unseen data amongst open-world scene changes, while simple rehearsal-based continual learning strategy cannot well mitigate this issue. To overcome this challenge, we propose a continual hand-eye calibration framework, enabling robots to adapt to sequentially encountered open-world manipulation scenes through spatially replay strategy and structure-preserving distillation. Specifically, a Spatial-Aware Replay Strategy (SARS) constructs a geometrically uniform replay buffer that ensures comprehensive coverage of each scene pose space, replacing redundant adjacent frames with maximally informative viewpoints. Meanwhile, a Structure-Preserving Dual Distillation (SPDD) is proposed to decompose localization knowledge into coarse scene layout and fine pose precision, and distills them separately to alleviate both types of forgetting during continual adaptation. As a new manipulation scene arrives, SARS provides geometrically representative replay samples from all prior scenes, and SPDD applies structured distillation on these samples to retain previously learned knowledge. After training on the new scene, SARS incorporates selected samples from the new scene into the replay buffer for future rehearsal, allowing the model to continuously accumulate multi-scene calibration capability. Experiments on multiple public datasets show significant anti scene forgetting performance, maintaining accuracy on past scenes while preserving adaptation to new scenes, confirming the effectiveness of the framework.
- Abstract(参考訳): 視覚的位置決めによる目視の校正は、オープンワールド環境におけるロボット操作にとって重要な能力である。
しかし、ほとんどのディープラーニングベースのキャリブレーションモデルは、オープンワールドのシーンの変化の中で見えないデータに適応する場合、破滅的な忘れがちであるが、単純なリハーサルベースの継続的な学習戦略はこの問題を十分に軽減できない。
この課題を克服するために,ロボットは空間的再生戦略と構造保存蒸留により,逐次的に遭遇するオープンワールドの操作シーンに適応できる連続的手目校正フレームワークを提案する。
具体的には、空間認識再生戦略(SARS)は、各シーンポーズ空間の包括的カバレッジを保証する幾何学的に均一な再生バッファを構築し、冗長な隣接フレームを最大情報的視点で置き換える。
一方,SPDD (Structure-Preserving Dual Distillation) は,局所化知識を粗いシーンレイアウトと微調整精度に分解し,連続適応時の両種類の忘れを緩和するために別々に蒸留する手法である。
新しい操作シーンが到着すると、SARSは以前のすべてのシーンから幾何学的に代表的なリプレイサンプルを提供し、SPDDはこれらのサンプルに構造化された蒸留を適用して、それまでの知識を保持する。
新しいシーンのトレーニングの後、SARSは新しいシーンから選択したサンプルを将来のリハーサルのためにリプレイバッファに組み込んで、モデルが連続的にマルチシーンキャリブレーション機能を蓄積できるようにする。
複数の公開データセットの実験では、パフォーマンスを忘れ、過去のシーンの精度を維持しつつ、新しいシーンへの適応を維持し、フレームワークの有効性を確認している。
関連論文リスト
- Scal3R: Scalable Test-Time Training for Large-Scale 3D Reconstruction [50.5449251266956]
本稿では,長い映像シーケンスから大規模3Dシーンを再構築する作業について述べる。
近年のフィードフォワード再構成モデルでは,RGB画像からの3次元幾何を,明示的な3次元先行や幾何学的制約なく直接回帰することで,有望な結果を示している。
本稿では,長距離シーン情報を効率よく圧縮し,保持するニューラルグローバルコンテキスト表現を提案する。
論文 参考訳(メタデータ) (2026-04-09T17:59:50Z) - SceneExpander: Expanding 3D Scenes with Free-Form Inserted Views [69.08965991211704]
ユーザ中心のワークフローにおける3Dシーンの拡大について検討する。
固定シーンにおける単純なオブジェクト編集やスタイル転送とは異なり、挿入されたビューは元の再構築と3Dミスアライメントされることが多い。
パラメトリックフィードフォワード3D再構成モデルにテスト時間適応を適用したSceneExpanderを提案する。
論文 参考訳(メタデータ) (2026-03-28T02:04:48Z) - Robotic Scene Cloning:Advancing Zero-Shot Robotic Scene Adaptation in Manipulation via Visual Prompt Editing [76.13853194607252]
本稿では,既存のロボット操作軌跡を編集し,シーン固有の適応を目的とした新しい手法であるロボットシーンクローニング(RSC)を提案する。
RSCは、視覚的プロンプト機構と注意深く調整された条件注入モジュールを活用することにより、正確でシーン一貫性のあるサンプル生成を実現する。
シミュレーションおよび実世界の様々な環境における実験により、RCCはターゲット環境におけるポリシーの一般化を著しく促進することが示された。
論文 参考訳(メタデータ) (2026-03-10T14:21:25Z) - Object-level Scene Deocclusion [92.39886029550286]
オブジェクトレベルのシーン・デクルージョンのためのPArallel可視・コミュールト拡散フレームワークPACOを提案する。
PACOをトレーニングするために、500kサンプルの大規模なデータセットを作成し、自己教師付き学習を可能にします。
COCOAと様々な現実世界のシーンの実験では、PACOがシーンの排除に優れた能力を示し、芸術の状態をはるかに上回っている。
論文 参考訳(メタデータ) (2024-06-11T20:34:10Z) - You Only Scan Once: A Dynamic Scene Reconstruction Pipeline for 6-DoF Robotic Grasping of Novel Objects [7.830251930628282]
本稿では,動的シーン再構築のための新しい2段階パイプラインを提案する。
最初の段階では,各対象物をメッシュ再構成と新規オブジェクトポーズトラッキングで登録するために,シーンスキャンを入力として利用する。
第2段階では、オブジェクトのポーズをリアルタイムで提供し、再構成されたオブジェクトポイントの雲をシーンに戻せるようにします。
論文 参考訳(メタデータ) (2024-04-04T14:13:56Z) - CoDEPS: Online Continual Learning for Depth Estimation and Panoptic
Segmentation [28.782231314289174]
深層学習に基づく単眼深度推定とパノプティックセグメンテーションのための連続学習をオンラインで導入する。
そこで本研究では,パノプティカルセグメンテーションに適応する擬似ラベルを生成するための新しいドメイン混合手法を提案する。
我々は,固定サイズのリプレイバッファを構築するためのサンプリング戦略を活用することで,ロボットシステムの限られたストレージ容量に明示的に対処する。
論文 参考訳(メタデータ) (2023-03-17T17:31:55Z) - Continual Learning for Image-Based Camera Localization [14.47046413243358]
連続学習環境における視覚的局所化の問題について検討する。
以上の結果から,非定常データも分類領域と同様,深層ネットワークにおいて視覚的局所化のための破滅的な忘れを生じさせることが示された。
本稿では,バッファリングプロセスにおける既存のサンプリング戦略を視覚的ローカライゼーションの問題に適応させる,カバレッジスコア(Buff-CS)に基づく新しいサンプリング手法を提案する。
論文 参考訳(メタデータ) (2021-08-20T11:18:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。