論文の概要: InvariantCloud: A Globally Invariant, Uniquely Indexed Point Cloud Framework for Robust 6-DoF Tactile Pose Tracking
- arxiv url: http://arxiv.org/abs/2605.25216v1
- Date: Sun, 24 May 2026 18:46:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:19.027192
- Title: InvariantCloud: A Globally Invariant, Uniquely Indexed Point Cloud Framework for Robust 6-DoF Tactile Pose Tracking
- Title(参考訳): InvariantCloud:ロバスト6-DoF 触覚追跡のためのグローバルに不変、ユニークなインデックス付きポイントクラウドフレームワーク
- Authors: Pengfei Ye, Yuxiang Ma, Yi Zhou, Wei Chen, Wenzhen Dong, Molong Duan,
- Abstract要約: InvariantCloudは6-DoFの触覚オブジェクトのポーズ推定フレームワークである。
InvariantCloudは,既存のベンチマークと比較して,ヨートラッキング精度と再局在再現性に優れることを示す。
- 参考スコア(独自算出の注目度): 7.9092948142021
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advances in imitation learning and vision-language models highlight the need for high-fidelity tactile perception, with 6-DoF tactile object pose estimation providing a crucial foundation for precise robotic manipulation. We introduce InvariantCloud, a 6-DoF pose estimation framework that leverages the global invariance of surface marker constellations on vision-based tactile sensors. In contrast to recent approaches, our one-shot globally invariant point cloud registration suppresses cumulative drift and overcomes long-standing limitations in accurately estimating yaw (Z-axis) rotation. Experimental verifications show that InvariantCloud achieves superior yaw tracking accuracy and re-localization repeatability compared to existing benchmarks, demonstrating its precision and robustness in long-sequence manipulation tasks.
- Abstract(参考訳): 模倣学習と視覚言語モデルの最近の進歩は、高精度なロボット操作のための重要な基盤となる6-DoF触覚オブジェクトのポーズ推定によって、高忠実な触覚知覚の必要性を強調している。
InvariantCloudは、6-DoFのポーズ推定フレームワークで、視覚ベースの触覚センサ上の表面マーカー星座のグローバルな不変性を利用する。
近年のアプローチとは対照的に、我々の一発的不変点雲登録は累積ドリフトを抑制し、ヤウ(Z軸)の回転を正確に推定する長期的制限を克服する。
実験により、InvariantCloudは既存のベンチマークよりも優れたヨートラッキング精度と再ローカライズ再現性を実現し、長時間の操作タスクにおいてその精度と堅牢性を実証した。
関連論文リスト
- Markerless 6D Pose Estimation and Position-Based Visual Servoing for Endoscopic Continuum Manipulators [3.324399280473623]
本稿では,マーカーレスステレオ6Dポーズ推定と連続体マニピュレータの位置に基づく視覚サーボのための統合フレームワークを提案する。
フォトリアリスティックシミュレーションパイプラインは、画素精度アノテーションによる大規模自動トレーニングを可能にする。
我々の知る限り、この研究は、連続体マニピュレータのための完全マーカーレスポーズ推定に基づく位置ベース視覚サーボフレームワークを初めて提示する。
論文 参考訳(メタデータ) (2026-02-18T11:08:32Z) - Color-Pair Guided Robust Zero-Shot 6D Pose Estimation and Tracking of Cluttered Objects on Edge Devices [4.261261166281339]
本稿では,エッジデバイス上での効率的な実行を目的とした統合フレームワークを提案する。
当社のアプローチの鍵は、ライトと不変なカラーペアの特徴表現の共有です。
最初の見積のために、この機能はライブRGB-Dビューとオブジェクトの3Dメッシュの間の堅牢な登録を容易にする。
追跡に関しては、同じ特徴論理が時間的対応を検証し、軽量モデルが物体の動きを確実に回帰させることができる。
論文 参考訳(メタデータ) (2025-09-28T05:07:49Z) - ViTa-Zero: Zero-shot Visuotactile Object 6D Pose Estimation [14.575011735514522]
ViTa-Zeroはゼロショットビゾタクティルポーズ推定フレームワークである。
実世界のロボット・セットアップの実験を通して、我々のフレームワークを検証する。
論文 参考訳(メタデータ) (2025-04-17T17:59:56Z) - Point Cloud Pre-training with Diffusion Models [62.12279263217138]
我々は、ポイントクラウド拡散事前学習(PointDif)と呼ばれる新しい事前学習手法を提案する。
PointDifは、分類、セグメンテーション、検出など、さまざまな下流タスクのために、さまざまな現実世界のデータセット間で大幅に改善されている。
論文 参考訳(メタデータ) (2023-11-25T08:10:05Z) - Manifold-Aware Self-Training for Unsupervised Domain Adaptation on
Regressing 6D Object Pose [69.14556386954325]
視覚的回帰における合成データと実データとのドメインギャップは,グローバルな特徴アライメントと局所的な改善によって橋渡しされる。
提案手法は明示的な自己教師付き多様体正規化を取り入れ,領域間の一貫した累積的対象依存性を明らかにする。
暗黙的ニューラルファンクションを学習して、最も近いクラスビンへの相対的な方向と目標の距離を推定し、ターゲット分類予測を洗練することを目的としている。
論文 参考訳(メタデータ) (2023-05-18T08:42:41Z) - PCKRF: Point Cloud Completion and Keypoint Refinement With Fusion Data for 6D Pose Estimation [33.226033672697795]
そこで本研究では,6次元ポーズ推定のための新しいポーズ改善パイプラインであるPoint Cloud Completion and Keypoint Refinement with Fusion Data (PCKRF)を提案する。
PCKRFパイプラインは、フルフロー双方向融合ネットワークのような、既存の一般的な6Dポーズ推定手法と統合することができる。
提案手法は,初期ポーズを比較的高精度に最適化する場合に,既存手法と比較して優れた安定性を示す。
論文 参考訳(メタデータ) (2022-10-07T10:13:30Z) - PointCAT: Contrastive Adversarial Training for Robust Point Cloud
Recognition [111.55944556661626]
我々は、ポイントクラウド認識モデルの堅牢性を高めるために、PointCAT(Point-Cloud Contrastive Adversarial Training)を提案する。
我々は、教師付きコントラスト損失を利用して、認識モデルにより抽出された超球面特徴のアライメントと均一性を促進する。
より難易度の高い点雲を実現するため,認識モデルと逆向きにノイズ発生装置をスクラッチから訓練する。
論文 参考訳(メタデータ) (2022-09-16T08:33:04Z) - AGO-Net: Association-Guided 3D Point Cloud Object Detection Network [86.10213302724085]
ドメイン適応によるオブジェクトの無傷な特徴を関連付ける新しい3D検出フレームワークを提案する。
我々は,KITTIの3D検出ベンチマークにおいて,精度と速度の両面で最新の性能を実現する。
論文 参考訳(メタデータ) (2022-08-24T16:54:38Z) - Visual-tactile sensing for Real-time liquid Volume Estimation in
Grasping [58.50342759993186]
変形性容器内の液体をリアルタイムに推定するためのビジュオ触覚モデルを提案する。
我々は、RGBカメラからの生の視覚入力と、特定の触覚センサーからの触覚手がかりの2つの感覚モードを融合する。
ロボットシステムは、推定モデルに基づいて、リアルタイムで適切に制御され、調整される。
論文 参考訳(メタデータ) (2022-02-23T13:38:31Z) - Spatial Attention Improves Iterative 6D Object Pose Estimation [52.365075652976735]
本稿では,RGB画像を用いた6次元ポーズ推定の改良手法を提案する。
私たちの主な洞察力は、最初のポーズ推定の後、オブジェクトの異なる空間的特徴に注意を払うことが重要です。
実験により,このアプローチが空間的特徴に順応することを学び,被写体の一部を無視することを学び,データセット間でのポーズ推定を改善することを実証した。
論文 参考訳(メタデータ) (2021-01-05T17:18:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。