論文の概要: Bayesian Active Object Recognition and 6D Pose Estimation from Multimodal Contact Sensing
- arxiv url: http://arxiv.org/abs/2603.21410v1
- Date: Sun, 22 Mar 2026 21:30:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-24 19:11:39.40366
- Title: Bayesian Active Object Recognition and 6D Pose Estimation from Multimodal Contact Sensing
- Title(参考訳): マルチモーダルコンタクトセンシングによるベイズ能動物体認識と6次元位置推定
- Authors: Haodong Zheng, Gabriele M. Caddeo, Andrei C. Jalba, Wijnand A. IJsselsteijn, Lorenzo Natale, Raymond H. Cuijpers,
- Abstract要約: 共同物体認識と6次元ポーズ推定のための能動的触覚探索フレームワークを提案する。
提案手法は、手首力/トルクセンシング、GelSight触覚センシング、自由空間制約を統合する。
その結果,触覚情報や自由空間情報を組み込むことで認識精度が向上し,推定精度と安定性が向上することがわかった。
- 参考スコア(独自算出の注目度): 14.370567509757555
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present an active tactile exploration framework for joint object recognition and 6D pose estimation. The proposed method integrates wrist force/torque sensing, GelSight tactile sensing, and free-space constraints within a Bayesian inference framework that maintains a belief over object class and pose during active tactile exploration. By combining contact and non-contact evidence, the framework reduces ambiguity and improves robustness in the joint class-pose estimation problem. To enable efficient inference in the large hypothesis space, we employ a customized particle filter that progressively samples particles based on new observations. The inferred belief is further used to guide active exploration by selecting informative next touches under reachability constraints. For effective data collection, a motion planning and control framework is developed to plan and execute feasible paths for tactile exploration, handle unexpected contacts and GelSight-surface alignment with tactile servoing. We evaluate the framework in simulation and on a Franka Panda robot using 11 YCB objects. Results show that incorporating tactile and free-space information substantially improves recognition and pose estimation accuracy and stability, while reducing the number of action cycles compared with force/torque-only baselines. Code, dataset, and supplementary material will be made available online.
- Abstract(参考訳): 共同物体認識と6次元ポーズ推定のための能動的触覚探索フレームワークを提案する。
提案手法は,手首力/トルクセンシング,GelSight触覚センシング,自由空間制約を,対象クラスに対する信念を維持し,活発な触覚探索中に作用するベイズ推論フレームワークに統合する。
この枠組みは接触と非接触の証拠を組み合わせることで曖昧さを低減し、共同クラス配置推定問題における堅牢性を向上させる。
大規模な仮説空間における効率的な推論を可能にするために,新しい観測結果に基づいて粒子を段階的にサンプリングするカスタマイズされた粒子フィルタを用いる。
推測された信念は、到達可能性制約の下で情報的な次のタッチを選択することによって、活発な探索を導くためにさらに使用される。
効果的なデータ収集のために,触覚探索,予期せぬ接触の処理,触覚サーボによるGelSight面アライメントの実現が可能な経路を計画・実行するための移動計画制御フレームワークを開発した。
11個のYCBオブジェクトを用いて,シミュレーションおよびFranka Pandaロボット上でのフレームワークの評価を行った。
その結果,触覚情報や自由空間情報を取り入れることで認識とポーズ推定の精度と安定性が向上し,力/トルクのみのベースラインに比べて動作サイクルの回数が減少することがわかった。
コード、データセット、補足資料はオンラインで入手できる。
関連論文リスト
- GAPG: Geometry Aware Push-Grasping Synergy for Goal-Oriented Manipulation in Clutter [27.71481975135778]
乱雑な環境では、シングルステップの把握が不十分であることが多い。
従来の作業は、把握可能な空間を作るための補助的なアクションとしてプッシュを導入してきた。
我々は,グリップとプッシュ評価を統合するために,幾何対応のプッシュグラス・シナジー・フレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-22T12:30:44Z) - Diffusion-based Inverse Model of a Distributed Tactile Sensor for Object Pose Estimation [45.95486121114164]
我々は,デノナイズ拡散を用いた逆触覚センサモデルを学習し,触覚データを効率的に活用してポーズ推定を行う。
このモデルは、分布した触覚センサからの触覚観測に基づいて調整され、幾何学的センサーモデルを用いてシミュレーションで訓練される。
オンラインポーズ推定では,提案手法を用いて逆モデルと粒子フィルタを統合する。
論文 参考訳(メタデータ) (2026-01-19T17:36:28Z) - Articulated Object Manipulation using Online Axis Estimation with SAM2-Based Tracking [57.942404069484134]
アーティキュレートされたオブジェクト操作は、オブジェクトの軸を慎重に考慮する必要がある、正確なオブジェクトインタラクションを必要とする。
従来の研究では、対話的な知覚を用いて関節のある物体を操作するが、通常、オープンループのアプローチは相互作用のダイナミクスを見渡すことに悩まされる。
本稿では,対話的知覚と3次元点雲からのオンライン軸推定を統合したクローズドループパイプラインを提案する。
論文 参考訳(メタデータ) (2024-09-24T17:59:56Z) - A Bayesian Framework for Active Tactile Object Recognition, Pose Estimation and Shape Transfer Learning [3.35643050085202]
本稿では,能動的触覚物体認識,ポーズ推定,形状伝達学習の課題に対処する。
カスタマイズされた粒子フィルタ(PF)とガウス過程の暗黙曲面(GPIS)を統一されたベイズフレームワークで結合する。
シミュレーション実験を通じて,提案フレームワークは,対象のクラスを推定し,既知のオブジェクトのポーズと新しい形状の学習において,その有効性と効率を実証した。
論文 参考訳(メタデータ) (2024-09-10T23:35:30Z) - Towards Consistent Object Detection via LiDAR-Camera Synergy [17.665362927472973]
物体の位置を点雲と画像の両方で検出できる既存のモデルは存在しない。
本稿では,エンドツーエンドの一貫性オブジェクト検出(COD)アルゴリズムフレームワークを提案する。
本稿では,点雲と画像間の物体相関の精度を評価するために,新しい評価指標である一貫性精度(Consistency Precision)を提案する。
論文 参考訳(メタデータ) (2024-05-02T13:04:26Z) - Tactile Estimation of Extrinsic Contact Patch for Stable Placement [64.06243248525823]
本稿では,複雑な物体を積み重ねることを学ぶロボットのためのフィードバックスキルの設計について述べる。
つかんだ物体とその環境間の接触パッチを,力と触覚の観測により推定する。
論文 参考訳(メタデータ) (2023-09-25T21:51:48Z) - Tactile-Filter: Interactive Tactile Perception for Part Mating [54.46221808805662]
人間は触覚と触覚に頼っている。
視覚ベースの触覚センサーは、様々なロボット認識や制御タスクに広く利用されている。
本稿では,視覚に基づく触覚センサを用いた対話的知覚手法を提案する。
論文 参考訳(メタデータ) (2023-03-10T16:27:37Z) - TRiPOD: Human Trajectory and Pose Dynamics Forecasting in the Wild [77.59069361196404]
TRiPODは、グラフの注目ネットワークに基づいて身体のダイナミクスを予測する新しい方法です。
実世界の課題を取り入れるために,各フレームで推定された身体関節が可視・視認可能かどうかを示す指標を学習する。
評価の結果,TRiPODは,各軌道に特化して設計され,予測タスクに特化している。
論文 参考訳(メタデータ) (2021-04-08T20:01:00Z) - Robust Ego and Object 6-DoF Motion Estimation and Tracking [5.162070820801102]
本稿では,動的多体視覚計測における高精度な推定と一貫した追跡性を実現するためのロバストな解を提案する。
セマンティック・インスタンスレベルのセグメンテーションと正確な光フロー推定の最近の進歩を活用して、コンパクトで効果的なフレームワークを提案する。
追従点の品質と運動推定精度を向上させる新しい定式化SE(3)運動と光流が導入された。
論文 参考訳(メタデータ) (2020-07-28T05:12:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。