論文の概要: Temporally Consistent Object 6D Pose Estimation for Robot Control
- arxiv url: http://arxiv.org/abs/2605.02708v1
- Date: Mon, 04 May 2026 15:15:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:50.364151
- Title: Temporally Consistent Object 6D Pose Estimation for Robot Control
- Title(参考訳): ロボット制御のための時間的一貫した物体6次元姿勢推定
- Authors: Kateryna Zorina, Vojtech Priban, Mederic Fourmy, Josef Sivic, Vladimir Petrik,
- Abstract要約: 我々は、オブジェクトの時間的一貫性を強制する因子グラフアプローチを開発する。
フィードバックに基づくロボット制御タスクにおける提案手法の安定性を実験的に検証する。
- 参考スコア(独自算出の注目度): 16.973122634563314
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Single-view RGB object pose estimators have reached a level of precision and efficiency that makes them good candidates for vision-based robot control. However, off-the-shelf methods lack temporal consistency and robustness that are mandatory for a stable feedback control. In this work, we develop a factor graph approach to enforce temporal consistency of the object pose estimates. In particular, the proposed approach: (i) incorporates object motion models, (ii) explicitly estimates the object pose measurement uncertainty, and (iii) integrates the above two components in an online optimization-based estimator. We demonstrate that with appropriate outlier rejection and smoothing using the proposed factor graph approach, we can significantly improve the results on standardized pose estimation benchmarks. We experimentally validate the stability of the proposed approach for a feedback-based robot control task in which the object is tracked by the camera attached to a torque controlled manipulator.
- Abstract(参考訳): シングルビューのRGBオブジェクトポーズ推定器は、視覚に基づくロボット制御の優れた候補となる精度と効率のレベルに達した。
しかし、オフザシェルフ法は、安定したフィードバック制御のために必須となる時間的一貫性と堅牢性を欠いている。
本研究では、オブジェクトのポーズ推定の時間的一貫性を強制する因子グラフ手法を開発する。
特に、提案されたアプローチは以下のとおりである。
(i)オブジェクトの動作モデルを含む。
二 対象物が不確実性を測定することを明示的に推定し、
(iii) 上記の2つのコンポーネントをオンライン最適化ベースの推定器に統合する。
提案した因子グラフ手法を用いて,適切な外乱除去とスムース化を行うことで,標準化されたポーズ推定ベンチマークの結果を大幅に改善できることを実証する。
トルク制御マニピュレータに装着したカメラで物体をトラッキングするフィードバックベースロボット制御タスクにおいて,提案手法の安定性を実験的に検証する。
関連論文リスト
- ER-Pose: Rethinking Keypoint-Driven Representation Learning for Real-Time Human Pose Estimation [2.2248409468073143]
単一段階の多人数ポーズ推定は、人間の位置推定とキーポイント予測を共同で行うことを目的としている。
ボックス駆動単段ポーズ推定は、トレーニング中にバウンディングボックスの監督によって暗黙的に制限される。
本稿では,主予測目標に対するポーズ推定を高めるキーポイント駆動型学習パラダイムを提案する。
MS COCOとCrowdPoseでは、ER-Pose-nはプレトレーニングなしで3.2/6.7、プレトレーニングで7.4/4.9のAP改善を実現している。
論文 参考訳(メタデータ) (2026-03-09T17:49:46Z) - IoUCert: Robustness Verification for Anchor-based Object Detectors [58.35703549470485]
IoUCertは、アンカーベースのオブジェクト検出アーキテクチャにおいて、これらのボトルネックを克服するために設計された、新しい形式的検証フレームワークである。
本手法は, SSD, YOLOv2, YOLOv3など, 現実的なアンカーベースモデルの各種入力摂動に対するロバスト性検証を可能にする。
論文 参考訳(メタデータ) (2026-03-03T14:36:46Z) - Reliability-aware Execution Gating for Near-field and Off-axis Vision-guided Robotic Alignment [1.723545049436206]
実際のロボットシステムは、ポーズ推定が正確であるように見える場合でも、頻繁な実行障害に悩まされている。
このギャップは、プライシングの正確性だけでは実行レベルの信頼性を保証するには不十分であることを示している。
本稿では,実行レベルで動作する信頼性を考慮した実行ゲーティング機構を提案する。
論文 参考訳(メタデータ) (2026-02-09T10:14:39Z) - Color-Pair Guided Robust Zero-Shot 6D Pose Estimation and Tracking of Cluttered Objects on Edge Devices [4.261261166281339]
本稿では,エッジデバイス上での効率的な実行を目的とした統合フレームワークを提案する。
当社のアプローチの鍵は、ライトと不変なカラーペアの特徴表現の共有です。
最初の見積のために、この機能はライブRGB-Dビューとオブジェクトの3Dメッシュの間の堅牢な登録を容易にする。
追跡に関しては、同じ特徴論理が時間的対応を検証し、軽量モデルが物体の動きを確実に回帰させることができる。
論文 参考訳(メタデータ) (2025-09-28T05:07:49Z) - Aleatoric Uncertainty from AI-based 6D Object Pose Predictors for Object-relative State Estimation [4.516340427736994]
視覚に基づくオブジェクト相対ナビゲーションは、DLベースの6Dオブジェクトのポーズ予測器に依存して、ロボットの状態推定器の測定として、オブジェクトとロボットの間の相対的なポーズを提供する。
我々は、DL予測器の翻訳部と回転部から分離された2つの多層パーセプトロンを単純に含んで、既存のDLベースのオブジェクト相対ポーズ予測器を拡張することができることを示す。
論文 参考訳(メタデータ) (2025-09-01T16:12:10Z) - VICAN: Very Efficient Calibration Algorithm for Large Camera Networks [49.17165360280794]
ポースグラフ最適化手法を拡張する新しい手法を提案する。
我々は、カメラを含む二部グラフ、オブジェクトの動的進化、各ステップにおけるカメラオブジェクト間の相対変換について考察する。
我々のフレームワークは従来のPGOソルバとの互換性を維持しているが、その有効性はカスタマイズされた最適化方式の恩恵を受けている。
論文 参考訳(メタデータ) (2024-03-25T17:47:03Z) - Actively Learning Reinforcement Learning: A Stochastic Optimal Control Approach [3.453622106101339]
本研究では,2つの相互に結びついた目的を達成するための枠組みを提案する。 (i) 積極的な探索と意図的な情報収集を伴う強化学習と, (ii) 最適制御法の計算的難易度を克服する枠組みである。
我々は、強化学習を用いて最適制御則を計算することにより、両方の目的にアプローチする。
一定の探索と搾取バランスとは異なり、学習プロセスが終了しても、警告と探索はリアルタイムでコントローラによって自動的に行われる。
論文 参考訳(メタデータ) (2023-09-18T18:05:35Z) - Uncertainty-Aware Adaptation for Self-Supervised 3D Human Pose
Estimation [70.32536356351706]
本稿では、2つの出力ヘッドを2つの異なる構成にサブスクライブする共通のディープネットワークバックボーンを構成するMPP-Netを紹介する。
ポーズと関節のレベルで予測の不確実性を定量化するための適切な尺度を導出する。
本稿では,提案手法の総合評価を行い,ベンチマークデータセット上での最先端性能を示す。
論文 参考訳(メタデータ) (2022-03-29T07:14:58Z) - Dynamic Iterative Refinement for Efficient 3D Hand Pose Estimation [87.54604263202941]
本稿では,従来の推定値の修正に部分的レイヤを反復的に活用する,小さなディープニューラルネットワークを提案する。
学習したゲーティング基準を用いて、ウェイトシェアリングループから抜け出すかどうかを判断し、モデルにサンプルごとの適応を可能にする。
提案手法は,広く使用されているベンチマークの精度と効率の両面から,最先端の2D/3Dハンドポーズ推定手法より一貫して優れている。
論文 参考訳(メタデータ) (2021-11-11T23:31:34Z) - Kinematic-Structure-Preserved Representation for Unsupervised 3D Human
Pose Estimation [58.72192168935338]
大規模インスタディオデータセットの監視を用いて開発された人間のポーズ推定モデルの一般化可能性については疑問が残る。
本稿では,2対あるいは2対の弱い監督者によって抑制されない,新しいキネマティック構造保存型非教師付き3次元ポーズ推定フレームワークを提案する。
提案モデルでは,前方運動学,カメラ投影,空間マップ変換という3つの連続的な微分可能変換を用いる。
論文 参考訳(メタデータ) (2020-06-24T23:56:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。