論文の概要: Object-Pose Estimation With Neural Population Codes
- arxiv url: http://arxiv.org/abs/2502.13403v2
- Date: Tue, 11 Mar 2025 23:24:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-13 15:34:45.170947
- Title: Object-Pose Estimation With Neural Population Codes
- Title(参考訳): ニューラルポピュレーション符号を用いたオブジェクトパス推定
- Authors: Heiko Hoffmann, Richard Hoffmann,
- Abstract要約: オブジェクト対称性は、感覚入力のオブジェクト回転への直接マッピングを複雑にする。
ニューラルネットワークによる物体回転の表現は,これらの制限を克服することを示す。
我々は、Apple M1 CPU上で3.2ミリ秒で推論を行う。
- 参考スコア(独自算出の注目度): 4.557963624437784
- License:
- Abstract: Robotic assembly tasks require object-pose estimation, particularly for tasks that avoid costly mechanical constraints. Object symmetry complicates the direct mapping of sensory input to object rotation, as the rotation becomes ambiguous and lacks a unique training target. Some proposed solutions involve evaluating multiple pose hypotheses against the input or predicting a probability distribution, but these approaches suffer from significant computational overhead. Here, we show that representing object rotation with a neural population code overcomes these limitations, enabling a direct mapping to rotation and end-to-end learning. As a result, population codes facilitate fast and accurate pose estimation. On the T-LESS dataset, we achieve inference in 3.2 milliseconds on an Apple M1 CPU and a Maximum Symmetry-Aware Surface Distance accuracy of 84.7% using only gray-scale image input, compared to 69.7% accuracy when directly mapping to pose.
- Abstract(参考訳): ロボット組立タスクは、特にコストのかかる機械的制約を避けるタスクに対して、対象物の推定を必要とする。
物体対称性は、回転が曖昧になり、ユニークな訓練対象が欠如しているため、感覚入力の物体回転への直接マッピングを複雑にする。
提案手法には、入力に対する複数のポーズ仮説の評価や確率分布の予測などが含まれるが、これらの手法は計算上のオーバーヘッドがかなり大きい。
ここでは、物体の回転をニューラルネットワークで表現することで、これらの制限を克服し、回転への直接マッピングとエンドツーエンドの学習を可能にすることを示す。
結果として、人口コードは素早く正確なポーズ推定を容易にする。
T-LESSデータセットでは、Apple M1 CPU上で3.2ミリ秒で、グレースケールの画像入力のみを使用して、最大対称性を意識した表面距離の精度が84.7%であるのに対し、直接ポーズにマッピングする場合の精度は69.7%である。
関連論文リスト
- SEMPose: A Single End-to-end Network for Multi-object Pose Estimation [13.131534219937533]
SEMPoseは、エンドツーエンドの多目的ポーズ推定ネットワークである。
RGB画像以外の入力を必要とせずに32FPSで推論を行うことができる。
複数のオブジェクトのポーズをリアルタイムで正確に推定でき、対象オブジェクトの数の影響を受けない推論時間に影響を及ぼす。
論文 参考訳(メタデータ) (2024-11-21T10:37:54Z) - DVMNet: Computing Relative Pose for Unseen Objects Beyond Hypotheses [59.51874686414509]
現在のアプローチは、多数の離散的なポーズ仮説を持つ連続的なポーズ表現を近似している。
本稿では,DVMNet(Deep Voxel Matching Network)を提案する。
提案手法は,最先端の手法に比べて計算コストの低い新しいオブジェクトに対して,より正確なポーズ推定を行う。
論文 参考訳(メタデータ) (2024-03-20T15:41:32Z) - Multi-View Keypoints for Reliable 6D Object Pose Estimation [12.436320203635143]
熱マップとキーポイントの推定値を3次元空間上の確率密度マップに結合する新しい多視点手法を提案する。
本研究では, 様々な難易度, 反射率の異なる物体に対して, 約0.5mm, 2°の平均ポーズ推定誤差を示す。
論文 参考訳(メタデータ) (2023-03-29T16:28:11Z) - Ambiguity-Aware Multi-Object Pose Optimization for Visually-Assisted
Robot Manipulation [17.440729138126162]
あいまいさを意識した6Dオブジェクトポーズ推定ネットワークPrimA6D++を汎用的不確実性予測手法として提案する。
提案手法は,T-LESS と YCB-Video のデータセットの性能向上を示す。
さらに,視覚支援ロボット操作のためのリアルタイムシーン認識機能を示す。
論文 参考訳(メタデータ) (2022-11-02T08:57:20Z) - Instance-specific 6-DoF Object Pose Estimation from Minimal Annotations [6.24717069374781]
本稿では,単一のRGB画像からオブジェクトの連続6-DoFポーズを推定するためのパイプラインを高速に訓練し,デプロイする方法を提案する。
キーとなるアイデアは、既知のカメラのポーズと剛体形状を利用して、大きなラベル付きデータセットの生成を部分的に自動化することだ。
データセットは十分なドメインランダム化とともに、セマンティックキーポイントを予測するためのディープニューラルネットワークのトレーニングを監督するために使用される。
論文 参考訳(メタデータ) (2022-07-27T03:00:28Z) - Uncertainty-Aware Camera Pose Estimation from Points and Lines [101.03675842534415]
Perspective-n-Point-and-Line (Pn$PL) は、2D-3D特徴座標の3Dモデルに関して、高速で正確で堅牢なカメラローカライゼーションを目指している。
論文 参考訳(メタデータ) (2021-07-08T15:19:36Z) - Locally Aware Piecewise Transformation Fields for 3D Human Mesh
Registration [67.69257782645789]
本論文では,3次元変換ベクトルを学習し,提案空間内の任意のクエリ点をリザーブ空間内の対応する位置にマップする部分変換場を提案する。
パラメトリックモデルにネットワークのポーズを合わせることで、特に極端なポーズにおいて、より優れた登録品質が得られることを示す。
論文 参考訳(メタデータ) (2021-04-16T15:16:09Z) - Spatial Attention Improves Iterative 6D Object Pose Estimation [52.365075652976735]
本稿では,RGB画像を用いた6次元ポーズ推定の改良手法を提案する。
私たちの主な洞察力は、最初のポーズ推定の後、オブジェクトの異なる空間的特徴に注意を払うことが重要です。
実験により,このアプローチが空間的特徴に順応することを学び,被写体の一部を無視することを学び,データセット間でのポーズ推定を改善することを実証した。
論文 参考訳(メタデータ) (2021-01-05T17:18:52Z) - Fast Uncertainty Quantification for Deep Object Pose Estimation [91.09217713805337]
深層学習に基づくオブジェクトポーズ推定は、しばしば信頼できない、自信過剰である。
本研究では,6-DoFオブジェクトのポーズ推定のための,シンプルで効率的かつプラグアンドプレイなUQ手法を提案する。
論文 参考訳(メタデータ) (2020-11-16T06:51:55Z) - Robust 6D Object Pose Estimation by Learning RGB-D Features [59.580366107770764]
本稿では、この局所最適問題を解くために、回転回帰のための離散連続的な新しい定式化を提案する。
我々はSO(3)の回転アンカーを均一にサンプリングし、各アンカーから目標への制約付き偏差を予測し、最適な予測を選択するための不確実性スコアを出力する。
LINEMOD と YCB-Video の2つのベンチマーク実験により,提案手法が最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2020-02-29T06:24:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。