論文の概要: A Bayesian framework for active object recognition, pose estimation and shape transfer learning through touch
- arxiv url: http://arxiv.org/abs/2409.06912v1
- Date: Tue, 10 Sep 2024 23:35:30 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-12 15:57:17.746295
- Title: A Bayesian framework for active object recognition, pose estimation and shape transfer learning through touch
- Title(参考訳): タッチによる能動物体認識・ポーズ推定・形状伝達学習のためのベイズ的枠組み
- Authors: Haodong Zheng, Andrei Jalba, Raymond H. Cuijpers, Wijnand IJsselsteijn, Sanne Schoenmakers,
- Abstract要約: 構造化されていない環境では、ロボットは既知のオブジェクトと新しいオブジェクトの両方に遭遇することができる。
本研究では,粒子フィルタ (PF) とガウス過程暗黙曲面 (GPIS) を統一ベイズ的枠組みに結合する。
このフレームワークは、既知のオブジェクトと新しいオブジェクトを区別し、オブジェクト認識を行い、既知のオブジェクトを推定し、未知のオブジェクトの形状を再構築することができる。
- 参考スコア(独自算出の注目度): 3.35643050085202
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As humans can explore and understand the world through the sense of touch, tactile sensing is also an important aspect of robotic perception. In unstructured environments, robots can encounter both known and novel objects, this calls for a method to address both known and novel objects. In this study, we combine a particle filter (PF) and Gaussian process implicit surface (GPIS) in a unified Bayesian framework. The framework can differentiate between known and novel objects, perform object recognition, estimate pose for known objects, and reconstruct shapes for unknown objects, in an active learning fashion. By grounding the selection of the GPIS prior with the maximum-likelihood-estimation (MLE) shape from the PF, the knowledge about known objects' shapes can be transferred to learn novel shapes. An exploration procedure with global shape estimation is proposed to guide active data acquisition and conclude the exploration when sufficient information is obtained. The performance of the proposed Bayesian framework is evaluated through simulations on known and novel objects, initialized with random poses and is compared with a rapidly explore random tree (RRT).The results show that the proposed exploration procedure, utilizing global shape estimation, achieves faster exploration than the RRT-based local exploration procedure. Overall, results indicate that the proposed framework is effective and efficient in object recognition, pose estimation and shape reconstruction. Moreover, we show that a learned shape can be included as a new prior and used effectively for future object recognition and pose estimation of novel objects.
- Abstract(参考訳): 人間は触覚によって世界を探索し、理解することができるので、触覚はロボット知覚の重要な側面でもある。
構造化されていない環境では、ロボットは既知のオブジェクトと新しいオブジェクトの両方に遭遇し、既知のオブジェクトと新しいオブジェクトの両方に対処する方法を要求する。
本研究では,粒子フィルタ (PF) とガウス過程暗黙曲面 (GPIS) を統一ベイズ的枠組みに結合する。
このフレームワークは、既知のオブジェクトと新しいオブジェクトを区別し、オブジェクト認識を行い、既知のオブジェクトを推定し、未知のオブジェクトの形状をアクティブな学習方法で再構築することができる。
PFから最大形推定(MLE)形状に先立ってGPISを選択することにより、既知の物体の形状に関する知識を移譲し、新しい形状を学ぶことができる。
大域的な形状推定による探索手法を提案し,十分な情報が得られると,その探索を導出する。
提案したベイズフレームワークの性能は,未知のオブジェクトと新しいオブジェクトのシミュレーションによって評価され,ランダムなポーズで初期化され,高速探索ランダムツリー(RRT)と比較される。
その結果, グローバルな形状推定手法を用いて, RRTによる局所探査よりも高速な探査を行うことができた。
その結果,提案手法はオブジェクト認識,ポーズ推定,形状復元において有効かつ効率的であることが示唆された。
さらに、学習した形状を新しい先行要素として含め、将来のオブジェクト認識や新しいオブジェクトのポーズ推定に効果的に使用できることを示す。
関連論文リスト
- Leveraging Foundation Models To learn the shape of semi-fluid deformable objects [0.7895162173260983]
過去10年間、非流動性のある変形可能な物体を特徴付け、操作する研究者によって強い関心が浮かび上がった。
本稿では,動作制御対象の情報として機能する安定な特徴を定義するために,溶接プールの特徴付けの課題に対処する。
基礎モデルからより小さな生成モデルへの知識蒸留の性能は、変形可能な物体のキャラクタリゼーションにおいて顕著な結果を示す。
論文 参考訳(メタデータ) (2024-11-25T13:41:35Z) - Cyclic Refiner: Object-Aware Temporal Representation Learning for Multi-View 3D Detection and Tracking [37.186306646752975]
マルチビュー3次元検出・追跡タスクのための統合オブジェクト認識時間学習フレームワークを提案する。
提案モデルでは,異なる設計のベースラインよりも一貫した性能向上を実現している。
論文 参考訳(メタデータ) (2024-07-03T16:10:19Z) - CPPF++: Uncertainty-Aware Sim2Real Object Pose Estimation by Vote Aggregation [67.12857074801731]
そこで本研究では,シミュレートからリアルなポーズ推定のための新しい手法であるCPPF++を提案する。
投票衝突による課題に対処するため,投票の不確実性をモデル化する新たなアプローチを提案する。
ノイズの多いペアフィルタリング、オンラインアライメント最適化、機能アンサンブルなど、いくつかの革新的なモジュールを組み込んでいます。
論文 参考訳(メタデータ) (2022-11-24T03:27:00Z) - Generative Category-Level Shape and Pose Estimation with Semantic
Primitives [27.692997522812615]
本稿では,1枚のRGB-D画像からカテゴリレベルのオブジェクト形状とポーズ推定を行う新しいフレームワークを提案する。
カテゴリ内変動に対処するために、様々な形状を統一された潜在空間にエンコードするセマンティックプリミティブ表現を採用する。
提案手法は,実世界のデータセットにおいて,SOTAのポーズ推定性能とより優れた一般化を実現する。
論文 参考訳(メタデータ) (2022-10-03T17:51:54Z) - Learning to Complete Object Shapes for Object-level Mapping in Dynamic
Scenes [30.500198859451434]
本研究では,動的シーンにおけるオブジェクトの分割,追跡,再構築を同時に行うオブジェクトレベルのマッピングシステムを提案する。
さらに、深度入力とカテゴリレベルの前の形状からの再構成を条件にすることで、完全なジオメトリを予測し、完成させることができる。
実世界の合成シーケンスと実世界のシーケンスの両方で定量的に定性的にテストすることで,その有効性を評価する。
論文 参考訳(メタデータ) (2022-08-09T22:56:33Z) - DcnnGrasp: Towards Accurate Grasp Pattern Recognition with Adaptive
Regularizer Learning [13.08779945306727]
現在の最先端手法は、パターン認識に不可欠なオブジェクトのカテゴリ情報を無視している。
本稿では,物体分類と把握パターン認識の連成学習を実現するために,二分岐畳み込みニューラルネットワーク(DcnnGrasp)を提案する。
論文 参考訳(メタデータ) (2022-05-11T00:34:27Z) - Information-Theoretic Odometry Learning [83.36195426897768]
生体計測推定を目的とした学習動機付け手法のための統合情報理論フレームワークを提案する。
提案フレームワークは情報理論言語の性能評価と理解のためのエレガントなツールを提供する。
論文 参考訳(メタデータ) (2022-03-11T02:37:35Z) - Active 3D Shape Reconstruction from Vision and Touch [66.08432412497443]
人間は、視覚と触覚を共同で利用して、活発な物体探索を通じて世界の3D理解を構築する。
3次元形状の再構成では、最新の進歩はRGB画像、深度マップ、触覚読影などの限られた感覚データの静的データセットに依存している。
1)高空間分解能視覚に基づく触覚センサを応用した3次元物体のアクティブタッチに活用した触覚シミュレータ,2)触覚やビジュオクティビティルを先導するメッシュベースの3次元形状再構成モデル,3)触覚やビジュオのいずれかを用いたデータ駆動型ソリューションのセットからなるシステムを導入する。
論文 参考訳(メタデータ) (2021-07-20T15:56:52Z) - DONet: Learning Category-Level 6D Object Pose and Size Estimation from
Depth Observation [53.55300278592281]
単一深度画像からカテゴリレベルの6次元オブジェクト・ポースとサイズ推定(COPSE)を提案する。
筆者らのフレームワークは,深度チャネルのみの物体のリッチな幾何学的情報に基づいて推論を行う。
我々のフレームワークは、ラベル付き現実世界の画像を必要とする最先端のアプローチと競合する。
論文 参考訳(メタデータ) (2021-06-27T10:41:50Z) - Locally Aware Piecewise Transformation Fields for 3D Human Mesh
Registration [67.69257782645789]
本論文では,3次元変換ベクトルを学習し,提案空間内の任意のクエリ点をリザーブ空間内の対応する位置にマップする部分変換場を提案する。
パラメトリックモデルにネットワークのポーズを合わせることで、特に極端なポーズにおいて、より優れた登録品質が得られることを示す。
論文 参考訳(メタデータ) (2021-04-16T15:16:09Z) - Surface Warping Incorporating Machine Learning Assisted Domain
Likelihood Estimation: A New Paradigm in Mine Geology Modelling and
Automation [68.8204255655161]
新たに取得した破砕孔データによって課される地球化学的および空間的制約に基づいて, モデル表面を再構成するバイーシアンワープ法が提案されている。
本稿では,このワーピングフレームワークに機械学習を組み込むことにより,可能性の一般化を図る。
その基礎は、p(g|c) が p(y(c)|g と似た役割を果たすような地質領域の確率のベイズ計算によって構成される。
論文 参考訳(メタデータ) (2021-02-15T10:37:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。