論文の概要: Local-HDP: Interactive Open-Ended 3D Object Categorization in Real-Time
Robotic Scenarios
- arxiv url: http://arxiv.org/abs/2009.01152v3
- Date: Sun, 11 Apr 2021 17:58:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-22 18:34:04.911417
- Title: Local-HDP: Interactive Open-Ended 3D Object Categorization in Real-Time
Robotic Scenarios
- Title(参考訳): local-hdp:リアルタイムロボットシナリオにおけるインタラクティブな3dオブジェクト分類
- Authors: H. Ayoobi, H. Kasaei, M. Cao, R. Verbrugge, B. Verheij
- Abstract要約: 局所階層ディリクレ過程 (Local-HDP) と呼ばれるオープンな3次元オブジェクト分類のための非パラメトリック階層的ベイズ的アプローチを導入する。
この方法により、エージェントは各カテゴリの独立したトピックを段階的に学習し、時間内に環境に適応することができる。
実験により, 提案手法は, 精度, スケーラビリティ, メモリ効率の面で他の最先端手法よりも高い性能を示した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce a non-parametric hierarchical Bayesian approach for open-ended
3D object categorization, named the Local Hierarchical Dirichlet Process
(Local-HDP). This method allows an agent to learn independent topics for each
category incrementally and to adapt to the environment in time. Hierarchical
Bayesian approaches like Latent Dirichlet Allocation (LDA) can transform
low-level features to high-level conceptual topics for 3D object
categorization. However, the efficiency and accuracy of LDA-based approaches
depend on the number of topics that is chosen manually. Moreover, fixing the
number of topics for all categories can lead to overfitting or underfitting of
the model. In contrast, the proposed Local-HDP can autonomously determine the
number of topics for each category. Furthermore, the online variational
inference method has been adapted for fast posterior approximation in the
Local-HDP model. Experiments show that the proposed Local-HDP method
outperforms other state-of-the-art approaches in terms of accuracy,
scalability, and memory efficiency by a large margin. Moreover, two robotic
experiments have been conducted to show the applicability of the proposed
approach in real-time applications.
- Abstract(参考訳): 局所階層ディリクレプロセス (Local-HDP) と呼ばれるオープンな3次元オブジェクト分類のための非パラメトリック階層的ベイズ的アプローチを導入する。
この方法により、エージェントは各カテゴリの独立したトピックを段階的に学習し、時間内に環境に適応することができる。
latent dirichlet allocation(lda)のような階層的ベイズ的アプローチは、3dオブジェクトの分類のために低レベルな特徴を高レベルな概念トピックに変換することができる。
しかし、LDAベースのアプローチの効率と精度は、手動で選択されるトピックの数に依存する。
さらに、すべてのカテゴリのトピック数を固定すると、モデルのオーバーフィットやオーバーフィットにつながる可能性がある。
対照的に,提案するローカルhdpは,各カテゴリのトピック数を自律的に決定できる。
さらに, オンライン変分推定法は, 局所hdpモデルの高速後続近似に適応している。
実験により, 提案手法は, 精度, スケーラビリティ, メモリ効率の面で他の最先端手法よりも高い性能を示した。
さらに,提案手法のリアルタイム応用への適用性を示すため,ロボット実験を2回実施した。
関連論文リスト
- ALSTER: A Local Spatio-Temporal Expert for Online 3D Semantic
Reconstruction [62.599588577671796]
本稿では,RGB-Dフレームのストリームから3次元セマンティックマップを段階的に再構成するオンライン3次元セマンティックセマンティックセマンティクス手法を提案する。
オフラインの手法とは異なり、ロボット工学や混合現実のようなリアルタイムな制約のあるシナリオに直接適用できます。
論文 参考訳(メタデータ) (2023-11-29T20:30:18Z) - Temporal Action Localization with Enhanced Instant Discriminability [66.76095239972094]
時間的行動検出(TAD)は、すべての行動境界とその対応するカテゴリを、トリミングされていないビデオで検出することを目的としている。
本稿では,既存の手法による動作境界の不正確な予測を解決するために,TriDetという一段階のフレームワークを提案する。
実験結果から,複数のTADデータセット上でのTriDetの堅牢性と最先端性能が示された。
論文 参考訳(メタデータ) (2023-09-11T16:17:50Z) - Hierarchical Spatio-Temporal Representation Learning for Gait
Recognition [6.877671230651998]
歩行認識は、個人を独自の歩行スタイルで識別する生体計測技術である。
粗いものから細かいものまで歩行特徴を抽出する階層的時間的表現学習フレームワークを提案する。
本手法は,モデル精度と複雑性の適切なバランスを維持しつつ,最先端の手法よりも優れる。
論文 参考訳(メタデータ) (2023-07-19T09:30:00Z) - Subequivariant Graph Reinforcement Learning in 3D Environments [34.875774768800966]
本稿では,3次元環境における変分グラフRL(Subequivariant Graph RL)という,形態に依存しないRLの新たなセットアップを提案する。
具体的には、まず3D空間でより実用的で挑戦的なベンチマークを新たに導入する。
拡張状態-作用空間上のポリシーを最適化するために,幾何対称性を注入することを提案する。
論文 参考訳(メタデータ) (2023-05-30T11:34:57Z) - Explain What You See: Open-Ended Segmentation and Recognition of
Occluded 3D Objects [0.0]
局所HDPの柔軟性を有する3次元オブジェクト分割法を提案する。
提案手法は,より少ない数の学習インスタンスを用いて,連合間の平均交叉率が高いことを示す。
得られたモデルが3次元オブジェクトカテゴリ認識タスクに対して明確な説明セットを生成することを示す。
論文 参考訳(メタデータ) (2023-01-17T17:43:46Z) - CPPF++: Uncertainty-Aware Sim2Real Object Pose Estimation by Vote Aggregation [67.12857074801731]
そこで本研究では,シミュレートからリアルなポーズ推定のための新しい手法であるCPPF++を提案する。
投票衝突による課題に対処するため,投票の不確実性をモデル化する新たなアプローチを提案する。
ノイズの多いペアフィルタリング、オンラインアライメント最適化、機能アンサンブルなど、いくつかの革新的なモジュールを組み込んでいます。
論文 参考訳(メタデータ) (2022-11-24T03:27:00Z) - ProposalContrast: Unsupervised Pre-training for LiDAR-based 3D Object
Detection [114.54835359657707]
ProposalContrastは、教師なしのポイントクラウド事前トレーニングフレームワークである。
地域提案と対比することで、堅牢な3D表現を学習する。
ProposalContrastは様々な3D検出器で検証される。
論文 参考訳(メタデータ) (2022-07-26T04:45:49Z) - LocATe: End-to-end Localization of Actions in 3D with Transformers [91.28982770522329]
LocATeは、3Dシーケンスでアクションを共同でローカライズし認識するエンドツーエンドのアプローチである。
画像やパッチの特徴を入力として考えるトランスフォーマーベースのオブジェクト検出や分類モデルとは異なり、LocATeのトランスフォーマーモデルはシーケンス内のアクション間の長期的な相関をキャプチャすることができる。
BABEL-TAL-20 (BT20) という新しい,挑戦的で,より現実的なベンチマークデータセットを導入する。
論文 参考訳(メタデータ) (2022-03-21T03:35:32Z) - A Probabilistic Framework for Dynamic Object Recognition in 3D
Environment With A Novel Continuous Ground Estimation Method [0.0]
3次元環境における動的物体認識のための確率的フレームワークを開発し提案する。
ガウス過程回帰(GPR)に基づく新しい手法が開発され、異なる都市シナリオにおける接地点を検出する。
論文 参考訳(メタデータ) (2022-01-27T16:07:10Z) - Pareto-wise Ranking Classifier for Multi-objective Evolutionary Neural
Architecture Search [15.454709248397208]
本研究は,多様な設計目的の下で実現可能な深層モデルを見つける方法に焦点を当てる。
オンライン分類器を訓練し、候補と構築された参照アーキテクチャとの優位性関係を予測する。
さまざまな目的や制約の下で、2Mから6Mまでの異なるモデルサイズを持つ多数のニューラルアーキテクチャを見つけます。
論文 参考訳(メタデータ) (2021-09-14T13:28:07Z) - Dynamic Convolution for 3D Point Cloud Instance Segmentation [146.7971476424351]
動的畳み込みに基づく3次元点雲からのインスタンスセグメンテーション手法を提案する。
我々は、同じ意味圏と閉投票を持つ等質点を幾何学的遠近点に対して収集する。
提案手法は提案不要であり、代わりに各インスタンスの空間的および意味的特性に適応する畳み込みプロセスを利用する。
論文 参考訳(メタデータ) (2021-07-18T09:05:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。