論文の概要: Probabilistic 3D Multilabel Real-time Mapping for Multi-object
Manipulation
- arxiv url: http://arxiv.org/abs/2001.05752v1
- Date: Thu, 16 Jan 2020 12:00:20 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-11 00:47:32.338446
- Title: Probabilistic 3D Multilabel Real-time Mapping for Multi-object
Manipulation
- Title(参考訳): 多目的マニピュレーションのための確率的3次元マルチラベルリアルタイムマッピング
- Authors: Kentaro Wada, Kei Okada, Masayuki Inaba
- Abstract要約: マルチラベルの占有率を持つ3次元地図をリアルタイムに生成する手法を提案する。
本手法は,39個の異なるオブジェクトでセグメント化精度を検証し,複数のオブジェクトの操作タスクに適用することによって評価する。
- 参考スコア(独自算出の注目度): 28.45734662893933
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Probabilistic 3D map has been applied to object segmentation with multiple
camera viewpoints, however, conventional methods lack of real-time efficiency
and functionality of multilabel object mapping. In this paper, we propose a
method to generate three-dimensional map with multilabel occupancy in
real-time. Extending our previous work in which only target label occupancy is
mapped, we achieve multilabel object segmentation in a single looking around
action. We evaluate our method by testing segmentation accuracy with 39
different objects, and applying it to a manipulation task of multiple objects
in the experiments. Our mapping-based method outperforms the conventional
projection-based method by 40 - 96\% relative (12.6 mean $IU_{3d}$), and robot
successfully recognizes (86.9\%) and manipulates multiple objects (60.7\%) in
an environment with heavy occlusions.
- Abstract(参考訳): 確率的3Dマップは、複数のカメラ視点を持つオブジェクトセグメンテーションに適用されているが、従来の手法では、マルチラベルオブジェクトマッピングのリアルタイム効率と機能に欠けていた。
本稿では,マルチラベル空間を有する3次元地図をリアルタイムに生成する手法を提案する。
対象ラベルの占有率のみをマップしたこれまでの作業を拡張して,アクションを回避して複数ラベルオブジェクトのセグメンテーションを実現する。
実験では,39個の異なるオブジェクトでセグメント化精度を検証し,複数のオブジェクトの操作タスクに適用して評価を行った。
本手法は従来の投影法に比べて40~96 %の相対性(12.6 は$IU_{3d}$)で優れており,ロボットは重閉塞環境下で複数の物体(60.7 %)を認識・操作する。
関連論文リスト
- PickScan: Object discovery and reconstruction from handheld interactions [99.99566882133179]
シーンの3次元表現を再構成する対話誘導型クラス依存型手法を開発した。
我々の主な貢献は、操作対象のインタラクションを検出し、操作対象のマスクを抽出する新しいアプローチである。
相互作用ベースとクラス非依存のベースラインであるCo-Fusionと比較すると、これはシャムファー距離の73%の減少に相当する。
論文 参考訳(メタデータ) (2024-11-17T23:09:08Z) - CVAM-Pose: Conditional Variational Autoencoder for Multi-Object Monocular Pose Estimation [3.5379836919221566]
剛体物体のポーズを推定することはコンピュータビジョンの基本的な問題の一つである。
本稿では,多目的単分子ポーズ推定のための新しいアプローチCVAM-Poseを提案する。
論文 参考訳(メタデータ) (2024-10-11T17:26:27Z) - Multi-label affordance mapping from egocentric vision [3.683202928838613]
本稿では, 精度の高い多ラベルセグメンテーションを実現するために, 空き感に対する新しいアプローチを提案する。
我々の手法は、ファースト・パーソン・ビデオから空き地を自動的に抽出するために利用できる。
相互作用ホットスポットのマップを構築するために、メトリック表現をどのように活用できるかを示します。
論文 参考訳(メタデータ) (2023-09-05T10:56:23Z) - Linear Object Detection in Document Images using Multiple Object
Tracking [58.720142291102135]
線形オブジェクトは文書構造に関する実質的な情報を伝達する。
多くのアプローチはベクトル表現を復元できるが、1994年に導入された1つのクローズドソース技術のみである。
複数オブジェクト追跡を用いた文書画像中の線形オブジェクトの正確なインスタンスセグメンテーションのためのフレームワークを提案する。
論文 参考訳(メタデータ) (2023-05-26T14:22:03Z) - Unseen Object 6D Pose Estimation: A Benchmark and Baselines [62.8809734237213]
本稿では,新しい物体の6次元ポーズ推定をアルゴリズムで行えるようにするための新しいタスクを提案する。
実画像と合成画像の両方でデータセットを収集し、テストセットで最大48個の未確認オブジェクトを収集する。
エンド・ツー・エンドの3D対応ネットワークをトレーニングすることにより、未確認物体と部分ビューRGBD画像との対応点を高精度かつ効率的に見つけることができる。
論文 参考訳(メタデータ) (2022-06-23T16:29:53Z) - Associating Objects with Transformers for Video Object Segmentation [74.51719591192787]
本稿では,複数のオブジェクトを一様に一致・復号化するためのAssociating Objects with Transformers (AOT)アプローチを提案する。
AOTは複数のターゲットを同一の高次元埋め込み空間に関連付けるための識別機構を用いる。
第3回大規模ビデオオブジェクトチャレンジでは1位にランクインした。
論文 参考訳(メタデータ) (2021-06-04T17:59:57Z) - Objects are Different: Flexible Monocular 3D Object Detection [87.82253067302561]
そこで本研究では,乱れたオブジェクトを明示的に分離し,オブジェクト深度推定のための複数のアプローチを適応的に組み合わせたモノクル3次元オブジェクト検出のためのフレキシブルなフレームワークを提案する。
実験の結果,本手法はkittiベンチマークテストセットにおいて,中等度レベルが27%,硬度が30%と,最先端法を27%上回った。
論文 参考訳(メタデータ) (2021-04-06T07:01:28Z) - Few-Shot Object Detection and Viewpoint Estimation for Objects in the
Wild [40.132988301147776]
少数ショットオブジェクト検出と少数ショット視点推定の問題に対処する。
両タスクにおいて,データから抽出したクラス表現機能を用いて,ネットワーク予測を導出する利点を実証する。
提案手法は,様々なデータセットに対して,最先端の手法よりも広いマージンで性能を向上する。
論文 参考訳(メタデータ) (2020-07-23T16:17:25Z) - A Transductive Approach for Video Object Segmentation [55.83842083823267]
半教師付きビデオオブジェクトセグメンテーションは、第1フレームのマスクを考えると、対象オブジェクトをビデオシーケンスから分離することを目的としている。
現在の一般的な手法のほとんどは、光学フローやインスタンスセグメンテーションといった他の領域で訓練された追加モジュールの情報を利用する。
本稿では,モジュールやデータセット,専用のアーキテクチャ設計を必要としない,単純かつ強力なトランスダクティブ手法を提案する。
論文 参考訳(メタデータ) (2020-04-15T16:39:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。