Fugu-MT 論文翻訳(概要): Real-time 3D object proposal generation and classification under limited processing resources

論文の概要: Real-time 3D object proposal generation and classification under limited processing resources

arxiv url: http://arxiv.org/abs/2003.10670v1
Date: Tue, 24 Mar 2020 05:36:53 GMT
ステータス: 翻訳完了
システム内更新日: 2022-12-20 09:36:16.756223
Title: Real-time 3D object proposal generation and classification under limited processing resources
Title（参考訳）: 限られた処理資源下でのリアルタイム3次元オブジェクト提案生成と分類
Authors: Xuesong Li, Jose Guivant, Subhan Khan
Abstract要約: 本稿では,3次元提案生成と分類による効率的な検出手法を提案する。実験により, 点雲からのリアルタイム3次元物体検出手法の有効性を実証した。
参考スコア（独自算出の注目度）: 1.6242924916178285
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The task of detecting 3D objects is important to various robotic applications. The existing deep learning-based detection techniques have achieved impressive performance. However, these techniques are limited to run with a graphics processing unit (GPU) in a real-time environment. To achieve real-time 3D object detection with limited computational resources for robots, we propose an efficient detection method consisting of 3D proposal generation and classification. The proposal generation is mainly based on point segmentation, while the proposal classification is performed by a lightweight convolution neural network (CNN) model. To validate our method, KITTI datasets are utilized. The experimental results demonstrate the capability of proposed real-time 3D object detection method from the point cloud with a competitive performance of object recall and classification.
Abstract（参考訳）: 3Dオブジェクトを検出するタスクは、さまざまなロボットアプリケーションにとって重要である。既存のディープラーニングベースの検出技術は、素晴らしいパフォーマンスを達成した。しかし、これらの技術はリアルタイム環境でグラフィックス処理ユニット(GPU)でしか動作しない。ロボットの計算資源を限定したリアルタイム3次元物体検出を実現するため,3次元提案生成と分類からなる効率的な検出手法を提案する。提案生成は主にポイントセグメンテーションに基づいており、提案分類は軽量畳み込みニューラルネットワーク(CNN)モデルによって行われる。提案手法を検証するために,KITTIデータセットを利用する。実験結果は,実時間3次元物体検出手法をポイントクラウドから提案し,オブジェクトのリコールと分類の競合性を示す。

関連論文リスト

MonoLite3D: Lightweight 3D Object Properties Estimation [2.895737747670724]
本稿では,限られたリソースを持つハードウェア環境向けに設計された組み込みデバイスフレンドリーな軽量ディープラーニング手法であるMonoLite3Dネットワークを紹介する。 MonoLite3Dネットワークは、3Dオブジェクトの複数の特性を推定することに焦点を当てた最先端技術である。
論文参考訳（メタデータ） (2025-03-04T02:31:09Z)
STONE: A Submodular Optimization Framework for Active 3D Object Detection [20.54906045954377]
正確な3Dオブジェクト検出器をトレーニングするための鍵となる要件は、大量のLiDARベースのポイントクラウドデータが利用できることである。本稿では,3次元物体検出装置のトレーニングにおけるラベル付けコストを大幅に削減する,統合されたアクティブな3次元物体検出フレームワークを提案する。
論文参考訳（メタデータ） (2024-10-04T20:45:33Z)
OccupancyDETR: Using DETR for Mixed Dense-sparse 3D Occupancy Prediction [10.87136340580404]
視覚に基づく3Dセマンティック占有感は、自動運転車を含むロボティクスにとって重要な技術である。本稿では,DTRのような物体検出技術を用いた3次元意味的占有認識手法OccupancyDETRを提案する。提案手法は, 効率と精度のバランスをとっており, より高速な推測時間, リソース消費の低減, 小型物体検出の性能向上を実現している。
論文参考訳（メタデータ） (2023-09-15T16:06:23Z)
DETR4D: Direct Multi-View 3D Object Detection with Sparse Attention [50.11672196146829]
サラウンドビュー画像を用いた3次元物体検出は、自動運転にとって必須の課題である。マルチビュー画像における3次元オブジェクト検出のためのスパースアテンションと直接特徴クエリを探索するトランスフォーマーベースのフレームワークであるDETR4Dを提案する。
論文参考訳（メタデータ） (2022-12-15T14:18:47Z)
RandomRooms: Unsupervised Pre-training from Synthetic Shapes and Randomized Layouts for 3D Object Detection [138.2892824662943]
有望な解決策は、CADオブジェクトモデルで構成される合成データセットをよりよく利用して、実際のデータセットでの学習を促進することである。最近の3次元事前学習の研究は、合成物体から他の実世界の応用へ学習した伝達特性が失敗することを示している。本研究では,この目的を達成するためにRandomRoomsという新しい手法を提案する。
論文参考訳（メタデータ） (2021-08-17T17:56:12Z)
High-level camera-LiDAR fusion for 3D object detection with machine learning [0.0]
本稿では,自律運転などの応用において重要な3次元物体検出問題に取り組む。モノクロカメラとLiDARデータを組み合わせた機械学習パイプラインを使用して、動くプラットフォームの周囲の3D空間内の車両を検出する。本結果は,検証セットに対して効率よく精度の高い推定を行い,全体の精度は87.1%となった。
論文参考訳（メタデータ） (2021-05-24T01:57:34Z)
Analysis of voxel-based 3D object detection methods efficiency for real-time embedded systems [93.73198973454944]
本稿では, ボクセルをベースとした2つの3次元物体検出手法について述べる。実験の結果,これらの手法は入力点雲が遠距離にあるため,遠距離の小さな物体を検出できないことが確認できた。この結果から,既存手法の計算のかなりの部分は,検出に寄与しないシーンの位置に着目していることが示唆された。
論文参考訳（メタデータ） (2021-05-21T12:40:59Z)
Learnable Online Graph Representations for 3D Multi-Object Tracking [156.58876381318402]
3D MOT問題に対する統一型学習型アプローチを提案します。我々は、完全にトレーニング可能なデータアソシエーションにNeural Message Passing Networkを使用します。 AMOTAの65.6%の最先端性能と58%のIDスウィッチを達成して、公開可能なnuScenesデータセットに対する提案手法のメリットを示す。
論文参考訳（メタデータ） (2021-04-23T17:59:28Z)
Seeing by haptic glance: reinforcement learning-based 3D object Recognition [31.80213713136647]
対象物と指の間の触覚接触数に制限があり、対象物を見ることなく3D認識を行うことができる。この能力は認知神経科学における「触覚的視線」と定義される。既存の3D認識モデルのほとんどは、高密度な3Dデータに基づいて開発された。触覚探索によって3Dデータを収集するためにロボットが使用される多くの実生活のユースケースでは、限られた数の3Dポイントしか収集できない。アクティブに収集された3Dで客観的な3D認識と同時に触覚探査手順を最適化する新しい強化学習ベースのフレームワークが提案される。
論文参考訳（メタデータ） (2021-02-15T15:38:22Z)
Achieving Real-Time LiDAR 3D Object Detection on a Mobile Device [53.323878851563414]
本稿では,強化学習技術を用いたネットワーク拡張とpruning検索を組み込んだコンパイラ対応統一フレームワークを提案する。具体的には,リカレントニューラルネットワーク(RNN)を用いて,ネットワークの強化とプルーニングの両面での統一的なスキームを自動で提供する。提案手法は,モバイルデバイス上でのリアルタイム3次元物体検出を実現する。
論文参考訳（メタデータ） (2020-12-26T19:41:15Z)
Reinforced Axial Refinement Network for Monocular 3D Object Detection [160.34246529816085]
モノクロ3次元物体検出は、2次元入力画像から物体の位置と特性を抽出することを目的としている。従来のアプローチでは、空間から3D境界ボックスをサンプリングし、対象オブジェクトと各オブジェクトの関係を推定するが、有効サンプルの確率は3D空間で比較的小さい。我々は,まず最初の予測から始めて,各ステップで1つの3dパラメータだけを変えて,基礎的真理に向けて徐々に洗練することを提案する。これは、いくつかのステップの後に報酬を得るポリシーを設計する必要があるため、最適化するために強化学習を採用します。
論文参考訳（メタデータ） (2020-08-31T17:10:48Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。