論文の概要: Fine-grained 3D object recognition: an approach and experiments
- arxiv url: http://arxiv.org/abs/2306.15919v1
- Date: Wed, 28 Jun 2023 04:48:21 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-29 15:45:48.263611
- Title: Fine-grained 3D object recognition: an approach and experiments
- Title(参考訳): 微細な3次元物体認識 : アプローチと実験
- Authors: Junhyung Jo, Hamidreza Kasaei
- Abstract要約: 3次元物体認識技術は、自動車の自律運転などの先進技術における中核技術として利用されている。
i)Global Orthographic Object Descriptor (GOOD)のような手作りのアプローチと、(ii)MobileNetやVGGのようなディープラーニングベースのアプローチである。
本稿では,オブジェクトビューを入力とし,カテゴリラベルを出力として生成するオフライン3Dオブジェクト認識システムを最初に実装した。
オフラインの段階では、インスタンスベースの学習(IBL)が新しいものを形成するために使用される
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Three-dimensional (3D) object recognition technology is being used as a core
technology in advanced technologies such as autonomous driving of automobiles.
There are two sets of approaches for 3D object recognition: (i) hand-crafted
approaches like Global Orthographic Object Descriptor (GOOD), and (ii) deep
learning-based approaches such as MobileNet and VGG. However, it is needed to
know which of these approaches works better in an open-ended domain where the
number of known categories increases over time, and the system should learn
about new object categories using few training examples. In this paper, we
first implemented an offline 3D object recognition system that takes an object
view as input and generates category labels as output. In the offline stage,
instance-based learning (IBL) is used to form a new category and we use K-fold
cross-validation to evaluate the obtained object recognition performance. We
then test the proposed approach in an online fashion by integrating the code
into a simulated teacher test. As a result, we concluded that the approach
using deep learning features is more suitable for open-ended fashion. Moreover,
we observed that concatenating the hand-crafted and deep learning features
increases the classification accuracy.
- Abstract(参考訳): 3次元物体認識技術は自動車の自動運転などの先進技術の中核技術として利用されている。
3Dオブジェクト認識には2つのアプローチがある。
(i)Global Orthographic Object Descriptor(GOOD)などの手作りのアプローチ
(ii)mobilenetやvggといったディープラーニングベースのアプローチ。
しかし、既知のカテゴリの数が時間とともに増加するオープンエンド領域では、これらのアプローチのどちらがよりうまく機能するかを知る必要があり、システムは、少数のトレーニング例を使って、新しいオブジェクトカテゴリについて学ぶ必要がある。
本稿では,オブジェクトビューを入力とし,カテゴリラベルを出力として生成するオフライン3Dオブジェクト認識システムを最初に実装した。
オフラインの段階では、インスタンスベースの学習(IBL)を使用して新しいカテゴリを形成し、得られたオブジェクト認識性能を評価するためにK-foldクロスバリデーションを使用する。
次に,提案手法をシミュレートした教師テストに統合し,オンライン形式でテストを行った。
その結果,ディープラーニング機能を用いたアプローチは,よりオープンな手法に適していることがわかった。
さらに,手作り・深層学習の特徴を結合することで分類精度が向上することを確認した。
関連論文リスト
- Object-Oriented Material Classification and 3D Clustering for Improved Semantic Perception and Mapping in Mobile Robots [6.395242048226456]
本稿では,オブジェクト指向パイプライン上に構築されたRGB-D教材分類のための補足型ディープラーニング手法を提案する。
本研究では,3次元セマンティックシーンマッピングの最先端手法と比較して,材料分類と3次元クラスタリングの精度が大幅に向上したことを示す。
論文 参考訳(メタデータ) (2024-07-08T16:25:01Z) - Deep Models for Multi-View 3D Object Recognition: A Review [16.500711021549947]
これまで,オブジェクト認識のための多視点3D表現は,最先端性能を実現する上で最も有望な結果であった。
本稿では,3次元分類・検索タスクにおける多視点オブジェクト認識手法の最近の進歩を包括的に紹介する。
論文 参考訳(メタデータ) (2024-04-23T16:54:31Z) - OV-Uni3DETR: Towards Unified Open-Vocabulary 3D Object Detection via Cycle-Modality Propagation [67.56268991234371]
OV-Uni3DETRは、様々なシナリオにおける最先端のパフォーマンスを達成し、既存のメソッドを平均6%以上上回っている。
コードと事前訓練されたモデルは、後にリリースされる。
論文 参考訳(メタデータ) (2024-03-28T17:05:04Z) - Generalized Label-Efficient 3D Scene Parsing via Hierarchical Feature
Aligned Pre-Training and Region-Aware Fine-tuning [55.517000360348725]
本研究は,ラベル付きシーンが極めて限定された場合の3次元シーン理解のためのフレームワークを提案する。
事前学習された視覚言語モデルから新しいカテゴリーの知識を抽出するために,階層的特徴整合型事前学習と知識蒸留戦略を提案する。
室内と屋外の両方で実験を行ったところ、データ効率のよい学習とオープンワールドの複数ショット学習の両方において、我々のアプローチの有効性が示された。
論文 参考訳(メタデータ) (2023-12-01T15:47:04Z) - I3DOD: Towards Incremental 3D Object Detection via Prompting [31.75287371048825]
本稿では,新たなインクリメンタル3Dオブジェクト検出フレームワークを提案する。
具体的には、オブジェクトの局所化情報とカテゴリの意味情報とのマッチング関係を学習するためのタスク共有プロンプト機構を提案する。
本手法は,mAP@0.25における最先端物体検出法を0.6%~2.7%向上させる。
論文 参考訳(メタデータ) (2023-08-24T02:54:38Z) - ALSO: Automotive Lidar Self-supervision by Occupancy estimation [70.70557577874155]
本稿では,ポイントクラウド上で動作している深層知覚モデルのバックボーンを事前学習するための自己教師型手法を提案する。
中心となる考え方は、3Dポイントがサンプリングされる表面の再構成であるプリテキストタスクでモデルをトレーニングすることである。
直感的には、もしネットワークがわずかな入力ポイントのみを考慮し、シーン表面を再構築できるなら、おそらく意味情報の断片をキャプチャする。
論文 参考訳(メタデータ) (2022-12-12T13:10:19Z) - SL3D: Self-supervised-Self-labeled 3D Recognition [89.19932178712065]
自己教師付き自己ラベル型3D認識(SL3D)フレームワークを提案する。
SL3Dはクラスタリングと学習機能表現という2つの結合した目的を同時に解決する。
分類、オブジェクト検出、セマンティックセグメンテーションなど、さまざまな3D認識タスクに応用することができる。
論文 参考訳(メタデータ) (2022-10-30T11:08:25Z) - CMR3D: Contextualized Multi-Stage Refinement for 3D Object Detection [57.44434974289945]
本稿では,3次元オブジェクト検出(CMR3D)フレームワークのためのコンテキスト型マルチステージリファインメントを提案する。
我々のフレームワークは3Dシーンを入力として取り、シーンの有用なコンテキスト情報を明示的に統合しようと試みている。
3Dオブジェクトの検出に加えて,3Dオブジェクトカウント問題に対するフレームワークの有効性について検討する。
論文 参考訳(メタデータ) (2022-09-13T05:26:09Z) - Lifelong Ensemble Learning based on Multiple Representations for
Few-Shot Object Recognition [6.282068591820947]
本稿では,複数表現に基づく一生涯のアンサンブル学習手法を提案する。
生涯学習を容易にするため、各アプローチは、オブジェクト情報を即座に保存して検索するメモリユニットを備える。
提案手法の有効性を,オフラインおよびオープンエンドシナリオで評価するために,幅広い実験を行った。
論文 参考訳(メタデータ) (2022-05-04T10:29:10Z) - Learnable Online Graph Representations for 3D Multi-Object Tracking [156.58876381318402]
3D MOT問題に対する統一型学習型アプローチを提案します。
我々は、完全にトレーニング可能なデータアソシエーションにNeural Message Passing Networkを使用します。
AMOTAの65.6%の最先端性能と58%のIDスウィッチを達成して、公開可能なnuScenesデータセットに対する提案手法のメリットを示す。
論文 参考訳(メタデータ) (2021-04-23T17:59:28Z) - Real-time 3D object proposal generation and classification under limited
processing resources [1.6242924916178285]
本稿では,3次元提案生成と分類による効率的な検出手法を提案する。
実験により, 点雲からのリアルタイム3次元物体検出手法の有効性を実証した。
論文 参考訳(メタデータ) (2020-03-24T05:36:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。