論文の概要: Towards Open Set 3D Learning: A Benchmark on Object Point Clouds
- arxiv url: http://arxiv.org/abs/2207.11554v1
- Date: Sat, 23 Jul 2022 17:00:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-26 14:37:39.048797
- Title: Towards Open Set 3D Learning: A Benchmark on Object Point Clouds
- Title(参考訳): Open Set 3D Learningに向けて - オブジェクトポイントクラウドのベンチマーク
- Authors: Antonio Alliegro, Francesco Cappio Borlino, Tatiana Tommasi
- Abstract要約: 本論文は,オープンセット3次元学習に関する第1報である。
カテゴリのセマンティックシフトの観点から,難易度を増すような新しいテストベッドを導入する。
本稿では,最新のアプローチが3Dデータに有効であるかどうか,その理解のために,アウト・オブ・ディストリビューションとオープン・セット2D文献について検討する。
- 参考スコア(独自算出の注目度): 17.145309633743747
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the last years, there has been significant progress in the field of 3D
learning on classification, detection and segmentation problems. The vast
majority of the existing studies focus on canonical closed-set conditions,
neglecting the intrinsic open nature of the real-world. This limits the
abilities of autonomous systems involved in safety-critical applications that
require managing novel and unknown signals. In this context exploiting 3D data
can be a valuable asset since it conveys rich information about the geometry of
sensed objects and scenes. This paper provides the first broad study on Open
Set 3D learning. We introduce a novel testbed with settings of increasing
difficulty in terms of category semantic shift and cover both in-domain
(synthetic-to-synthetic) and cross-domain (synthetic-to-real) scenarios.
Moreover, we investigate the related out-of-distribution and Open Set 2D
literature to understand if and how their most recent approaches are effective
on 3D data. Our extensive benchmark positions several algorithms in the same
coherent picture, revealing their strengths and limitations. The results of our
analysis may serve as a reliable foothold for future tailored Open Set 3D
models.
- Abstract(参考訳): 近年, 3次元学習の分野において, 分類, 検出, セグメンテーション問題において有意な進歩がみられた。
既存の研究の大部分は、実世界の本質的なオープンな性質を無視して、正準閉集合状態に焦点を当てている。
これは、新しい未知の信号の管理を必要とする安全クリティカルなアプリケーションに関わる自律システムの能力を制限する。
この文脈では、知覚されたオブジェクトやシーンの幾何学に関する豊富な情報を伝達するため、3Dデータを活用することは貴重な資産となる。
本論文は,オープンセット3次元学習に関する第1報である。
本稿では,カテゴリのセマンティックシフトの難易度を高め,ドメイン内(合成合成合成)とドメイン内(合成合成合成)の両方をカバーできる新しいテストベッドを提案する。
さらに, 最新の手法が3Dデータに有効であるかどうか, 理解するために, アウト・オブ・ディストリビューションとオープン・セット2D文献について検討する。
当社の広範なベンチマークでは,複数のアルゴリズムをコヒーレントな図に配置し,その長所と限界を明らかにしました。
分析の結果は, 今後のオープンセット3dモデルにとって, 信頼性の高い足場となるかもしれない。
関連論文リスト
- Open3DTrack: Towards Open-Vocabulary 3D Multi-Object Tracking [73.05477052645885]
オープンな語彙的3Dトラッキングを導入し、3Dトラッキングの範囲を広げて、定義済みのカテゴリを超えてオブジェクトを含める。
本稿では,オープン語彙機能を3次元トラッキングフレームワークに統合し,オブジェクトクラスが見えないように一般化する手法を提案する。
論文 参考訳(メタデータ) (2024-10-02T15:48:42Z) - OpenSU3D: Open World 3D Scene Understanding using Foundation Models [2.1262749936758216]
オープンセット, インスタンスレベルの3次元シーン表現を構築するための, 新規でスケーラブルなアプローチを提案する。
既存の方法は、事前に構築された3Dシーンと、ポイント単位の機能ベクトル学習によるスケーラビリティの問題を必要とする。
ゼロショット一般化機能を示すScanNetとReplicaのデータセットから,複数のシーンに対する提案手法の評価を行った。
論文 参考訳(メタデータ) (2024-07-19T13:01:12Z) - MMScan: A Multi-Modal 3D Scene Dataset with Hierarchical Grounded Language Annotations [55.022519020409405]
本稿では,マルチモーダルな3Dシーンデータセットと階層型言語アノテーションを用いたベンチマーク,MMScanを構築した。
結果として得られたマルチモーダルな3Dデータセットは、109kオブジェクトと7.7kリージョン上の1.4Mメタアノテーション付きキャプションと、3Dビジュアルグラウンドと質問応答ベンチマークのための3.04M以上の多様なサンプルを含んでいる。
論文 参考訳(メタデータ) (2024-06-13T17:59:30Z) - OV-Uni3DETR: Towards Unified Open-Vocabulary 3D Object Detection via Cycle-Modality Propagation [67.56268991234371]
OV-Uni3DETRは、様々なシナリオにおける最先端のパフォーマンスを達成し、既存のメソッドを平均6%以上上回っている。
コードと事前訓練されたモデルは、後にリリースされる。
論文 参考訳(メタデータ) (2024-03-28T17:05:04Z) - Find n' Propagate: Open-Vocabulary 3D Object Detection in Urban Environments [67.83787474506073]
我々は,現在のLiDARに基づく3Dオブジェクト検出システムの限界に対処する。
本稿では,3次元OVタスクに対する汎用textscFind n' Propagate アプローチを提案する。
我々は、新しいオブジェクトクラスに対する平均精度(AP)を最大3.97倍に向上させる。
論文 参考訳(メタデータ) (2024-03-20T12:51:30Z) - Open-Pose 3D Zero-Shot Learning: Benchmark and Challenges [23.663199578392447]
オープンポジション3Dゼロショット分類という,より現実的で困難なシナリオを提案する。
まず,3次元ゼロショット分類に関する現在の研究について再考する。
オープンな設定に特化して設計されたベンチマークデータセットを2つ提案する。
論文 参考訳(メタデータ) (2023-12-12T07:52:33Z) - Open-CRB: Towards Open World Active Learning for 3D Object Detection [40.80953254074535]
LiDARによる3次元物体検出は,最近,能動学習(AL)によって著しく進歩した。
ストリーミングポイントクラウドが未知または新しいオブジェクトを含む実世界のデプロイメントでは、そのようなオブジェクトをキャプチャする現在のALメソッドが探索されていない。
本稿では,3次元物体検出のためのオープンワールドアクティブラーニング(OWAL-3D)という,より実践的で困難な研究課題について検討する。
論文 参考訳(メタデータ) (2023-10-16T13:32:53Z) - OpenPatch: a 3D patchwork for Out-Of-Distribution detection [16.262921993755892]
そこで本研究では,実世界のクラウドサンプルに対して,参照既知のデータが合成された場合のセマンティックノベルティ検出の課題について述べる。
OpenPatchは、トレーニング済みの大きなモデルの上に構築され、その中間機能から、既知の各クラスを記述するパッチ表現のセットを単純に抽出する。
OpenPatchは、全例と数例の既知のサンプルシナリオの両方で優れていることを実証します。
論文 参考訳(メタデータ) (2023-10-05T08:49:51Z) - CMR3D: Contextualized Multi-Stage Refinement for 3D Object Detection [57.44434974289945]
本稿では,3次元オブジェクト検出(CMR3D)フレームワークのためのコンテキスト型マルチステージリファインメントを提案する。
我々のフレームワークは3Dシーンを入力として取り、シーンの有用なコンテキスト情報を明示的に統合しようと試みている。
3Dオブジェクトの検出に加えて,3Dオブジェクトカウント問題に対するフレームワークの有効性について検討する。
論文 参考訳(メタデータ) (2022-09-13T05:26:09Z) - RandomRooms: Unsupervised Pre-training from Synthetic Shapes and
Randomized Layouts for 3D Object Detection [138.2892824662943]
有望な解決策は、CADオブジェクトモデルで構成される合成データセットをよりよく利用して、実際のデータセットでの学習を促進することである。
最近の3次元事前学習の研究は、合成物体から他の実世界の応用へ学習した伝達特性が失敗することを示している。
本研究では,この目的を達成するためにRandomRoomsという新しい手法を提案する。
論文 参考訳(メタデータ) (2021-08-17T17:56:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。