論文の概要: Towards Open Set 3D Learning: A Benchmark on Object Point Clouds
- arxiv url: http://arxiv.org/abs/2207.11554v1
- Date: Sat, 23 Jul 2022 17:00:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-26 14:37:39.048797
- Title: Towards Open Set 3D Learning: A Benchmark on Object Point Clouds
- Title(参考訳): Open Set 3D Learningに向けて - オブジェクトポイントクラウドのベンチマーク
- Authors: Antonio Alliegro, Francesco Cappio Borlino, Tatiana Tommasi
- Abstract要約: 本論文は,オープンセット3次元学習に関する第1報である。
カテゴリのセマンティックシフトの観点から,難易度を増すような新しいテストベッドを導入する。
本稿では,最新のアプローチが3Dデータに有効であるかどうか,その理解のために,アウト・オブ・ディストリビューションとオープン・セット2D文献について検討する。
- 参考スコア(独自算出の注目度): 17.145309633743747
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the last years, there has been significant progress in the field of 3D
learning on classification, detection and segmentation problems. The vast
majority of the existing studies focus on canonical closed-set conditions,
neglecting the intrinsic open nature of the real-world. This limits the
abilities of autonomous systems involved in safety-critical applications that
require managing novel and unknown signals. In this context exploiting 3D data
can be a valuable asset since it conveys rich information about the geometry of
sensed objects and scenes. This paper provides the first broad study on Open
Set 3D learning. We introduce a novel testbed with settings of increasing
difficulty in terms of category semantic shift and cover both in-domain
(synthetic-to-synthetic) and cross-domain (synthetic-to-real) scenarios.
Moreover, we investigate the related out-of-distribution and Open Set 2D
literature to understand if and how their most recent approaches are effective
on 3D data. Our extensive benchmark positions several algorithms in the same
coherent picture, revealing their strengths and limitations. The results of our
analysis may serve as a reliable foothold for future tailored Open Set 3D
models.
- Abstract(参考訳): 近年, 3次元学習の分野において, 分類, 検出, セグメンテーション問題において有意な進歩がみられた。
既存の研究の大部分は、実世界の本質的なオープンな性質を無視して、正準閉集合状態に焦点を当てている。
これは、新しい未知の信号の管理を必要とする安全クリティカルなアプリケーションに関わる自律システムの能力を制限する。
この文脈では、知覚されたオブジェクトやシーンの幾何学に関する豊富な情報を伝達するため、3Dデータを活用することは貴重な資産となる。
本論文は,オープンセット3次元学習に関する第1報である。
本稿では,カテゴリのセマンティックシフトの難易度を高め,ドメイン内(合成合成合成)とドメイン内(合成合成合成)の両方をカバーできる新しいテストベッドを提案する。
さらに, 最新の手法が3Dデータに有効であるかどうか, 理解するために, アウト・オブ・ディストリビューションとオープン・セット2D文献について検討する。
当社の広範なベンチマークでは,複数のアルゴリズムをコヒーレントな図に配置し,その長所と限界を明らかにしました。
分析の結果は, 今後のオープンセット3dモデルにとって, 信頼性の高い足場となるかもしれない。
関連論文リスト
- GEAL: Generalizable 3D Affordance Learning with Cross-Modal Consistency [50.11520458252128]
既存の3Dアベイランス学習手法は、注釈付きデータに制限があるため、一般化と堅牢性に苦慮している。
本稿では,大規模事前学習型2Dモデルを活用することで,3次元アベイランス学習の一般化と堅牢性を高めるための新しいフレームワークであるGEALを提案する。
GEALは、既存のメソッドと、新しいオブジェクトカテゴリ、および破損したデータにおいて、一貫して優れています。
論文 参考訳(メタデータ) (2024-12-12T17:59:03Z) - Open3DTrack: Towards Open-Vocabulary 3D Multi-Object Tracking [73.05477052645885]
オープンな語彙的3Dトラッキングを導入し、3Dトラッキングの範囲を広げて、定義済みのカテゴリを超えてオブジェクトを含める。
本稿では,オープン語彙機能を3次元トラッキングフレームワークに統合し,オブジェクトクラスが見えないように一般化する手法を提案する。
論文 参考訳(メタデータ) (2024-10-02T15:48:42Z) - OpenSU3D: Open World 3D Scene Understanding using Foundation Models [2.1262749936758216]
オープンセット, インスタンスレベルの3次元シーン表現を構築するための, 新規でスケーラブルなアプローチを提案する。
既存の方法は、事前に構築された3Dシーンと、ポイント単位の機能ベクトル学習によるスケーラビリティの問題を必要とする。
ゼロショット一般化機能を示すScanNetとReplicaのデータセットから,複数のシーンに対する提案手法の評価を行った。
論文 参考訳(メタデータ) (2024-07-19T13:01:12Z) - MMScan: A Multi-Modal 3D Scene Dataset with Hierarchical Grounded Language Annotations [55.022519020409405]
本稿では,マルチモーダルな3Dシーンデータセットと階層型言語アノテーションを用いたベンチマーク,MMScanを構築した。
結果として得られたマルチモーダルな3Dデータセットは、109kオブジェクトと7.7kリージョン上の1.4Mメタアノテーション付きキャプションと、3Dビジュアルグラウンドと質問応答ベンチマークのための3.04M以上の多様なサンプルを含んでいる。
論文 参考訳(メタデータ) (2024-06-13T17:59:30Z) - Open-Pose 3D Zero-Shot Learning: Benchmark and Challenges [23.663199578392447]
オープンポジション3Dゼロショット分類という,より現実的で困難なシナリオを提案する。
まず,3次元ゼロショット分類に関する現在の研究について再考する。
オープンな設定に特化して設計されたベンチマークデータセットを2つ提案する。
論文 参考訳(メタデータ) (2023-12-12T07:52:33Z) - Generalized Robot 3D Vision-Language Model with Fast Rendering and Pre-Training Vision-Language Alignment [55.11291053011696]
本研究は,ラベル付きシーンが極めて限定された場合の3次元シーン理解のためのフレームワークを提案する。
事前学習された視覚言語モデルから新しいカテゴリーの知識を抽出するために,階層的特徴整合型事前学習と知識蒸留戦略を提案する。
限定的な再構築の場合、提案手法はWS3D++と呼ばれ、大規模なScanNetベンチマークで1位にランクインした。
論文 参考訳(メタデータ) (2023-12-01T15:47:04Z) - Open-CRB: Towards Open World Active Learning for 3D Object Detection [40.80953254074535]
LiDARによる3次元物体検出は,最近,能動学習(AL)によって著しく進歩した。
ストリーミングポイントクラウドが未知または新しいオブジェクトを含む実世界のデプロイメントでは、そのようなオブジェクトをキャプチャする現在のALメソッドが探索されていない。
本稿では,3次元物体検出のためのオープンワールドアクティブラーニング(OWAL-3D)という,より実践的で困難な研究課題について検討する。
論文 参考訳(メタデータ) (2023-10-16T13:32:53Z) - OpenPatch: a 3D patchwork for Out-Of-Distribution detection [16.262921993755892]
そこで本研究では,実世界のクラウドサンプルに対して,参照既知のデータが合成された場合のセマンティックノベルティ検出の課題について述べる。
OpenPatchは、トレーニング済みの大きなモデルの上に構築され、その中間機能から、既知の各クラスを記述するパッチ表現のセットを単純に抽出する。
OpenPatchは、全例と数例の既知のサンプルシナリオの両方で優れていることを実証します。
論文 参考訳(メタデータ) (2023-10-05T08:49:51Z) - CMR3D: Contextualized Multi-Stage Refinement for 3D Object Detection [57.44434974289945]
本稿では,3次元オブジェクト検出(CMR3D)フレームワークのためのコンテキスト型マルチステージリファインメントを提案する。
我々のフレームワークは3Dシーンを入力として取り、シーンの有用なコンテキスト情報を明示的に統合しようと試みている。
3Dオブジェクトの検出に加えて,3Dオブジェクトカウント問題に対するフレームワークの有効性について検討する。
論文 参考訳(メタデータ) (2022-09-13T05:26:09Z) - RandomRooms: Unsupervised Pre-training from Synthetic Shapes and
Randomized Layouts for 3D Object Detection [138.2892824662943]
有望な解決策は、CADオブジェクトモデルで構成される合成データセットをよりよく利用して、実際のデータセットでの学習を促進することである。
最近の3次元事前学習の研究は、合成物体から他の実世界の応用へ学習した伝達特性が失敗することを示している。
本研究では,この目的を達成するためにRandomRoomsという新しい手法を提案する。
論文 参考訳(メタデータ) (2021-08-17T17:56:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。