論文の概要: Points2Vec: Unsupervised Object-level Feature Learning from Point Clouds
- arxiv url: http://arxiv.org/abs/2102.04136v1
- Date: Mon, 8 Feb 2021 11:29:57 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-09 15:47:32.897030
- Title: Points2Vec: Unsupervised Object-level Feature Learning from Point Clouds
- Title(参考訳): point2vec:unsupervised object-level feature learning from point clouds
- Authors: Jo\"el Bachmann, Kenneth Blomqvist, Julian F\"orster, Roland Siegwart
- Abstract要約: 同様の表現学習技術は3次元視覚の文脈ではまだ一般的ではない。
我々は、教師なしアルゴリズムを用いてスキャンされた3次元空間のデータセットをマイニングすることにより、これらのベクトル表現を学習する。
本稿では,コンテキストを含む手法を用いることで,クラスタリングアルゴリズムが相互に異なるセマンティッククラスを識別する能力を高めることを示す。
- 参考スコア(独自算出の注目度): 25.988556827312483
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Unsupervised representation learning techniques, such as learning word
embeddings, have had a significant impact on the field of natural language
processing. Similar representation learning techniques have not yet become
commonplace in the context of 3D vision. This, despite the fact that the
physical 3D spaces have a similar semantic structure to bodies of text: words
are surrounded by words that are semantically related, just like objects are
surrounded by other objects that are similar in concept and usage.
In this work, we exploit this structure in learning semantically meaningful
low dimensional vector representations of objects. We learn these vector
representations by mining a dataset of scanned 3D spaces using an unsupervised
algorithm. We represent objects as point clouds, a flexible and general
representation for 3D data, which we encode into a vector representation. We
show that using our method to include context increases the ability of a
clustering algorithm to distinguish different semantic classes from each other.
Furthermore, we show that our algorithm produces continuous and meaningful
object embeddings through interpolation experiments.
- Abstract(参考訳): 単語埋め込みの学習のような教師なし表現学習技術は、自然言語処理の分野に大きな影響を与えた。
同様の表現学習技術は3次元視覚の文脈ではまだ一般的ではない。
これは、物理的な3D空間がテキストの本体に類似した意味構造を持っているという事実にもかかわらず、単語は意味的に関連している言葉に囲まれています。
本研究では,この構造を意味的に意味のあるオブジェクトの低次元ベクトル表現の学習に活用する。
これらのベクトル表現は教師なしアルゴリズムを用いてスキャンされた3d空間のデータセットをマイニングすることで学習する。
オブジェクトを点雲として表現し、3次元データのフレキシブルで汎用的な表現をベクトル表現にエンコードする。
本稿では,コンテキストを含む手法を用いることで,異なる意味クラスを識別するクラスタリングアルゴリズムの能力が向上することを示す。
さらに,本アルゴリズムは補間実験により連続的かつ有意義な物体埋め込みを生成することを示す。
関連論文リスト
- SUGAR: Pre-training 3D Visual Representations for Robotics [85.55534363501131]
ロボット工学のための新しい3D事前学習フレームワークSUGARを紹介した。
SUGARは3次元の点雲を通してオブジェクトの意味的、幾何学的、および余分な特性をキャプチャする。
SuGARの3D表現は最先端の2Dおよび3D表現よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-04-01T21:23:03Z) - Distilling Coarse-to-Fine Semantic Matching Knowledge for Weakly
Supervised 3D Visual Grounding [58.924180772480504]
3Dビジュアルグラウンドリングは、所定の文クエリに対応する3Dシーンでターゲットオブジェクトを見つけることを含む。
弱教師付きアノテーションを利用して3次元視覚的接地モデルを学ぶことを提案する。
オブジェクトの提案と文のセマンティックな類似性を粗大な方法で解析する新しいセマンティックマッチングモデルを設計する。
論文 参考訳(メタデータ) (2023-07-18T13:49:49Z) - Semantic Abstraction: Open-World 3D Scene Understanding from 2D
Vision-Language Models [17.606199768716532]
オープンセットの語彙とドメイン外視覚入力を用いて,エージェントが自身の3D環境を判断する必要があるタスクのファミリーである,オープンワールドの3Dシーン理解について検討する。
本稿では,2次元視覚言語モデルに新しい空間能力を付加したセマンティック抽象化(Semantic Abstraction, SemAbs)を提案する。
オープンワールド3Dシーン理解タスクにおけるSemAbsの有用性を示す。
論文 参考訳(メタデータ) (2022-07-23T13:10:25Z) - 3D Concept Grounding on Neural Fields [99.33215488324238]
既存の視覚的推論手法は、典型的には、2Dセグメンテーションマスクを抽出するために教師付き手法を用いる。
人間は、画像の3D表現の基盤となる概念を基盤にすることができる。
我々は,ニューラルネットワークの連続的,微分可能な性質を利用して概念をセグメント化し,学習することを提案する。
論文 参考訳(メタデータ) (2022-07-13T17:59:33Z) - Self-Supervised Learning of Object Parts for Semantic Segmentation [7.99536002595393]
我々は、オブジェクト部品の自己教師型学習がこの問題の解決策であると主張している。
本手法は3つのセマンティックセグメンテーションベンチマークの最先端を17%-3%超える。
論文 参考訳(メタデータ) (2022-04-27T17:55:17Z) - Learning to Reconstruct and Segment 3D Objects [4.709764624933227]
我々は、ディープニューラルネットワークを用いて一般的な、堅牢な表現を学習することで、その中のシーンやオブジェクトを理解することを目指している。
この論文は、単一または複数ビューからのオブジェクトレベルの3次元形状推定からシーンレベルのセマンティック理解までの3つのコアコントリビューションである。
論文 参考訳(メタデータ) (2020-10-19T15:09:04Z) - Semantic Correspondence via 2D-3D-2D Cycle [58.023058561837686]
本稿では,3次元領域に利用して意味的対応を予測するための新しい手法を提案する。
提案手法は,標準的なセマンティックベンチマークにおいて比較,さらに優れた結果を与えることを示す。
論文 参考訳(メタデータ) (2020-04-20T05:27:45Z) - Global-Local Bidirectional Reasoning for Unsupervised Representation
Learning of 3D Point Clouds [109.0016923028653]
局所構造とグローバル形状の双方向推論による点雲表現を人間の監督なしに学習する。
本研究では, 実世界の3次元オブジェクト分類データセットにおいて, 教師なしモデルが最先端の教師付き手法を超越していることを示す。
論文 参考訳(メタデータ) (2020-03-29T08:26:08Z) - Human Correspondence Consensus for 3D Object Semantic Understanding [56.34297279246823]
本稿では,CorresPondenceNetという新しいデータセットを提案する。
このデータセットに基づいて、新しい測地的整合性損失を伴う密接なセマンティック埋め込みを学習することができる。
CorresPondenceNetは異種オブジェクトの細粒度理解を促進できるだけでなく、クロスオブジェクト登録や部分オブジェクトマッチングも実現できた。
論文 参考訳(メタデータ) (2019-12-29T04:24:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。