論文の概要: Bootstrap Your Own Correspondences
- arxiv url: http://arxiv.org/abs/2106.00677v1
- Date: Tue, 1 Jun 2021 17:59:08 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-02 14:15:09.684646
- Title: Bootstrap Your Own Correspondences
- Title(参考訳): 独自の対応をブートストラップする
- Authors: Mohamed El Banani, Justin Johnson
- Abstract要約: BYOCはRGB-Dビデオから視覚的特徴と幾何学的特徴を学習する自己教師型アプローチである。
屋内シーンのデータセットに対するアプローチを評価し,従来の記述子や学習した記述子よりも優れた手法であることが確認された。
- 参考スコア(独自算出の注目度): 15.715143016999695
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Geometric feature extraction is a crucial component of point cloud
registration pipelines. Recent work has demonstrated how supervised learning
can be leveraged to learn better and more compact 3D features. However, those
approaches' reliance on ground-truth annotation limits their scalability. We
propose BYOC: a self-supervised approach that learns visual and geometric
features from RGB-D video without relying on ground-truth pose or
correspondence. Our key observation is that randomly-initialized CNNs readily
provide us with good correspondences; allowing us to bootstrap the learning of
both visual and geometric features. Our approach combines classic ideas from
point cloud registration with more recent representation learning approaches.
We evaluate our approach on indoor scene datasets and find that our method
outperforms traditional and learned descriptors, while being competitive with
current state-of-the-art supervised approaches.
- Abstract(参考訳): 幾何学的特徴抽出はポイントクラウド登録パイプラインの重要なコンポーネントである。
最近の研究は、より良くよりコンパクトな3d機能を学ぶために教師あり学習をどのように活用できるかを実証している。
しかし、これらのアプローチは地道アノテーションに依存しているためスケーラビリティは制限される。
本稿では,RGB-Dビデオから視覚的・幾何学的特徴を学習する自己教師型アプローチBYOCを提案する。
我々の重要な観察は、ランダムに初期化されたcnnは私たちに良い対応を提供し、視覚と幾何学の両方の特徴の学習をブートストラップできるということです。
我々のアプローチは、ポイントクラウド登録からの古典的なアイデアと、より最近の表現学習アプローチを組み合わせたものです。
室内シーンデータセットに対するアプローチを評価し,従来型および学習済みのディスクリプタを上回りながら,現在の最先端の教師付きアプローチと競合することを見出した。
関連論文リスト
- Unsupervised Non-Rigid Point Cloud Matching through Large Vision Models [1.3030624795284795]
非剛点クラウドマッチングのための学習ベースのフレームワークを提案する。
重要な洞察は、大きな視覚モデル(LVM)から派生した意味的特徴を統合することである。
本フレームワークは,局所的な地形間の自己相似性から生じるあいまいさに対処するために,意味的特徴に含まれる構造情報を効果的に活用する。
論文 参考訳(メタデータ) (2024-08-16T07:02:19Z) - GPr-Net: Geometric Prototypical Network for Point Cloud Few-Shot
Learning [2.4366811507669115]
GPr-Netは、点雲の原型位相を捉える軽量で計算効率の良い幾何学的ネットワークである。
GPr-Netは、ポイントクラウド上の数ショット学習において最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-04-12T17:32:18Z) - ALSO: Automotive Lidar Self-supervision by Occupancy estimation [70.70557577874155]
本稿では,ポイントクラウド上で動作している深層知覚モデルのバックボーンを事前学習するための自己教師型手法を提案する。
中心となる考え方は、3Dポイントがサンプリングされる表面の再構成であるプリテキストタスクでモデルをトレーニングすることである。
直感的には、もしネットワークがわずかな入力ポイントのみを考慮し、シーン表面を再構築できるなら、おそらく意味情報の断片をキャプチャする。
論文 参考訳(メタデータ) (2022-12-12T13:10:19Z) - PointCaM: Cut-and-Mix for Open-Set Point Cloud Learning [72.07350827773442]
我々は,新しいポイントカット・アンド・ミクス機構を用いて,オープンセットのクラウド学習を解決することを提案する。
トレーニング段階では,Unknown-Point Simulatorを用いてアウト・オブ・ディストリビューションデータをシミュレートする。
Unknown-Point Estimatorモジュールは、既知のデータを識別するために、ポイントクラウドの機能コンテキストを活用することを学ぶ。
論文 参考訳(メタデータ) (2022-12-05T03:53:51Z) - Semantic keypoint-based pose estimation from single RGB frames [64.80395521735463]
一つのRGB画像からオブジェクトの連続6-DoFポーズを推定する手法を提案する。
このアプローチは、畳み込みネットワーク(convnet)によって予測されるセマンティックキーポイントと、変形可能な形状モデルを組み合わせる。
提案手法は,インスタンスベースのシナリオとクラスベースのシナリオの両方に対して,6-DoFオブジェクトのポーズを正確に復元できることを示す。
論文 参考訳(メタデータ) (2022-04-12T15:03:51Z) - Unsupervised Representation Learning for 3D Point Cloud Data [66.92077180228634]
我々は、教師なしのポイントクラウド学習に対して、シンプルで効果的なアプローチを提案する。
特に、原点雲の優れたコントラストバージョンを生成する非常に有用な変換を同定する。
本研究では,3次元オブジェクト分類,形状部分分割,シーン分割の3つの下流タスクについて実験を行った。
論文 参考訳(メタデータ) (2021-10-13T10:52:45Z) - UPDesc: Unsupervised Point Descriptor Learning for Robust Registration [54.95201961399334]
UPDescは、ロバストポイントクラウド登録のためのポイント記述子を学習するための教師なしの方法である。
学習した記述子は既存の教師なし手法よりも優れた性能を示すことを示す。
論文 参考訳(メタデータ) (2021-08-05T17:11:08Z) - Revisiting Contrastive Methods for Unsupervised Learning of Visual
Representations [78.12377360145078]
対照的な自己教師型学習は、セグメンテーションやオブジェクト検出といった多くの下流タスクにおいて教師付き事前訓練よりも優れています。
本稿では,データセットのバイアスが既存手法にどのように影響するかを最初に検討する。
現在のコントラストアプローチは、(i)オブジェクト中心対シーン中心、(ii)一様対ロングテール、(iii)一般対ドメイン固有データセットなど、驚くほどうまく機能することを示す。
論文 参考訳(メタデータ) (2021-06-10T17:59:13Z) - Semantic Graph Based Place Recognition for 3D Point Clouds [22.608115489674653]
本稿では,位置認識のためのセマンティックグラフに基づく新しいアプローチを提案する。
まず、ポイントクラウドシーンのための新しいセマンティックグラフ表現を提案する。
次に、その類似性を計算するために、高速で効果的なグラフ類似性ネットワークを設計する。
論文 参考訳(メタデータ) (2020-08-26T09:27:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。