論文の概要: PRANet: Point Cloud Registration with an Artificial Agent
- arxiv url: http://arxiv.org/abs/2109.11349v1
- Date: Thu, 23 Sep 2021 12:52:10 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-24 14:59:56.145030
- Title: PRANet: Point Cloud Registration with an Artificial Agent
- Title(参考訳): pranet: 人工エージェントによるポイントクラウド登録
- Authors: Lisa Tse, Abdoul Aziz Amadou, Axen Georget, Ahmet Tuysuzoglu
- Abstract要約: 深層教師あり学習を用いてエンドツーエンドで訓練された人工エージェントを提案する。
従来の強化学習技術とは対照的に、観察はサンプルとして行われるため、経験的な再生バッファは不要である。
ModelNet40の実験では、クリーンでノイズの多い、部分的に見えるデータセットの場合、結果が最先端の最先端に匹敵する、あるいは優れていることが示されている。
- 参考スコア(独自算出の注目度): 4.265773997354609
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Point cloud registration plays a critical role in a multitude of computer
vision tasks, such as pose estimation and 3D localization. Recently, a plethora
of deep learning methods were formulated that aim to tackle this problem. Most
of these approaches find point or feature correspondences, from which the
transformations are computed. We give a different perspective and frame the
registration problem as a Markov Decision Process. Instead of directly
searching for the transformation, the problem becomes one of finding a sequence
of translation and rotation actions that is equivalent to this transformation.
To this end, we propose an artificial agent trained end-to-end using deep
supervised learning. In contrast to conventional reinforcement learning
techniques, the observations are sampled i.i.d. and thus no experience replay
buffer is required, resulting in a more streamlined training process.
Experiments on ModelNet40 show results comparable or superior to the state of
the art in the case of clean, noisy and partially visible datasets.
- Abstract(参考訳): ポイントクラウド登録は、ポーズ推定や3dローカライズなど、多数のコンピュータビジョンタスクにおいて重要な役割を果たす。
近年,この問題に取り組むための深層学習手法が多数提案されている。
これらのアプローチのほとんどは、変換が計算される点または特徴対応を見つける。
我々は、異なる視点を示し、登録問題をマルコフ決定プロセスとして構成する。
問題は変換を直接探索する代わりに、この変換と等価な変換および回転作用の列を見つけることの1つとなる。
そこで本研究では,深層教師あり学習を用いたエンドツーエンド学習エージェントを提案する。
従来の強化学習技術とは対照的に、観察はサンプル化されるため、経験的再生バッファは不要であり、より合理化されたトレーニングプロセスとなる。
modelnet40の実験では、クリーンでノイズの多い、部分的に見えるデータセットの場合、最先端の技術に匹敵する、あるいは優れている結果が示されている。
関連論文リスト
- A Study of Forward-Forward Algorithm for Self-Supervised Learning [65.268245109828]
本研究では,自己指導型表現学習におけるフォワードとバックプロパゲーションのパフォーマンスについて検討する。
我々の主な発見は、フォワードフォワードアルゴリズムが(自己教師付き)トレーニング中にバックプロパゲーションに相容れないように機能するのに対し、転送性能は研究されたすべての設定において著しく遅れていることである。
論文 参考訳(メタデータ) (2023-09-21T10:14:53Z) - ALSO: Automotive Lidar Self-supervision by Occupancy estimation [70.70557577874155]
本稿では,ポイントクラウド上で動作している深層知覚モデルのバックボーンを事前学習するための自己教師型手法を提案する。
中心となる考え方は、3Dポイントがサンプリングされる表面の再構成であるプリテキストタスクでモデルをトレーニングすることである。
直感的には、もしネットワークがわずかな入力ポイントのみを考慮し、シーン表面を再構築できるなら、おそらく意味情報の断片をキャプチャする。
論文 参考訳(メタデータ) (2022-12-12T13:10:19Z) - SCOOP: Self-Supervised Correspondence and Optimization-Based Scene Flow [25.577386156273256]
シーンフロー推定は、連続した観察からシーンの3次元運動を見つけることを目的として、コンピュータビジョンにおける長年の課題である。
そこで本研究では,少量のデータから学習可能なシーンフロー推定手法であるSCOOPについて紹介する。
論文 参考訳(メタデータ) (2022-11-25T10:52:02Z) - Continual Learning for Image-Based Camera Localization [14.47046413243358]
連続学習環境における視覚的局所化の問題について検討する。
以上の結果から,非定常データも分類領域と同様,深層ネットワークにおいて視覚的局所化のための破滅的な忘れを生じさせることが示された。
本稿では,バッファリングプロセスにおける既存のサンプリング戦略を視覚的ローカライゼーションの問題に適応させる,カバレッジスコア(Buff-CS)に基づく新しいサンプリング手法を提案する。
論文 参考訳(メタデータ) (2021-08-20T11:18:05Z) - Point Discriminative Learning for Unsupervised Representation Learning
on 3D Point Clouds [54.31515001741987]
3次元点雲上での教師なし表現学習のための点識別学習法を提案する。
我々は、中間レベルとグローバルレベルの特徴に新しい点識別損失を課すことにより、これを達成した。
提案手法は強力な表現を学習し,新しい最先端性能を実現する。
論文 参考訳(メタデータ) (2021-08-04T15:11:48Z) - Visual Transformer for Task-aware Active Learning [49.903358393660724]
プールベースのアクティブラーニングのための新しいパイプラインを提案する。
提案手法は,学習中に使用可能なアンラベリング例を利用して,ラベル付き例との相関関係を推定する。
ビジュアルトランスフォーマーは、ラベル付き例と非ラベル付き例の間の非ローカルビジュアル概念依存性をモデル化する。
論文 参考訳(メタデータ) (2021-06-07T17:13:59Z) - Locally Aware Piecewise Transformation Fields for 3D Human Mesh
Registration [67.69257782645789]
本論文では,3次元変換ベクトルを学習し,提案空間内の任意のクエリ点をリザーブ空間内の対応する位置にマップする部分変換場を提案する。
パラメトリックモデルにネットワークのポーズを合わせることで、特に極端なポーズにおいて、より優れた登録品質が得られることを示す。
論文 参考訳(メタデータ) (2021-04-16T15:16:09Z) - Recurrent Multi-view Alignment Network for Unsupervised Surface
Registration [79.72086524370819]
非厳格な登録をエンドツーエンドで学習することは、本質的に高い自由度とラベル付きトレーニングデータの欠如により困難である。
我々は、いくつかの剛性変換のポイントワイドな組み合わせで、非剛性変換を表現することを提案する。
また,投影された多視点2次元深度画像上での3次元形状の類似度を計測する可微分損失関数も導入する。
論文 参考訳(メタデータ) (2020-11-24T14:22:42Z) - When Deep Learning Meets Data Alignment: A Review on Deep Registration
Networks (DRNs) [4.616914111718527]
機械学習の最近の進歩は、コンピュータビジョンの分野における転換点となるかもしれない。
機械学習の最近の進歩は、コンピュータビジョンの分野における転換点となるかもしれない。
論文 参考訳(メタデータ) (2020-03-06T12:56:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。