論文の概要: SeqXY2SeqZ: Structure Learning for 3D Shapes by Sequentially Predicting
1D Occupancy Segments From 2D Coordinates
- arxiv url: http://arxiv.org/abs/2003.05559v2
- Date: Mon, 16 Mar 2020 15:06:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-24 15:00:04.737602
- Title: SeqXY2SeqZ: Structure Learning for 3D Shapes by Sequentially Predicting
1D Occupancy Segments From 2D Coordinates
- Title(参考訳): SeqXY2SeqZ:2次元座標からの1次元占有セグメントの逐次予測による3次元形状の構造学習
- Authors: Zhizhong Han, Guanhui Qiao, Yu-Shen Liu, and Matthias Zwicker
- Abstract要約: 本稿では,各2次元位置における関数の出力が内部の線分列である2次元関数を用いて3次元形状を表現することを提案する。
本研究では,SeqXY2SeqZと呼ばれるセック2Seqモデルを用いて,2つの任意の軸に沿った2次元座標列から3つの軸に沿った1次元位置の列への写像を学習する手法を提案する。
実験の結果,SeqXY2SeqZは広く使用されているベンチマークで最先端の手法よりも優れていることがわかった。
- 参考スコア(独自算出の注目度): 61.04823927283092
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Structure learning for 3D shapes is vital for 3D computer vision.
State-of-the-art methods show promising results by representing shapes using
implicit functions in 3D that are learned using discriminative neural networks.
However, learning implicit functions requires dense and irregular sampling in
3D space, which also makes the sampling methods affect the accuracy of shape
reconstruction during test. To avoid dense and irregular sampling in 3D, we
propose to represent shapes using 2D functions, where the output of the
function at each 2D location is a sequence of line segments inside the shape.
Our approach leverages the power of functional representations, but without the
disadvantage of 3D sampling. Specifically, we use a voxel tubelization to
represent a voxel grid as a set of tubes along any one of the X, Y, or Z axes.
Each tube can be indexed by its 2D coordinates on the plane spanned by the
other two axes. We further simplify each tube into a sequence of occupancy
segments. Each occupancy segment consists of successive voxels occupied by the
shape, which leads to a simple representation of its 1D start and end location.
Given the 2D coordinates of the tube and a shape feature as condition, this
representation enables us to learn 3D shape structures by sequentially
predicting the start and end locations of each occupancy segment in the tube.
We implement this approach using a Seq2Seq model with attention, called
SeqXY2SeqZ, which learns the mapping from a sequence of 2D coordinates along
two arbitrary axes to a sequence of 1D locations along the third axis.
SeqXY2SeqZ not only benefits from the regularity of voxel grids in training and
testing, but also achieves high memory efficiency. Our experiments show that
SeqXY2SeqZ outperforms the state-ofthe-art methods under widely used
benchmarks.
- Abstract(参考訳): 3次元コンピュータビジョンには3次元形状の構造学習が不可欠である。
最先端の手法は、識別ニューラルネットワークを用いて学習した3次元の暗黙の関数を用いて形状を表現することで有望な結果を示す。
しかし、3次元空間における暗黙的関数の学習には密集的かつ不規則なサンプリングが必要であるため、サンプリング法は試験中の形状復元の精度に影響を与える。
3次元の高密度で不規則なサンプリングを避けるために,各2次元位置における関数の出力を形状内の線分列とする2次元関数を用いた形状表現を提案する。
提案手法は機能表現のパワーを活用するが、3dサンプリングの欠点はない。
具体的には、ボクセル格子をX、Y、またはZ軸のいずれかに沿ったチューブの集合として表現するためにボクセルチューブ化を用いる。
各チューブは、他の2つの軸にまたがる平面上の2d座標によってインデックス化することができる。
さらに,各管の占有部分の配列を単純化する。
各占有セグメントは、形状によって占有される連続したボクセルで構成されており、1dの開始位置と終了位置の単純な表現に繋がる。
チューブの2次元座標と形状特徴を条件として、チューブ内の各占有セグメントの開始位置と終了位置を逐次予測することにより、3次元形状構造を学習することができる。
このアプローチはseqxy2seqzと呼ばれる注意深いseq2seqモデルを用いて実装され、2つの任意の軸に沿った2d座標の列から3軸に沿った1d位置の配列へのマッピングを学ぶ。
SeqXY2SeqZは、トレーニングやテストにおけるボクセルグリッドの規則性の恩恵を受けるだけでなく、高いメモリ効率を実現する。
実験の結果,SeqXY2SeqZは広く使用されているベンチマークで最先端の手法よりも優れていることがわかった。
関連論文リスト
- Occupancy-Based Dual Contouring [12.944046673902415]
本稿では,2重畳み込み方式を提案する。
本手法は,GPU並列化を最大化するために,学習不要かつ慎重に設計されている。
論文 参考訳(メタデータ) (2024-09-20T11:32:21Z) - Multi-View Representation is What You Need for Point-Cloud Pre-Training [22.55455166875263]
本稿では,事前学習した2次元ネットワークを利用して3次元表現を学習するポイントクラウド事前学習手法を提案する。
我々は,新しい2次元知識伝達損失の助けを借りて,3次元特徴抽出ネットワークを訓練する。
実験結果から,事前学習したモデルを様々な下流タスクに転送できることが判明した。
論文 参考訳(メタデータ) (2023-06-05T03:14:54Z) - MvDeCor: Multi-view Dense Correspondence Learning for Fine-grained 3D
Segmentation [91.6658845016214]
そこで本研究では,2次元領域における自己教師型手法を,微細な3次元形状分割作業に活用することを提案する。
複数のビューから3次元形状を描画し、コントラスト学習フレームワーク内に密接な対応学習タスクを設置する。
その結果、学習された2次元表現はビュー不変であり、幾何学的に一貫性がある。
論文 参考訳(メタデータ) (2022-08-18T00:48:15Z) - SketchSampler: Sketch-based 3D Reconstruction via View-dependent Depth
Sampling [75.957103837167]
1枚のスケッチ画像に基づいて3次元形状を再構成することは、スパースで不規則なスケッチと正規の高密度な3次元形状との間に大きな領域ギャップがあるため困難である。
既存の作品では、3D座標を直接予測するためにスケッチから抽出されたグローバルな特徴を活用しようとするが、通常は入力スケッチに忠実でない細部を失う。
論文 参考訳(メタデータ) (2022-08-14T16:37:51Z) - Meta-Learning 3D Shape Segmentation Functions [16.119694625781992]
本稿では,3次元形状を入力として,各3次元セグメント関数空間の事前予測を行うメタリアナとして,補助的なディープニューラルネットワークを導入する。
実験では,メタ3DSegと呼ばれるメタラーニング手法が,教師なし3次元形状のセグメンテーションの改善につながることを示す。
論文 参考訳(メタデータ) (2021-10-08T01:50:54Z) - Cylinder3D: An Effective 3D Framework for Driving-scene LiDAR Semantic
Segmentation [87.54570024320354]
大規模運転シーンのLiDARセマンティックセマンティックセグメンテーションのための最先端の手法は、しばしば2D空間の点雲を投影して処理する。
3D-to-2Dプロジェクションの問題に取り組むための簡単な解決策は、3D表現を保ち、3D空間の点を処理することである。
我々は3次元シリンダー分割と3次元シリンダー畳み込みに基づくフレームワークをCylinder3Dとして開発し,3次元トポロジの関係と運転シーンの点雲の構造を利用する。
論文 参考訳(メタデータ) (2020-08-04T13:56:19Z) - KAPLAN: A 3D Point Descriptor for Shape Completion [80.15764700137383]
KAPLANは、一連の2D畳み込みを通じて局所的な形状情報を集約する3Dポイント記述子である。
各平面において、正規点や平面間距離のような点特性は2次元グリッドに集約され、効率的な2次元畳み込みエンコーダを持つ特徴表現に抽象化される。
公開データセットの実験では、KAPLANが3D形状の完成のために最先端のパフォーマンスを達成することが示されている。
論文 参考訳(メタデータ) (2020-07-31T21:56:08Z) - Learning Local Neighboring Structure for Robust 3D Shape Representation [143.15904669246697]
3Dメッシュの表現学習は多くのコンピュータビジョンやグラフィックスアプリケーションにおいて重要である。
局所構造認識型異方性畳み込み操作(LSA-Conv)を提案する。
本モデルでは,3次元形状復元において最先端の手法に比べて顕著な改善が得られた。
論文 参考訳(メタデータ) (2020-04-21T13:40:03Z) - 3D Shape Segmentation with Geometric Deep Learning [2.512827436728378]
本稿では,部分分割問題としてセグメント化全体を解くために,3次元形状の3次元拡張ビューを生成するニューラルネットワークベースのアプローチを提案する。
提案手法は,公開データセットの3次元形状と,フォトグラム法を用いて再構成した実物体を用いて検証する。
論文 参考訳(メタデータ) (2020-02-02T14:11:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。