論文の概要: GTT-Net: Learned Generalized Trajectory Triangulation
- arxiv url: http://arxiv.org/abs/2109.03408v1
- Date: Wed, 8 Sep 2021 03:01:25 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-09 13:48:47.671458
- Title: GTT-Net: Learned Generalized Trajectory Triangulation
- Title(参考訳): GTT-Net: 一般軌道三角測量の学習
- Authors: Xiangyu Xu, Enrique Dunn
- Abstract要約: GTT-Netはスパースダイナミック3次元形状の再構成のための教師あり学習フレームワークである。
GTT-Netは精度とロバスト性という点で最先端であることを示す。
- 参考スコア(独自算出の注目度): 26.80678903445168
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present GTT-Net, a supervised learning framework for the reconstruction of
sparse dynamic 3D geometry. We build on a graph-theoretic formulation of the
generalized trajectory triangulation problem, where non-concurrent multi-view
imaging geometry is known but global image sequencing is not provided. GTT-Net
learns pairwise affinities modeling the spatio-temporal relationships among our
input observations and leverages them to determine 3D geometry estimates.
Experiments reconstructing 3D motion-capture sequences show GTT-Net outperforms
the state of the art in terms of accuracy and robustness. Within the context of
articulated motion reconstruction, our proposed architecture is 1) able to
learn and enforce semantic 3D motion priors for shared training and test
domains, while being 2) able to generalize its performance across different
training and test domains. Moreover, GTT-Net provides a computationally
streamlined framework for trajectory triangulation with applications to
multi-instance reconstruction and event segmentation.
- Abstract(参考訳): 本稿では,sparse dynamic 3d geometry再構成のための教師付き学習フレームワークgtt-netを提案する。
一般化軌跡三角法問題のグラフ理論による定式化を基礎とし、非連続多視点画像幾何学が知られているが、大域的な画像シーケンシングは提供されない。
GTT-Netは、入力観測における時空間関係をモデル化し、それらを利用して3次元幾何推定を行う。
3次元モーションキャプチャーシーケンスの再構成実験により、GTT-Netは精度とロバスト性の観点から、芸術の状態を上回ります。
調音運動再構成の文脈において,提案するアーキテクチャは,1)共有トレーニングとテストドメインに対する意味的3次元動作優先を学習し,強制することができると同時に,2)異なるトレーニングとテストドメインにおけるパフォーマンスを一般化することができる。
さらに、GTT-Netは、マルチインスタンス再構成やイベントセグメンテーションへの応用を含む、トラジェクトリ三角測量のための計算の合理化フレームワークを提供する。
関連論文リスト
- Large Spatial Model: End-to-end Unposed Images to Semantic 3D [79.94479633598102]
大空間モデル(LSM)は、RGB画像を直接意味的放射場に処理する。
LSMは、単一のフィードフォワード操作における幾何学、外観、意味を同時に推定する。
新しい視点で言語と対話することで、多目的ラベルマップを生成することができる。
論文 参考訳(メタデータ) (2024-10-24T17:54:42Z) - Enhancing Generalizability of Representation Learning for Data-Efficient 3D Scene Understanding [50.448520056844885]
本研究では,実世界のパターンを持つ多様な合成シーンを生成可能なベイズネットワークを提案する。
一連の実験は、既存の最先端の事前学習手法に比べて、我々の手法が一貫した優位性を示す。
論文 参考訳(メタデータ) (2024-06-17T07:43:53Z) - NEAT: Distilling 3D Wireframes from Neural Attraction Fields [52.90572335390092]
本稿では,3次元再構成セグメントと焦点接合を用いたラインフレーム接合の問題について検討する。
ProjectNEATは、クロスアートマッチングをゼロから行わずに、ジョイントニューラルフィールドとビューを楽しみます。
論文 参考訳(メタデータ) (2023-07-14T07:25:47Z) - SeMLaPS: Real-time Semantic Mapping with Latent Prior Networks and
Quasi-Planar Segmentation [53.83313235792596]
本稿では,RGB-Dシーケンスからのリアルタイム意味マッピングのための新しい手法を提案する。
2DニューラルネットワークとSLAMシステムに基づく3Dネットワークと3D占有マッピングを組み合わせる。
本システムは,2D-3Dネットワークベースシステムにおいて,最先端のセマンティックマッピング品質を実現する。
論文 参考訳(メタデータ) (2023-06-28T22:36:44Z) - Cross-Dimensional Refined Learning for Real-Time 3D Visual Perception
from Monocular Video [2.2299983745857896]
本稿では3次元シーンの幾何学的構造と意味的ラベルを協調的に知覚する新しいリアルタイム能動的学習法を提案する。
本稿では,3次元メッシュと3次元セマンティックラベリングの両方をリアルタイムに抽出する,エンドツーエンドのクロスディメンテーションニューラルネットワーク(CDRNet)を提案する。
論文 参考訳(メタデータ) (2023-03-16T11:53:29Z) - GraphCSPN: Geometry-Aware Depth Completion via Dynamic GCNs [49.55919802779889]
本稿では,グラフ畳み込みに基づく空間伝搬ネットワーク(GraphCSPN)を提案する。
本研究では、幾何学的表現学習において、畳み込みニューラルネットワークとグラフニューラルネットワークを相補的に活用する。
提案手法は,数段の伝搬ステップのみを使用する場合と比較して,最先端の性能を実現する。
論文 参考訳(メタデータ) (2022-10-19T17:56:03Z) - Single-view 3D Mesh Reconstruction for Seen and Unseen Categories [69.29406107513621]
シングルビュー3Dメッシュ再構成は、シングルビューRGB画像から3D形状を復元することを目的とした、基本的なコンピュータビジョンタスクである。
本稿では,一視点3Dメッシュ再構成に取り組み,未知のカテゴリのモデル一般化について検討する。
我々は、再構築におけるカテゴリ境界を断ち切るために、エンドツーエンドの2段階ネットワークであるGenMeshを提案する。
論文 参考訳(メタデータ) (2022-08-04T14:13:35Z) - Learning monocular 3D reconstruction of articulated categories from
motion [39.811816510186475]
ビデオの自己スーパービジョンは、動きに基づくサイクルロスによる連続した3次元再構成の一貫性を強要する。
少数の局所的学習可能なハンドルの変位を介して3D表面を制御する3Dテンプレート変形の解釈可能なモデルを紹介します。
多様な形状, 視点, テクスチャを具体化して, 複数の対象カテゴリーのテクスチャを再現する。
論文 参考訳(メタデータ) (2021-03-30T13:50:27Z) - Monocular 3D Detection with Geometric Constraints Embedding and
Semi-supervised Training [3.8073142980733]
我々は,KM3D-Netと呼ばれる,RGB画像のみを用いたモノクル3Dオブジェクト検出のための新しいフレームワークを提案する。
我々は、対象のキーポイント、次元、方向を予測するための完全な畳み込みモデルを設計し、これらの推定を視点幾何学的制約と組み合わせて位置属性を計算する。
論文 参考訳(メタデータ) (2020-09-02T00:51:51Z) - Joint Spatial-Temporal Optimization for Stereo 3D Object Tracking [34.40019455462043]
本研究では,空間時間最適化に基づくステレオ3次元物体追跡手法を提案する。
ネットワークから隣接画像上の対応する2Dバウンディングボックスを検出し,初期3Dバウンディングボックスを回帰する。
オブジェクトセントロイドに関連づけられた複雑なオブジェクトキューは、リージョンベースのネットワークを使用して予測される。
論文 参考訳(メタデータ) (2020-04-20T13:59:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。