論文の概要: Recurrent Multi-view Alignment Network for Unsupervised Surface
Registration
- arxiv url: http://arxiv.org/abs/2011.12104v2
- Date: Tue, 13 Apr 2021 08:07:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-21 14:04:27.737829
- Title: Recurrent Multi-view Alignment Network for Unsupervised Surface
Registration
- Title(参考訳): 非教師なし表面登録のための再帰的マルチビューアライメントネットワーク
- Authors: Wanquan Feng, Juyong Zhang, Hongrui Cai, Haofei Xu, Junhui Hou and
Hujun Bao
- Abstract要約: 非厳格な登録をエンドツーエンドで学習することは、本質的に高い自由度とラベル付きトレーニングデータの欠如により困難である。
我々は、いくつかの剛性変換のポイントワイドな組み合わせで、非剛性変換を表現することを提案する。
また,投影された多視点2次元深度画像上での3次元形状の類似度を計測する可微分損失関数も導入する。
- 参考スコア(独自算出の注目度): 79.72086524370819
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learning non-rigid registration in an end-to-end manner is challenging due to
the inherent high degrees of freedom and the lack of labeled training data. In
this paper, we resolve these two challenges simultaneously. First, we propose
to represent the non-rigid transformation with a point-wise combination of
several rigid transformations. This representation not only makes the solution
space well-constrained but also enables our method to be solved iteratively
with a recurrent framework, which greatly reduces the difficulty of learning.
Second, we introduce a differentiable loss function that measures the 3D shape
similarity on the projected multi-view 2D depth images so that our full
framework can be trained end-to-end without ground truth supervision. Extensive
experiments on several different datasets demonstrate that our proposed method
outperforms the previous state-of-the-art by a large margin. The source codes
are available at https://github.com/WanquanF/RMA-Net.
- Abstract(参考訳): 非厳格な登録をエンドツーエンドで学習することは、本質的に高い自由度とラベル付きトレーニングデータの欠如により困難である。
本稿では,この2つの課題を同時に解決する。
まず,複数の剛性変換を点的に組み合わせた非剛性変換の表現を提案する。
この表現は, 解空間をよく制約するだけでなく, 繰り返しフレームワークで反復的に解けるようにすることで, 学習の難易度を大幅に低減する。
第2に,提案する多視点2次元深度画像における3次元形状の類似度を計測し,本手法を基礎的真理監督なしにエンドツーエンドで学習できるようにする。
いくつかの異なるデータセットに対する大規模な実験により、提案手法が従来の最先端技術よりも大きなマージンで優れていることが示された。
ソースコードはhttps://github.com/WanquanF/RMA-Netで入手できる。
関連論文リスト
- Cross-domain and Cross-dimension Learning for Image-to-Graph
Transformers [50.576354045312115]
直接画像からグラフへの変換は、単一のモデルにおけるオブジェクトの検出と関係予測を解決するための課題である。
画像-グラフ変換器のクロスドメインおよびクロス次元変換学習を可能にする一連の手法を提案する。
そこで我々は,2次元の衛星画像上でモデルを事前学習し,それを2次元および3次元の異なるターゲット領域に適用する。
論文 参考訳(メタデータ) (2024-03-11T10:48:56Z) - 2S-UDF: A Novel Two-stage UDF Learning Method for Robust Non-watertight Model Reconstruction from Multi-view Images [12.076881343401329]
多視点画像から高品質なUDFを学習するための新しい2段階アルゴリズム2S-UDFを提案する。
定量的な測定値と視覚的品質の両方において、この結果は他のUDF学習技術よりも優れた性能を示している。
論文 参考訳(メタデータ) (2023-03-27T16:35:28Z) - RecRecNet: Rectangling Rectified Wide-Angle Images by Thin-Plate Spline
Model and DoF-based Curriculum Learning [62.86400614141706]
我々はRecRecNet(Rectangling Rectification Network)という新しい学習モデルを提案する。
我々のモデルは、ソース構造をターゲット領域に柔軟にワープし、エンドツーエンドの非教師なし変形を実現する。
実験により, 定量評価と定性評価の両面において, 比較法よりも解法の方が優れていることが示された。
論文 参考訳(メタデータ) (2023-01-04T15:12:57Z) - PatchMVSNet: Patch-wise Unsupervised Multi-View Stereo for
Weakly-Textured Surface Reconstruction [2.9896482273918434]
本稿では,多視点画像の制約を活かしたロバストな損失関数を提案し,あいまいさを緩和する。
我々の戦略は任意の深さ推定フレームワークで実装することができ、任意の大規模MVSデータセットでトレーニングすることができる。
提案手法は,DTU,タンク・アンド・テンプル,ETH3Dなどの一般的なベンチマーク上での最先端手法の性能に達する。
論文 参考訳(メタデータ) (2022-03-04T07:05:23Z) - Multi-Objective Dual Simplex-Mesh Based Deformable Image Registration
for 3D Medical Images -- Proof of Concept [0.7734726150561088]
本研究は,単純なメッシュに基づく3次元デュアルダイナミックグリッド変換モデルを用いて,多目的3次元変形可能な画像登録のための最初の手法を提案する。
概念実証プロトタイプは, 総合的, 臨床的な3D登録問題に対して有望な結果を示した。
論文 参考訳(メタデータ) (2022-02-22T16:07:29Z) - Multi-initialization Optimization Network for Accurate 3D Human Pose and
Shape Estimation [75.44912541912252]
我々はMulti-Initialization Optimization Network(MION)という3段階のフレームワークを提案する。
第1段階では,入力サンプルの2次元キーポイントに適合する粗い3次元再構成候補を戦略的に選択する。
第2段階では, メッシュ改質トランス (MRT) を設計し, 自己保持機構を用いて粗い再構成結果をそれぞれ洗練する。
最後に,RGB画像の視覚的証拠が与えられた3次元再構成と一致するかどうかを評価することで,複数の候補から最高の結果を得るために,一貫性推定ネットワーク(CEN)を提案する。
論文 参考訳(メタデータ) (2021-12-24T02:43:58Z) - Adjoint Rigid Transform Network: Task-conditioned Alignment of 3D Shapes [86.2129580231191]
Adjoint Rigid Transform (ART) Networkは、さまざまな3Dネットワークと統合可能なニューラルネットワークモジュールである。
ARTは入力の形状を学習した標準方向に回転させることを学び、多くのタスクに欠かせない。
さらなる研究のために、コードと事前訓練されたモデルをリリースします。
論文 参考訳(メタデータ) (2021-02-01T20:58:45Z) - Gram Regularization for Multi-view 3D Shape Retrieval [3.655021726150368]
本稿では,グラム正規化という新しい正規化用語を提案する。
重みカーネル間の分散を強要することにより、正規化器は識別的特徴を抽出するのに役立つ。
提案したグラム正規化はデータ独立であり、ベルやホイッスルを使わずに安定かつ迅速に収束することができる。
論文 参考訳(メタデータ) (2020-11-16T05:37:24Z) - Monocular, One-stage, Regression of Multiple 3D People [105.3143785498094]
我々は、複数の3D人物(ROMP)のための1段階方式で全てのメッシュを回帰することを提案する。
本手法は,体温マップとメッシュマップを同時に予測し,画素レベルの3Dボディメッシュを共同で記述する。
最先端の手法と比較して、ROMPは挑戦的なマルチパーソンベンチマークよりも優れた性能を示した。
論文 参考訳(メタデータ) (2020-08-27T17:21:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。