論文の概要: Pose Refinement with Joint Optimization of Visual Points and Lines
- arxiv url: http://arxiv.org/abs/2110.03940v1
- Date: Fri, 8 Oct 2021 07:22:51 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-11 16:29:06.498218
- Title: Pose Refinement with Joint Optimization of Visual Points and Lines
- Title(参考訳): ビジュアルポイントとラインの協調最適化によるポースリファインメント
- Authors: Shuang Gao, Jixiang Wan, Yishan Ping, Xudong Zhang, Shuzhou Dong,
Jijunnan Li, Yandong Guo
- Abstract要約: VLSEという名前のCNNを革新的に設計したライン抽出の助けを借りて、ポーズ改善のためのポイントライン共同最適化手法を提案する。
本稿では,新しいライン表現を採用し,スタックド・ホールグラスネットワークに基づくハイブリッド畳み込みブロックをカスタマイズする。
初期粗いポーズでカメラポーズを最適化するために、以下のポイントラインジョイントコスト関数を構築する。
- 参考スコア(独自算出の注目度): 6.780018205514503
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: High-precision camera re-localization technology in a pre-established 3D
environment map is the basis for many tasks, such as Augmented Reality,
Robotics and Autonomous Driving. The point-based visual re-localization
approaches are well-developed in recent decades, but are insufficient in some
feature-less cases. In this paper, we propose a point-line joint optimization
method for pose refinement with the help of the innovatively designed line
extracting CNN named VLSE, and the line matching and pose optimization
approach. We adopt a novel line representation and customize a hybrid
convolutional block based on the Stacked Hourglass network, to detect accurate
and stable line features on images. Then we apply a coarse-to-fine strategy to
obtain precise 2D-3D line correspondences based on the geometric constraint. A
following point-line joint cost function is constructed to optimize the camera
pose with the initial coarse pose. Sufficient experiments are conducted on open
datasets, i.e, line extractor on Wireframe and YorkUrban, localization
performance on Aachen Day-Night v1.1 and InLoc, to confirm the effectiveness of
our point-line joint pose optimization method.
- Abstract(参考訳): 事前確立された3d環境マップにおける高精度カメラの再ローカライズ技術は、拡張現実、ロボット工学、自動運転など多くのタスクの基盤である。
ポイントベースの視覚的再局在アプローチは、ここ数十年で十分に開発されているが、機能のないケースでは不十分である。
本稿では,vlseという革新的なcnn抽出手法と,ラインマッチングとポーズ最適化手法を用いて,ポーズ改善のためのポイントライン統合最適化手法を提案する。
本研究では,重ねられた砂時計網に基づくハイブリッド畳み込みブロックをカスタマイズし,画像上の高精度で安定な線特徴を検出する。
次に, 幾何的制約に基づく2D-3D線対応を得るために, 粗大な戦略を適用した。
初期粗いポーズでカメラポーズを最適化するために、以下のポイントラインジョイントコスト関数を構築する。
オープンデータセット、すなわちワイヤフレームとヨークアーバンの線抽出装置、アーヘンの昼夜v1.1とinlocのローカライズ性能について十分な実験を行い、ポイントラインジョイントポーズ最適化手法の有効性を確認した。
関連論文リスト
- HGSLoc: 3DGS-based Heuristic Camera Pose Refinement [13.393035855468428]
視覚的ローカライゼーションは、既知のシーン表現内のカメラのポーズと方向を決定するプロセスを指す。
本稿では,3次元再構成と改良戦略を統合したHGSLocを提案する。
提案手法は,NeRFベースのニューラルレンダリング手法と比較して,高速なレンダリング速度とローカライズ精度を示す。
論文 参考訳(メタデータ) (2024-09-17T06:48:48Z) - SG-NeRF: Neural Surface Reconstruction with Scene Graph Optimization [16.460851701725392]
本稿では,外乱ポーズの影響を軽減するため,シーングラフを用いた放射場最適化手法を提案する。
本手法では,シーングラフに基づく適応型不整合・不整合信頼度推定手法を取り入れた。
また、カメラのポーズと表面形状を最適化するために、効果的な交叉結合(IoU)損失を導入する。
論文 参考訳(メタデータ) (2024-07-17T15:50:17Z) - OrientDream: Streamlining Text-to-3D Generation with Explicit Orientation Control [66.03885917320189]
OrientDreamは、テキストプロンプトから効率よくマルチビューで一貫した3D生成のためのカメラ指向条件付きフレームワークである。
本戦略は,2次元テキスト・画像拡散モジュールの事前学習におけるカメラ配向条件付き機能の実装を強調する。
提案手法は,一貫したマルチビュー特性を持つ高品質なNeRFモデルを生成するだけでなく,既存手法よりも最適化速度が大幅に向上することを示した。
論文 参考訳(メタデータ) (2024-06-14T13:16:18Z) - Vanishing Point Estimation in Uncalibrated Images with Prior Gravity
Direction [82.72686460985297]
我々はマンハッタンのフレームを推定する問題に取り組む。
2つの新しい2行解法が導出され、そのうちの1つは既存の解法に影響を与える特異点に悩まされない。
また、局所最適化の性能を高めるために、任意の行で実行される新しい最小でないメソッドを設計する。
論文 参考訳(メタデータ) (2023-08-21T13:03:25Z) - FrozenRecon: Pose-free 3D Scene Reconstruction with Frozen Depth Models [67.96827539201071]
本稿では,3次元シーン再構成のための新しいテスト時間最適化手法を提案する。
本手法は5つのゼロショットテストデータセット上で,最先端のクロスデータセット再構築を実現する。
論文 参考訳(メタデータ) (2023-08-10T17:55:02Z) - Towards Scalable Multi-View Reconstruction of Geometry and Materials [27.660389147094715]
本稿では,3次元シーンのカメラポーズ,オブジェクト形状,空間変化の両方向反射分布関数(svBRDF)のジョイントリカバリ手法を提案する。
入力は高解像度のRGBD画像であり、アクティブ照明用の点灯付き携帯型ハンドヘルドキャプチャシステムによってキャプチャされる。
論文 参考訳(メタデータ) (2023-06-06T15:07:39Z) - Geometric-aware Pretraining for Vision-centric 3D Object Detection [77.7979088689944]
GAPretrainと呼ばれる新しい幾何学的事前学習フレームワークを提案する。
GAPretrainは、複数の最先端検出器に柔軟に適用可能なプラグアンドプレイソリューションとして機能する。
BEVFormer法を用いて, nuScenes val の 46.2 mAP と 55.5 NDS を実現し, それぞれ 2.7 と 2.1 点を得た。
論文 参考訳(メタデータ) (2023-04-06T14:33:05Z) - Adaptive Joint Optimization for 3D Reconstruction with Differentiable
Rendering [22.2095090385119]
完璧に再構成された3Dモデルを考えると、従来の手法は幾何学、テクスチャ、カメラのポーズの洗練に重点を置いてきた。
本稿では、カメラポーズ、幾何学、テクスチャの最適化を統一されたフレームワークに統合する、微分可能レンダリングに基づく新しい最適化手法を提案する。
微分可能レンダリングを用いることで、3Dモデルをさらに改善し、よりフォトリアリスティックにすることができる。
論文 参考訳(メタデータ) (2022-08-15T04:32:41Z) - Multi-initialization Optimization Network for Accurate 3D Human Pose and
Shape Estimation [75.44912541912252]
我々はMulti-Initialization Optimization Network(MION)という3段階のフレームワークを提案する。
第1段階では,入力サンプルの2次元キーポイントに適合する粗い3次元再構成候補を戦略的に選択する。
第2段階では, メッシュ改質トランス (MRT) を設計し, 自己保持機構を用いて粗い再構成結果をそれぞれ洗練する。
最後に,RGB画像の視覚的証拠が与えられた3次元再構成と一致するかどうかを評価することで,複数の候補から最高の結果を得るために,一貫性推定ネットワーク(CEN)を提案する。
論文 参考訳(メタデータ) (2021-12-24T02:43:58Z) - Riggable 3D Face Reconstruction via In-Network Optimization [58.016067611038046]
本稿では,単眼画像からの3次元顔再構成法を提案する。
表情、ポーズ、照明を含む画像ごとのパーソナライズされた顔リグとパラメータを共同で推定する。
実験により,SOTA復元精度,ロバスト性,一般化能力が得られた。
論文 参考訳(メタデータ) (2021-04-08T03:53:20Z) - Deep-3DAligner: Unsupervised 3D Point Set Registration Network With
Optimizable Latent Vector [15.900382629390297]
本稿では,3次元登録における技術的課題に対処するために,学習に最適化を統合する新しいモデルを提案する。
ディープトランスフォーメーションデコーディングネットワークに加えて、我々のフレームワークは最適化可能なディープアンダーラインSpatial UnderlineCorrelation UnderlineRepresentationを導入している。
論文 参考訳(メタデータ) (2020-09-29T22:44:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。