論文の概要: GMAC: Global Multi-View Constraint for Automatic Multi-Camera Extrinsic Calibration
- arxiv url: http://arxiv.org/abs/2602.01033v2
- Date: Thu, 05 Feb 2026 01:29:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-06 14:11:23.837801
- Title: GMAC: Global Multi-View Constraint for Automatic Multi-Camera Extrinsic Calibration
- Title(参考訳): GMAC: 自動マルチカメラ外部校正のためのグローバルマルチビュー制約
- Authors: Chentian Sun,
- Abstract要約: GMACは、再構成ネットワークによって学習された暗黙的幾何学的表現に基づく、マルチカメラ外部推定フレームワークである。
GMACは、明確な3次元再構成や手動キャリブレーションなしで、正確で安定した外部推定を実現する。
- 参考スコア(独自算出の注目度): 1.3537117504260623
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Automatic calibration of multi-camera systems, namely the accurate estimation of spatial extrinsic parameters, is fundamental for 3D reconstruction, panoramic perception, and multi-view data fusion. Existing methods typically rely on calibration targets, explicit geometric modeling, or task-specific neural networks. Such approaches often exhibit limited robustness and applicability in complex dynamic environments or online scenarios, making them difficult to deploy in practical applications. To address this, this paper proposes GMAC, a multi-camera extrinsic estimation framework based on the implicit geometric representations learned by multi-view reconstruction networks. GMAC models extrinsics as global variables constrained by the latent multi-view geometric structure and prunes and structurally reconfigures existing networks so that their latent features can directly support extrinsic prediction through a lightweight regression head, without requiring a completely new network design. Furthermore, GMAC jointly optimizes cross-view reprojection consistency and multi-view cycle consistency, ensuring geometric coherence across cameras while improving prediction accuracy and optimization stability. Experiments on both synthetic and real-world multi-camera datasets demonstrate that GMAC achieves accurate and stable extrinsic estimation without explicit 3D reconstruction or manual calibration, providing a new solution for efficient deployment and online calibration of multi-camera systems.
- Abstract(参考訳): 空間外部パラメータの正確な推定を行うマルチカメラシステムの自動校正は、3次元再構成、パノラマ知覚、マルチビューデータ融合の基礎となる。
既存の手法は通常、キャリブレーションターゲット、明示的な幾何学的モデリング、タスク固有のニューラルネットワークに依存している。
このようなアプローチは、複雑な動的環境やオンラインシナリオにおいて、限られた堅牢性と適用性を示し、実用的なアプリケーションへのデプロイが困難になる。
そこで本研究では,マルチビュー再構成ネットワークで学習した暗黙的幾何表現に基づくマルチカメラ外部推定フレームワークであるGMACを提案する。
GMACモデルは、潜在多視点幾何学構造とプルーによって制約された大域的変数として外在的であり、既存のネットワークを構造的に再構成し、その潜在機能は、完全に新しいネットワーク設計を必要とせず、軽量回帰ヘッドを介して外在的予測を直接サポートできるようにしている。
さらに、GMACはクロスビュー・リジェクションの整合性とマルチビュー・サイクルの整合性を共同で最適化し、カメラ間の幾何コヒーレンスを確保するとともに、予測精度と最適化安定性を向上させる。
合成と実世界の両方のマルチカメラデータセットの実験により、GMACは明示的な3D再構成や手動キャリブレーションなしで正確で安定した外部推定を実現し、マルチカメラシステムの効率的なデプロイとオンラインキャリブレーションのための新しいソリューションを提供する。
関連論文リスト
- TALO: Pushing 3D Vision Foundation Models Towards Globally Consistent Online Reconstruction [57.46712611558817]
3次元視覚基礎モデルでは、1つのフィードフォワードパスを通して、未校正画像からキー3D属性を再構成する際の強力な一般化が示されている。
近年の戦略は,グローバルトランスフォーメーションの解決によって連続的な予測と整合するが,本分析では,仮定の妥当性,局所的なアライメント範囲,雑音的幾何の下でのロバスト性といった基本的な限界を明らかにしている。
本研究では,グローバルに伝播する制御点を利用して空間的に異なる不整合を補正する,Tin Plate Splineに基づく高DOFおよび長期アライメントフレームワークを提案する。
論文 参考訳(メタデータ) (2025-12-02T02:22:20Z) - MoRE: 3D Visual Geometry Reconstruction Meets Mixture-of-Experts [50.37005070020306]
MoREは、Mixture-of-Experts (MoE)アーキテクチャに基づいた、密集した3Dビジュアル基盤モデルである。
MoREは、幾何推定を安定させ、洗練する信頼に基づく深度補正モジュールを組み込んでいる。
高忠実な表面正規予測のために,高密度なセマンティック特徴とグローバルな3Dバックボーン表現を統合する。
論文 参考訳(メタデータ) (2025-10-31T06:54:27Z) - JOGS: Joint Optimization of Pose Estimation and 3D Gaussian Splatting [10.35563602148445]
本稿では,3次元ガウス点とカメラポーズを事前校正入力を必要とせずに協調的に最適化する統合フレームワークを提案する。
我々のアプローチは、3Dガウスパラメータを反復的に洗練し、新しいコ最適化戦略によってカメラのポーズを更新する。
提案手法は,再建品質において既存のCOLMAPフリー技術よりも優れており,標準のCOLMAPベースラインをはるかに上回っている。
論文 参考訳(メタデータ) (2025-10-30T04:00:07Z) - WorldMirror: Universal 3D World Reconstruction with Any-Prior Prompting [51.69408870574092]
汎用的な3次元幾何予測タスクのためのオールインワンフィードフォワードモデルであるWorldMirrorを提案する。
我々のフレームワークは、カメラのポーズ、内在性、深度マップなど、様々な幾何学的先入観を柔軟に統合する。
WorldMirrorは、カメラ、ポイントマップ、深さ、表面正規推定から新しいビュー合成に至るまで、さまざまなベンチマークで最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2025-10-12T17:59:09Z) - CHROMA: Consistent Harmonization of Multi-View Appearance via Bilateral Grid Prediction [30.088316989385106]
カメラパイプラインは、露光調整、ホワイトバランス、色補正など、デバイス上の広範な処理を適用する。
外観の変化は複数ビューの一貫性に反し、新しいビュー合成を劣化させる。
多視点一貫した方法で測光変動を補正するために、空間適応型二元格子を予測できる一般化可能なフィードフォワード手法を提案する。
論文 参考訳(メタデータ) (2025-07-21T16:03:58Z) - Review of Feed-forward 3D Reconstruction: From DUSt3R to VGGT [10.984522161856955]
3D再構成は、拡張現実やバーチャルリアリティー、自動運転、ロボット工学など、多くの応用の基盤となる技術だ。
ディープラーニングは、3D再構築におけるパラダイムシフトを触媒している。
新しいモデルでは、統合されたディープネットワークを使用して、カメラのポーズと密集した幾何学を、1つの前方通過における非拘束画像から直接推測する。
論文 参考訳(メタデータ) (2025-07-11T09:41:54Z) - Spectral Graphormer: Spectral Graph-based Transformer for Egocentric
Two-Hand Reconstruction using Multi-View Color Images [33.70056950818641]
マルチビューRGB画像から2つの高忠実度ハンドを再構成するトランスフォーマーベースの新しいフレームワークを提案する。
本研究では, 実データへの合成学習モデルの一般化を実証し, 現実的な両手再構成を実現できることを示す。
論文 参考訳(メタデータ) (2023-08-21T20:07:02Z) - Progressive Multi-view Human Mesh Recovery with Self-Supervision [68.60019434498703]
既存のソリューションは通常、新しい設定への一般化性能の低下に悩まされる。
マルチビューヒューマンメッシュリカバリのためのシミュレーションに基づく新しいトレーニングパイプラインを提案する。
論文 参考訳(メタデータ) (2022-12-10T06:28:29Z) - MonoSDF: Exploring Monocular Geometric Cues for Neural Implicit Surface
Reconstruction [72.05649682685197]
最先端のニューラル暗黙法は、多くの入力ビューから単純なシーンの高品質な再構築を可能にする。
これは主に、十分な制約を提供していないRGB再構築損失の固有の曖昧さによって引き起こされる。
近年の単分子形状予測の分野での進歩に触発され, ニューラルな暗黙的表面再構成の改善にこれらの方法が役立つかを探究する。
論文 参考訳(メタデータ) (2022-06-01T17:58:15Z) - PaMIR: Parametric Model-Conditioned Implicit Representation for
Image-based Human Reconstruction [67.08350202974434]
本研究では,パラメトリックボディモデルと自由形深部暗黙関数を組み合わせたパラメトリックモデル記述型暗黙表現(PaMIR)を提案する。
本手法は, 挑戦的なポーズや衣料品のタイプにおいて, 画像に基づく3次元再構築のための最先端性能を実現する。
論文 参考訳(メタデータ) (2020-07-08T02:26:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。