論文の概要: QuadSync: Quadrifocal Tensor Synchronization via Tucker Decomposition
- arxiv url: http://arxiv.org/abs/2602.22639v1
- Date: Thu, 26 Feb 2026 05:42:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-27 18:41:22.542337
- Title: QuadSync: Quadrifocal Tensor Synchronization via Tucker Decomposition
- Title(参考訳): QuadSync: Tucker分解による四焦点テンソル同期
- Authors: Daniel Miao, Gilad Lerman, Joe Kileel,
- Abstract要約: 運動からの構造において、四焦点テンソルは2対のテンソルよりも多くの情報を取得する。
我々は、対応する四焦点テンソルの集合から$n$カメラを回収する新しいフレームワークを提供する。
四焦点テンソルに対する最初の同期アルゴリズムを開発した。
- 参考スコア(独自算出の注目度): 13.088625380700933
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In structure from motion, quadrifocal tensors capture more information than their pairwise counterparts (essential matrices), yet they have often been thought of as impractical and only of theoretical interest. In this work, we challenge such beliefs by providing a new framework to recover $n$ cameras from the corresponding collection of quadrifocal tensors. We form the block quadrifocal tensor and show that it admits a Tucker decomposition whose factor matrices are the stacked camera matrices, and which thus has a multilinear rank of (4,~4,~4,~4) independent of $n$. We develop the first synchronization algorithm for quadrifocal tensors, using Tucker decomposition, alternating direction method of multipliers, and iteratively reweighted least squares. We further establish relationships between the block quadrifocal, trifocal, and bifocal tensors, and introduce an algorithm that jointly synchronizes these three entities. Numerical experiments demonstrate the effectiveness of our methods on modern datasets, indicating the potential and importance of using higher-order information in synchronization.
- Abstract(参考訳): 運動からの構造において、四焦点テンソルは両辺の行列(固有行列)よりも多くの情報を取得するが、それらはしばしば非現実的であり、理論的な関心のみであると考えられている。
本研究では、対応する四焦点テンソルの集合から$n$カメラを回収する新しいフレームワークを提供することで、そのような信念に挑戦する。
ブロック四焦点テンソルを形成して、係数行列が積み重ねられたカメラ行列であるタッカー分解を許容し、したがって$n$とは無関係に (4,~4,~4,~4) の多重線型階数を持つことを示す。
我々は,タッカー分解,乗算器の交互方向法,反復的に再重み付けされた最小二乗法を用いて,四焦点テンソルに対する最初の同期アルゴリズムを開発した。
さらに、ブロック四焦点、三焦点、二焦点テンソル間の関係を確立し、これら3つの実体を協調的に同期させるアルゴリズムを導入する。
数値実験により,現代のデータセットにおける手法の有効性が示され,同期における高次情報の利用の可能性と重要性が示唆された。
関連論文リスト
- SyncTrack4D: Cross-Video Motion Alignment and Video Synchronization for Multi-Video 4D Gaussian Splatting [50.69165364520998]
実世界の非同期ビデオ集合を扱うために, マルチビデオ4Dガウススプラッティング (4DGS) 方式を提案する。
SyncTrack4Dは、4DGSの同時同期と4DGS再構成のためのキューとして動的シーンの高密度な4Dトラック表現を直接活用する。
我々はPanoptic Studio と SyncNeRF Blender に対するアプローチを評価し,0.26 フレーム以下の平均時間誤差でサブフレーム同期精度を示し,高忠実度 4D 再構成は26.3 PSNR スコアに達した。
論文 参考訳(メタデータ) (2025-12-03T23:05:01Z) - Diff4Splat: Controllable 4D Scene Generation with Latent Dynamic Reconstruction Models [79.06910348413861]
Diff4Splatは、単一の画像から制御可能で明示的な4Dシーンを合成するフィードフォワード方式である。
単一の入力画像、カメラ軌跡、オプションのテキストプロンプトが与えられた場合、Diff4Splatは外見、幾何学、動きを符号化する変形可能な3Dガウス場を直接予測する。
論文 参考訳(メタデータ) (2025-11-01T11:16:25Z) - Can We Achieve Efficient Diffusion without Self-Attention? Distilling Self-Attention into Convolutions [94.21989689001848]
従来の自己アテンションモジュールをピラミッド畳み込みブロック((Delta)ConvBlocks)に置き換えるための(Delta)ConvFusionを提案する。
ローカライズされた畳み込み操作に注意パターンを蒸留し、他のコンポーネントを凍結させながら、(Delta)ConvFusionは、トランスフォーマーベースの処理に匹敵する性能を達成し、計算コストを6929$times$、LinFusionを5.42$times$の効率で上回る。
論文 参考訳(メタデータ) (2025-04-30T03:57:28Z) - Tensor-Based Synchronization and the Low-Rankness of the Block Trifocal Tensor [11.647583930036754]
同期問題は ブロック三焦点テンソルから カメラのポーズを復元する
このランク制約は、ノイズレスケースにおけるカメラのリカバリに十分な情報を提供することを示す。
実データセット上での最先端のグローバル同期手法との比較実験により,位置推定精度を大幅に向上させるアルゴリズムの可能性を示した。
論文 参考訳(メタデータ) (2024-09-14T05:17:04Z) - Semi-Supervised Subspace Clustering via Tensor Low-Rank Representation [64.49871502193477]
本稿では,初期監視情報を同時に拡張し,識別親和性行列を構築することのできる,新しい半教師付きサブスペースクラスタリング手法を提案する。
6つの一般的なベンチマークデータセットの総合的な実験結果から,本手法が最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-05-21T01:47:17Z) - On the Integration of Self-Attention and Convolution [33.899471118470416]
畳み込みと自己意識は表現学習の強力なテクニックである。
本稿では,両者の間には強い基礎的関係が存在することを示す。
これら2つのパラダイムの計算の大部分は、実際には同じ操作で行われていることを示す。
論文 参考訳(メタデータ) (2021-11-29T14:37:05Z) - Tensor Representations for Action Recognition [54.710267354274194]
シーケンスにおける人間の行動は、空間的特徴とその時間的ダイナミクスの複雑な相互作用によって特徴づけられる。
アクション認識タスクの視覚的特徴間の高次関係を捉えるための新しいテンソル表現を提案する。
我々は,高次テンソルといわゆる固有値パワー正規化(NEP)を用いて,高次事象のスペクトル検出を行う。
論文 参考訳(メタデータ) (2020-12-28T17:27:18Z) - Overcomplete order-3 tensor decomposition, blind deconvolution and
Gaussian mixture models [1.7970523486905976]
我々は,ジェンリッヒのアルゴリズムに基づくテンソル分解の新しいアルゴリズムを提案し,新しいアルゴリズムのアイデアをブラインドデコンボリューションとガウス混合モデルに適用する。
我々の最初の貢献は、ある対称超完全位数-3テンソルを分解する単純かつ効率的なアルゴリズムであり、すなわち、$a_i$s が線型独立でないような $T = sum_i=1n a_i otimes a_i otimes a_i$ という形の3次元配列である。
第2の貢献は、テンソル分解アルゴリズムの上に構築され、ファミリーを拡大する。
論文 参考訳(メタデータ) (2020-07-16T06:23:37Z) - MotioNet: 3D Human Motion Reconstruction from Monocular Video with
Skeleton Consistency [72.82534577726334]
モノクロビデオから3次元人間の骨格の動きを直接再構成するディープニューラルネットワークであるMotioNetを紹介した。
本手法は,動作表現を完全かつ一般的に使用するキネマティックスケルトンを直接出力する最初のデータ駆動型手法である。
論文 参考訳(メタデータ) (2020-06-22T08:50:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。