Fugu-MT 論文翻訳(概要): Unsupervised 2D-3D lifting of non-rigid objects using local constraints

論文の概要: Unsupervised 2D-3D lifting of non-rigid objects using local constraints

arxiv url: http://arxiv.org/abs/2504.19227v1
Date: Sun, 27 Apr 2025 13:09:14 GMT
ステータス: 翻訳完了
システム内更新日: 2025-05-02 19:15:54.188903
Title: Unsupervised 2D-3D lifting of non-rigid objects using local constraints
Title（参考訳）: 局所的制約を用いた非剛体物体の非教師なし2D-3D昇降
Authors: Shalini Maiti, Lourdes Agapito, Benjamin Graham,
Abstract要約: 教師なし損失で訓練された汎用高容量モデルにより、より正確な予測形状が得られることを示す。 S-Up3Dデータセットの最先端復元誤差を70%以上削減する。
参考スコア（独自算出の注目度）: 12.142971115197724
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: For non-rigid objects, predicting the 3D shape from 2D keypoint observations is ill-posed due to occlusions, and the need to disentangle changes in viewpoint and changes in shape. This challenge has often been addressed by embedding low-rank constraints into specialized models. These models can be hard to train, as they depend on finding a canonical way of aligning observations, before they can learn detailed geometry. These constraints have limited the reconstruction quality. We show that generic, high capacity models, trained with an unsupervised loss, allow for more accurate predicted shapes. In particular, applying low-rank constraints to localized subsets of the full shape allows the high capacity to be suitably constrained. We reduce the state-of-the-art reconstruction error on the S-Up3D dataset by over 70%.
Abstract（参考訳）: 非剛体物体の場合、2次元のキーポイント観測から3次元形状を予測することは、閉塞によって悪影響を及ぼし、視点の変化や形状の変化を歪める必要が生じる。この課題は、しばしば、特殊なモデルに低ランクの制約を埋め込むことによって解決されてきた。これらのモデルは、詳細な幾何学を学ぶ前に、観測を整列する標準的な方法を見つけることに依存するため、訓練が難しい。これらの制約は再建の質を制限した。教師なし損失で訓練された汎用高容量モデルにより、より正確な予測形状が得られることを示す。特に、フル形状の局所化部分集合にローランク制約を適用することで、高い容量を適切に制約することができる。 S-Up3Dデータセットの最先端復元誤差を70%以上削減する。

関連論文リスト

Where, Not What: Compelling Video LLMs to Learn Geometric Causality for 3D-Grounding [0.8883733362171032]
この問題に対処するために,What-Where Representation Re-Forming (W2R2) と呼ばれる新しいトレーニングフレームワークを提案する。提案手法は,2次元特徴を「何」識別のための意味的ビーコン,3次元特徴を「Where」ローカライゼーションのための空間的アンカーとして指定することにより,モデルの内部空間を根本的に改善する。 ScanReferとScanQAで行った実験では、W2R2の有効性が示され、ローカライゼーションの精度とロバスト性が大きく向上した。
論文参考訳（メタデータ） (2025-10-19T22:40:18Z)
Object Gaussian for Monocular 6D Pose Estimation from Sparse Views [4.290993205307184]
ガウス的手法を用いたスパースビューオブジェクトポーズ推定のための新しいフレームワークであるSGPoseを紹介する。最大10ビューを与えられたSGPoseは、ランダムな立方体から始めることで幾何学的認識表現を生成する。典型的なベンチマーク、特にOcclusion LM-Oデータセットの実験では、SGPoseはスパースビューの制約下であっても既存のメソッドよりも優れていることを示した。
論文参考訳（メタデータ） (2024-09-04T10:03:11Z)
FILP-3D: Enhancing 3D Few-shot Class-incremental Learning with Pre-trained Vision-Language Models [59.13757801286343]
クラス増分学習(class-incremental learning)は、モデルが限られたデータで漸進的にトレーニングされている場合、破滅的な忘れの問題を軽減することを目的としている。本稿では,特徴空間の不整合のための冗長特徴除去器 (RFE) と,重要な雑音に対する空間ノイズ補償器 (SNC) の2つの新しいコンポーネントを備えたFILP-3Dフレームワークを紹介する。
論文参考訳（メタデータ） (2023-12-28T14:52:07Z)
Improving Neural Indoor Surface Reconstruction with Mask-Guided Adaptive Consistency Constraints [0.6749750044497732]
本稿では、ビュー依存色とビュー非依存色を分離する2段階のトレーニングプロセスを提案し、さらに2つの新しい一貫性制約を活用して、余分な事前処理を必要とせず、詳細な再構成性能を向上させる。合成および実世界のデータセットの実験は、事前推定誤差から干渉を減らす能力を示している。
論文参考訳（メタデータ） (2023-09-18T13:05:23Z)
Robust Geometry-Preserving Depth Estimation Using Differentiable Rendering [93.94371335579321]
我々は、余分なデータやアノテーションを必要とせずに、幾何学保存深度を予測するためにモデルを訓練する学習フレームワークを提案する。包括的な実験は、我々のフレームワークの優れた一般化能力を強調します。我々の革新的な損失関数は、ドメイン固有のスケール・アンド・シフト係数を自律的に復元するモデルを可能にします。
論文参考訳（メタデータ） (2023-09-18T12:36:39Z)
LInKs "Lifting Independent Keypoints" -- Partial Pose Lifting for Occlusion Handling with Improved Accuracy in 2D-3D Human Pose Estimation [4.648549457266638]
2Dキネマティックスケルトンから3D人間のポーズを復元する新しい教師なし学習法であるLInKsを提案する。提案手法は,まず3次元領域に隠された2次元のポーズを持ち上げるという,ユニークな2段階のプロセスに従う。このリフト・テン・フィルのアプローチは、2次元空間でのみポーズを完了したモデルよりもはるかに正確な結果をもたらす。
論文参考訳（メタデータ） (2023-09-13T18:28:04Z)
Weakly Supervised 3D Object Detection with Multi-Stage Generalization [62.96670547848691]
擬似ラベル生成と多段階一般化を含むBA$2$-Detを導入する。一般化の3つの段階、完全から部分へ、静的から動的へ、そして遠い距離へ進む。 BA$2$-Detは、KITTIデータセットの20%の相対的な改善を達成できる。
論文参考訳（メタデータ） (2023-06-08T17:58:57Z)
Towards Accurate Reconstruction of 3D Scene Shape from A Single Monocular Image [91.71077190961688]
まず、未知のスケールまで深さを予測し、単一の単眼画像からシフトする2段階のフレームワークを提案する。次に、3Dポイントの雲のデータを利用して、奥行きの変化とカメラの焦点距離を予測し、3Dシーンの形状を復元します。我々は9つの未知のデータセットで深度モデルを検証し、ゼロショット評価で最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (2022-08-28T16:20:14Z)
Learning to Recover 3D Scene Shape from a Single Image [98.20106822614392]
まず,未知のスケールまで深さを予測し,単一の単眼画像からシフトする2段階フレームワークを提案する。そして、3dポイントクラウドエンコーダを使って深度シフトと焦点距離を予測し、リアルな3dシーンの形状を復元します。
論文参考訳（メタデータ） (2020-12-17T02:35:13Z)
Weakly Supervised 3D Hand Pose Estimation via Biomechanical Constraints [112.15463517171571]
2次元画像から3次元手ポーズを推定することは、固有のスケールと深さのあいまいさのために困難で逆問題である。提案した制約は深度あいまいさを著しく低減し, 付加的な2次元アノテート画像の有効利用を可能にした。
論文参考訳（メタデータ） (2020-03-20T14:03:13Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。