論文の概要: Back to the Future Cyclopean Stereo: a human perception approach combining deep and geometric constraints
- arxiv url: http://arxiv.org/abs/2502.21280v2
- Date: Sat, 08 Mar 2025 07:50:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-11 15:40:23.263533
- Title: Back to the Future Cyclopean Stereo: a human perception approach combining deep and geometric constraints
- Title(参考訳): 未来のサイクロペアンステレオ--深い制約と幾何学的制約を組み合わせた人間の知覚アプローチ
- Authors: Sherlon Almeida da Silva, Davi Geiger, Luiz Velho, Moacir Antonelli Ponti,
- Abstract要約: サイクロペアン眼モデルによる解析的3次元表面モデルを提供する。
この幾何学的基礎と学習されたステレオ特徴を組み合わせることで、システムは両方のアプローチの強みの恩恵を受けることができる。
本研究の目的は,三次元表面の幾何学的性質の理解とモデリングがコンピュータビジョン研究に有用であることを示すことである。
- 参考スコア(独自算出の注目度): 3.336618863186337
- License:
- Abstract: We innovate in stereo vision by explicitly providing analytical 3D surface models as viewed by a cyclopean eye model that incorporate depth discontinuities and occlusions. This geometrical foundation combined with learned stereo features allows our system to benefit from the strengths of both approaches. We also invoke a prior monocular model of surfaces to fill in occlusion regions or texture-less regions where data matching is not sufficient. Our results already are on par with the state-of-the-art purely data-driven methods and are of much better visual quality, emphasizing the importance of the 3D geometrical model to capture critical visual information. Such qualitative improvements may find applicability in virtual reality, for a better human experience, as well as in robotics, for reducing critical errors. Our approach aims to demonstrate that understanding and modeling geometrical properties of 3D surfaces is beneficial to computer vision research.
- Abstract(参考訳): 我々は,立体視において,深度不連続性や閉塞性を含むサイクロペアン眼モデルで見た解析的3次元表面モデルを提供することにより,立体視を革新する。
この幾何学的基礎と学習されたステレオ特徴を組み合わせることで、システムは両方のアプローチの強みの恩恵を受けることができる。
また、データマッチングが不十分なオクルージョン領域やテクスチャレス領域を埋めるために、表面の以前の単分子モデルを呼び出す。
我々の結果は、最先端の純粋にデータ駆動の手法に匹敵するものであり、重要な視覚情報を捉えるための3次元幾何学モデルの重要性を強調している。
このような質的な改善は、バーチャルリアリティー、より良い人間体験、そしてロボット工学に適用可能であり、致命的なエラーを減らす可能性がある。
本研究の目的は,三次元表面の幾何学的性質の理解とモデリングがコンピュータビジョン研究に有用であることを示すことである。
関連論文リスト
- Textured Mesh Saliency: Bridging Geometry and Texture for Human Perception in 3D Graphics [50.23625950905638]
6自由度(6-DOF)VR環境下での革新的な視線追跡実験により構築したテクスチャメッシュ・サリエンシのための新しいデータセットを提案する。
本モデルでは,各三角形の面を個々の単位として扱い,各局所表面領域の重要性を反映した塩分濃度値を割り当てることで,テクスチャメッシュ表面の塩分濃度マップを推定する。
論文 参考訳(メタデータ) (2024-12-11T08:27:33Z) - PGAHum: Prior-Guided Geometry and Appearance Learning for High-Fidelity Animatable Human Reconstruction [9.231326291897817]
我々はPGAHumを紹介した。PGAHumは、高忠実でアニマタブルな人体再構成のための、事前ガイダンス付き幾何学および外観学習フレームワークである。
我々はPGAHumの3つの主要モジュールにおける3次元人体前駆体を徹底的に利用し、複雑な細部と見えないポーズのフォトリアリスティックなビュー合成による高品質な幾何再構成を実現する。
論文 参考訳(メタデータ) (2024-04-22T04:22:30Z) - Uncertainty Guided Policy for Active Robotic 3D Reconstruction using
Neural Radiance Fields [82.21033337949757]
本稿では,物体の暗黙のニューラル表現の各光線に沿ったカラーサンプルの重量分布のエントロピーを計算した線量不確実性推定器を提案する。
提案した推定器を用いた新しい視点から, 基礎となる3次元形状の不確かさを推測することが可能であることを示す。
ニューラルラディアンス場に基づく表現における線量不確実性によって導かれる次ベクター選択ポリシーを提案する。
論文 参考訳(メタデータ) (2022-09-17T21:28:57Z) - RiCS: A 2D Self-Occlusion Map for Harmonizing Volumetric Objects [68.85305626324694]
カメラ空間における光マーチング (RiCS) は、3次元における前景物体の自己閉塞を2次元の自己閉塞マップに表現する新しい手法である。
表現マップは画像の質を高めるだけでなく,時間的コヒーレントな複雑な影効果をモデル化できることを示す。
論文 参考訳(メタデータ) (2022-05-14T05:35:35Z) - Learning Geometry-Guided Depth via Projective Modeling for Monocular 3D Object Detection [70.71934539556916]
射影モデルを用いて幾何学誘導深度推定を学習し, モノクル3次元物体検出を推し進める。
具体的には,モノクロ3次元物体検出ネットワークにおける2次元および3次元深度予測の投影モデルを用いた原理的幾何式を考案した。
本手法は, 適度なテスト設定において, 余分なデータを2.80%も加えることなく, 最先端単分子法の検出性能を著しく向上させる。
論文 参考訳(メタデータ) (2021-07-29T12:30:39Z) - Scalable Surface Reconstruction with Delaunay-Graph Neural Networks [14.128976778330474]
本稿では,大規模で欠陥のある点群に対して,新しい学習ベースで可視性に配慮した表面再構成手法を提案する。
実際のMVS(Multi-View Stereo)買収で発生する点雲欠陥のスケールと多様性に対処できる。
論文 参考訳(メタデータ) (2021-07-13T14:30:32Z) - Learning 3D Face Reconstruction with a Pose Guidance Network [49.13404714366933]
ポーズ誘導ネットワーク(PGN)を用いた単眼3次元顔再構成学習のための自己指導型学習手法を提案する。
まず,従来のパラメトリックな3次元顔の学習手法におけるポーズ推定のボトルネックを明らかにし,ポーズパラメータの推定に3次元顔のランドマークを活用することを提案する。
我々のデザインしたPGNでは、完全にラベル付けされた3Dランドマークと無制限にラベル付けされた未使用の顔画像で両方の顔から学習できる。
論文 参考訳(メタデータ) (2020-10-09T06:11:17Z) - Pix2Surf: Learning Parametric 3D Surface Models of Objects from Images [64.53227129573293]
1つ以上の視点から見れば、新しいオブジェクトの3次元パラメトリック表面表現を学習する際の課題について検討する。
ビュー間で一貫した高品質なパラメトリックな3次元表面を生成できるニューラルネットワークを設計する。
提案手法は,共通対象カテゴリからの形状の公開データセットに基づいて,教師と訓練を行う。
論文 参考訳(メタデータ) (2020-08-18T06:33:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。