論文の概要: Investigating Image Manifolds of 3D Objects: Learning, Shape Analysis, and Comparisons
- arxiv url: http://arxiv.org/abs/2503.06773v1
- Date: Sun, 09 Mar 2025 21:00:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-11 15:48:28.589885
- Title: Investigating Image Manifolds of 3D Objects: Learning, Shape Analysis, and Comparisons
- Title(参考訳): 3次元物体のイメージマニフォールド:学習, 形状解析, 比較
- Authors: Benjamin Beaudett, Shenyuan Liang, Anuj Srivastava,
- Abstract要約: 画像の高次元性にもかかわらず、3次元物体の像の集合は長い間、低次元多様体を形成すると仮定されてきた。
本稿では,多様体学習の古典的問題を再考するが,新しい幾何学的観点から考察する。
画像多様体のジオメトリは、視覚と画像処理タスクを単純化し、パフォーマンスを予測し、学習方法に関する洞察を提供するために利用することができる。
- 参考スコア(独自算出の注目度): 9.326260051834822
- License:
- Abstract: Despite high-dimensionality of images, the sets of images of 3D objects have long been hypothesized to form low-dimensional manifolds. What is the nature of such manifolds? How do they differ across objects and object classes? Answering these questions can provide key insights in explaining and advancing success of machine learning algorithms in computer vision. This paper investigates dual tasks -- learning and analyzing shapes of image manifolds -- by revisiting a classical problem of manifold learning but from a novel geometrical perspective. It uses geometry-preserving transformations to map the pose image manifolds, sets of images formed by rotating 3D objects, to low-dimensional latent spaces. The pose manifolds of different objects in latent spaces are found to be nonlinear, smooth manifolds. The paper then compares shapes of these manifolds for different objects using Kendall's shape analysis, modulo rigid motions and global scaling, and clusters objects according to these shape metrics. Interestingly, pose manifolds for objects from the same classes are frequently clustered together. The geometries of image manifolds can be exploited to simplify vision and image processing tasks, to predict performances, and to provide insights into learning methods.
- Abstract(参考訳): 画像の高次元性にもかかわらず、3次元物体の像の集合は、長い間、低次元多様体を形成すると仮定されてきた。
そのような多様体の性質は何ですか。
オブジェクトとオブジェクトのクラス間でどのように異なるのか?
これらの質問に答えることで、コンピュータビジョンにおける機械学習アルゴリズムの説明と成功の進展に関する重要な洞察が得られる。
本稿では、古典的な多様体学習の問題を再考することによって、画像多様体の形状を学習・解析する双対タスクについて、新しい幾何学的視点から検討する。
幾何学保存変換を用いて、3Dオブジェクトを回転させた画像の集合であるポーズ像多様体を低次元ラテント空間にマッピングする。
潜在空間における異なる対象のポーズ多様体は、非線形で滑らかな多様体であることが分かる。
次に、これらの多様体の形状を、ケンドールの形状解析、モジュロ剛性運動、大域的スケーリング、およびこれらの形状測定値に従ってクラスタオブジェクトを用いて比較する。
興味深いことに、同じクラスのオブジェクトに対するポーズ多様体は、しばしば一緒にクラスタ化される。
画像多様体のジオメトリは、視覚と画像処理タスクを単純化し、パフォーマンスを予測し、学習方法に関する洞察を提供するために利用することができる。
関連論文リスト
- Learning Pose Image Manifolds Using Geometry-Preserving GANs and
Elasticae [13.202747831999414]
Geometric Style-GAN (Geom-SGAN) は画像を低次元の潜在表現にマッピングする。
オイラーの弾性体は、低次元ラテント空間における有向点(点 + 接方向)の間を滑らかに補間する。
論文 参考訳(メタデータ) (2023-05-17T18:45:56Z) - Geo-SIC: Learning Deformable Geometric Shapes in Deep Image Classifiers [8.781861951759948]
本稿では,画像分類の性能向上のために,変形空間における変形可能な形状を学習する最初のディープラーニングモデルGeo-SICを提案する。
画像空間と潜時形状空間の両方から特徴を同時に導出する,クラス内変動の大きい新設計のフレームワークを提案する。
幾何学的形状表現の教師なし学習を取り入れた強化型分類網を開発した。
論文 参考訳(メタデータ) (2022-10-25T01:55:17Z) - Shadows Shed Light on 3D Objects [23.14510850163136]
我々は、物体の3次元形状、ポーズ、光源の位置を推測できる微分可能な画像形成モデルを作成する。
我々のアプローチは、地上の暗黒マスクが未知の現実世界の画像に対して堅牢である。
論文 参考訳(メタデータ) (2022-06-17T19:58:11Z) - Discovering 3D Parts from Image Collections [98.16987919686709]
本稿では,2次元画像収集のみによる3次元部分発見の問題に対処する。
そこで我々は,手動で注釈付部品を監督する代わりに,自己監督型アプローチを提案する。
私たちのキーとなる洞察は、前もって新しい部分の形状を学習することで、各部分は、単純な幾何学を持つように制約されたまま、忠実にオブジェクトの形状に適合できるようにします。
論文 参考訳(メタデータ) (2021-07-28T20:29:16Z) - Disentangled Implicit Shape and Pose Learning for Scalable 6D Pose
Estimation [44.8872454995923]
単一オートエンコーダを用いた複数オブジェクトの合成データに対する自己教師付き学習により,スケーラブルな6次元ポーズ推定のための新しい手法を提案する。
提案手法は,T-LESS と NOCS REAL275 という実データを持つ2つのマルチオブジェクトベンチマークで検証し,ポーズ推定精度と一般化の点で既存の RGB 法より優れていることを示す。
論文 参考訳(メタデータ) (2021-07-27T01:55:30Z) - Sparse Pose Trajectory Completion [87.31270669154452]
サンプルの少ないビューにのみオブジェクトが出現するデータセットを使用しても学習する方法を提案する。
これはクロスモーダルポーズ軌道伝達機構によって実現される。
この手法はPix3DおよびShapeNetデータセット上で評価される。
論文 参考訳(メタデータ) (2021-05-01T00:07:21Z) - Continuous Surface Embeddings [76.86259029442624]
我々は、変形可能な対象カテゴリーにおける密接な対応を学習し、表現するタスクに焦点をあてる。
本稿では,高密度対応の新たな学習可能な画像ベース表現を提案する。
提案手法は,人間の身近なポーズ推定のための最先端手法と同等以上の性能を示すことを示す。
論文 参考訳(メタデータ) (2020-11-24T22:52:15Z) - Canonical 3D Deformer Maps: Unifying parametric and non-parametric
methods for dense weakly-supervised category reconstruction [79.98689027127855]
独立オブジェクトの2次元画像の集合から学習できる共通オブジェクトカテゴリの3次元形状の表現を提案する。
提案手法は, パラメトリック変形モデル, 非パラメトリック3次元再構成, 標準埋め込みの概念に基づく新しい手法で構築する。
顔、車、鳥の野生のデータセットを3Dで再現することで、最先端の成果が得られます。
論文 参考訳(メタデータ) (2020-08-28T15:44:05Z) - Learning Pose-invariant 3D Object Reconstruction from Single-view Images [61.98279201609436]
本稿では,単視点画像のみから3次元形状を学習する,より現実的な構成について検討する。
最大の難しさは、単一のビューイメージが提供できる制約の不足にある。
本稿では, 対角コンパクトな形状空間を学習するために, 効果的な対角領域混同法を提案する。
論文 参考訳(メタデータ) (2020-04-03T02:47:35Z) - Self-supervised Single-view 3D Reconstruction via Semantic Consistency [142.71430568330172]
対象物の形状, テクスチャ, カメラポーズを予測できる, 自己監督型, 単視点3D再構成モデルを学習する。
提案手法では,手動で注釈付けしたキーポイント,オブジェクトのマルチビューイメージ,あるいは事前の3Dテンプレートなど,3Dの監督を必要としない。
論文 参考訳(メタデータ) (2020-03-13T20:29:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。