論文の概要: Hard Example Generation by Texture Synthesis for Cross-domain Shape
Similarity Learning
- arxiv url: http://arxiv.org/abs/2010.12238v2
- Date: Tue, 27 Oct 2020 02:12:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-03 23:09:50.952080
- Title: Hard Example Generation by Texture Synthesis for Cross-domain Shape
Similarity Learning
- Title(参考訳): クロスドメイン形状類似学習のためのテクスチャ合成によるハードケース生成
- Authors: Huan Fu, Shunming Li, Rongfei Jia, Mingming Gong, Binqiang Zhao, and
Dacheng Tao
- Abstract要約: 画像に基づく3次元形状検索(IBSR)は、与えられた2次元画像の対応する3次元形状を、大きな3次元形状データベースから見つけることを目的としている。
いくつかの適応技法によるメートル法学習は、類似性学習を形作るための自然な解決策のようです。
テクスチャ合成を応用した幾何中心の多視点メトリック学習フレームワークを開発した。
- 参考スコア(独自算出の注目度): 97.56893524594703
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Image-based 3D shape retrieval (IBSR) aims to find the corresponding 3D shape
of a given 2D image from a large 3D shape database. The common routine is to
map 2D images and 3D shapes into an embedding space and define (or learn) a
shape similarity measure. While metric learning with some adaptation techniques
seems to be a natural solution to shape similarity learning, the performance is
often unsatisfactory for fine-grained shape retrieval. In the paper, we
identify the source of the poor performance and propose a practical solution to
this problem. We find that the shape difference between a negative pair is
entangled with the texture gap, making metric learning ineffective in pushing
away negative pairs. To tackle this issue, we develop a geometry-focused
multi-view metric learning framework empowered by texture synthesis. The
synthesis of textures for 3D shape models creates hard triplets, which suppress
the adverse effects of rich texture in 2D images, thereby push the network to
focus more on discovering geometric characteristics. Our approach shows
state-of-the-art performance on a recently released large-scale 3D-FUTURE[1]
repository, as well as three widely studied benchmarks, including Pix3D[2],
Stanford Cars[3], and Comp Cars[4]. Codes will be made publicly available at:
https://github.com/3D-FRONT-FUTURE/IBSR-texture
- Abstract(参考訳): 画像ベース3d形状検索(ibsr)は、大きな3d形状データベースから、与えられた2d画像の対応する3d形状を見つけることを目的としている。
一般的なルーチンは、2D画像と3D形状を埋め込み空間にマッピングし、形状類似度尺度を定義する(あるいは学習する)ことである。
いくつかの適応技法によるメトリック学習は、形状類似性学習の自然な解であるように思われるが、細粒度形状検索では、しばしば性能が不十分である。
本稿では,性能不良の原因を特定し,この問題に対する実用的な解決法を提案する。
その結果, 負対間の形状差はテクスチャギャップに絡み合っており, 負対の押し出しにおいて計量学習が効果的でないことがわかった。
この問題に取り組むために,テクスチャ合成を応用した幾何指向多視点メトリック学習フレームワークを開発した。
3次元形状モデルのためのテクスチャの合成は硬い三重項を生成し、2次元画像におけるリッチテクスチャの悪影響を抑制することにより、ネットワークを幾何学的特徴の発見に集中させる。
提案手法は,最近リリースされた大規模3D-FUTURE[1]レポジトリと,Pix3D[2],Stanford Cars[3],Comp Cars[4]など,広く研究されている3つのベンチマークに対して,最先端のパフォーマンスを示す。
コードは、https://github.com/3D-FRONT-FUTURE/IBSR-textureで公開される。
関連論文リスト
- Geometry Image Diffusion: Fast and Data-Efficient Text-to-3D with Image-Based Surface Representation [2.3213238782019316]
GIMDiffusionは、幾何学画像を利用して2次元画像を用いて3次元形状を効率よく表現する新しいテキスト・ツー・3Dモデルである。
安定拡散のような既存のテキスト・ツー・イメージモデルのリッチな2次元先行モデルを利用する。
簡単に言うと、GIMDiffusionは現行のText-to-Imageモデルに匹敵する速度で3Dアセットを生成することができる。
論文 参考訳(メタデータ) (2024-09-05T17:21:54Z) - 3D Surface Reconstruction in the Wild by Deforming Shape Priors from
Synthetic Data [24.97027425606138]
1枚の画像から被写体の3次元表面を再構築することは難しい問題である。
本稿では,1枚の画像から3次元合成とオブジェクトポーズ推定を行う新しい手法を提案する。
提案手法は,複数の実世界のデータセットにまたがって,最先端の再構築性能を実現する。
論文 参考訳(メタデータ) (2023-02-24T20:37:27Z) - Self-Supervised Geometry-Aware Encoder for Style-Based 3D GAN Inversion [115.82306502822412]
StyleGANは、画像インバージョンと潜時編集による2次元顔再構成とセマンティック編集において大きな進歩を遂げている。
対応する汎用的な3D GANインバージョンフレームワークがまだ欠けており、3D顔再構成とセマンティック編集の応用が制限されている。
本研究では,その3次元形状と詳細なテクスチャを忠実に復元するために,単一の顔画像から潜伏コードを予測する3D GAN逆変換の課題について検討する。
論文 参考訳(メタデータ) (2022-12-14T18:49:50Z) - MvDeCor: Multi-view Dense Correspondence Learning for Fine-grained 3D
Segmentation [91.6658845016214]
そこで本研究では,2次元領域における自己教師型手法を,微細な3次元形状分割作業に活用することを提案する。
複数のビューから3次元形状を描画し、コントラスト学習フレームワーク内に密接な対応学習タスクを設置する。
その結果、学習された2次元表現はビュー不変であり、幾何学的に一貫性がある。
論文 参考訳(メタデータ) (2022-08-18T00:48:15Z) - Beyond 3DMM: Learning to Capture High-fidelity 3D Face Shape [77.95154911528365]
3Dモーフィブルモデル(3DMM)の適合性は、その強力な3D先行性のため、顔解析に広く有用である。
以前に再建された3次元顔は、微細な形状が失われるため、視差の低下に悩まされていた。
本論文は, パーソナライズされた形状が対応する人物と同一に見えるよう, パーソナライズされた形状を捉えるための完全な解を提案する。
論文 参考訳(メタデータ) (2022-04-09T03:46:18Z) - Joint Deep Multi-Graph Matching and 3D Geometry Learning from
Inhomogeneous 2D Image Collections [57.60094385551773]
非均質な画像コレクションから変形可能な3Dジオメトリモデルを学ぶためのトレーニング可能なフレームワークを提案する。
さらに,2次元画像で表現された物体の3次元形状も取得する。
論文 参考訳(メタデータ) (2021-03-31T17:25:36Z) - Cycle-Consistent Generative Rendering for 2D-3D Modality Translation [21.962725416347855]
我々は、3Dオブジェクトのリアルなレンダリングを生成し、画像からリアルな3D形状を推測するモジュールを学習する。
生成ドメイン翻訳の手法を利用することで、弱い監視しか必要としない学習アルゴリズムを不適切なデータで定義することができる。
得られたモデルは、2D画像から3D形状、ポーズ、テクスチャ推論を行うことができるが、新しいテクスチャ化された3D形状やレンダリングを生成することもできる。
論文 参考訳(メタデータ) (2020-11-16T15:23:03Z) - Canonical 3D Deformer Maps: Unifying parametric and non-parametric
methods for dense weakly-supervised category reconstruction [79.98689027127855]
独立オブジェクトの2次元画像の集合から学習できる共通オブジェクトカテゴリの3次元形状の表現を提案する。
提案手法は, パラメトリック変形モデル, 非パラメトリック3次元再構成, 標準埋め込みの概念に基づく新しい手法で構築する。
顔、車、鳥の野生のデータセットを3Dで再現することで、最先端の成果が得られます。
論文 参考訳(メタデータ) (2020-08-28T15:44:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。