論文の概要: Zero in on Shape: A Generic 2D-3D Instance Similarity Metric learned
from Synthetic Data
- arxiv url: http://arxiv.org/abs/2108.04091v1
- Date: Mon, 9 Aug 2021 14:44:08 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-10 15:17:04.932348
- Title: Zero in on Shape: A Generic 2D-3D Instance Similarity Metric learned
from Synthetic Data
- Title(参考訳): zero in on shape:合成データから学習した一般的な2d-3dインスタンス類似度メトリクス
- Authors: Maciej Janik, Niklas Gard, Anna Hilsmann, Peter Eisert
- Abstract要約: 本稿では,RGB画像と非テクスチャ型3Dモデルとを表現形状の類似性で比較するネットワークアーキテクチャを提案する。
我々のシステムはゼロショット検索に最適化されており、訓練で示されることのない形状を認識することができる。
- 参考スコア(独自算出の注目度): 3.71630298053787
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a network architecture which compares RGB images and untextured 3D
models by the similarity of the represented shape. Our system is optimised for
zero-shot retrieval, meaning it can recognise shapes never shown in training.
We use a view-based shape descriptor and a siamese network to learn object
geometry from pairs of 3D models and 2D images. Due to scarcity of datasets
with exact photograph-mesh correspondences, we train our network with only
synthetic data. Our experiments investigate the effect of different qualities
and quantities of training data on retrieval accuracy and present insights from
bridging the domain gap. We show that increasing the variety of synthetic data
improves retrieval accuracy and that our system's performance in zero-shot mode
can match that of the instance-aware mode, as far as narrowing down the search
to the top 10% of objects.
- Abstract(参考訳): 本稿では,RGB画像と非テクスチャ型3Dモデルとを表現形状の類似性で比較するネットワークアーキテクチャを提案する。
我々のシステムはゼロショット検索に最適化されており、トレーニングで表示されない形状を認識することができる。
我々は3次元モデルと2次元画像のペアからオブジェクト形状を学習するために、ビューベースの形状記述子とシアムネットワークを使用する。
正確な写真・メッシュ対応のデータセットが不足しているため、合成データのみを用いてネットワークをトレーニングする。
本実験は,学習データの品質と量の違いが検索精度に及ぼす影響について検討し,領域ギャップを埋めることによる知見を提示する。
合成データの多種多様な増加により検索精度が向上し、検索対象の上位10%まで絞り込む限り、ゼロショットモードでのシステムの性能がインスタンス認識モードと一致できることが示されている。
関連論文リスト
- Robust 3D Tracking with Quality-Aware Shape Completion [67.9748164949519]
そこで本研究では,高密度および完全点の雲からなる合成対象表現について,ロバストな3次元追跡のための形状完備化により正確に表現する。
具体的には, 形状が整ったボキセル化3次元追跡フレームワークを設計し, ノイズのある歴史的予測の悪影響を軽減するために, 品質に配慮した形状完備化機構を提案する。
論文 参考訳(メタデータ) (2023-12-17T04:50:24Z) - 3DiffTection: 3D Object Detection with Geometry-Aware Diffusion Features [70.50665869806188]
3DiffTectionは、単一の画像から3Dオブジェクトを検出する最先端の方法である。
拡散モデルを微調整し、単一の画像に条件付けされた新しいビュー合成を行う。
さらに、検出監視により、ターゲットデータ上でモデルをトレーニングする。
論文 参考訳(メタデータ) (2023-11-07T23:46:41Z) - Real-time Detection of 2D Tool Landmarks with Synthetic Training Data [0.0]
本稿では,ハンマーやスクリュードライバーなどの物理ツールのランドマークの2次元位置をリアルタイムで検出する深層学習アーキテクチャを提案する。
手動ラベリングの労力を避けるため、ネットワークは合成されたデータに基づいて訓練される。
本論文では, 中間熱マップモデル (Intermediate Heatmap Model, IHM) と命名し, 合成データを用いて実画像に一般化した。
論文 参考訳(メタデータ) (2022-10-21T14:31:43Z) - VoloGAN: Adversarial Domain Adaptation for Synthetic Depth Data [0.0]
本稿では,高品質な3Dモデルの合成RGB-D画像を,消費者の深度センサで生成可能なRGB-D画像に変換する対向領域適応ネットワークであるVoloGANを提案する。
本システムは,実世界の捕捉条件を再現した単一視点3次元再構成アルゴリズムにおいて,高精度なトレーニングデータを生成するのに特に有用である。
論文 参考訳(メタデータ) (2022-07-19T11:30:41Z) - RiCS: A 2D Self-Occlusion Map for Harmonizing Volumetric Objects [68.85305626324694]
カメラ空間における光マーチング (RiCS) は、3次元における前景物体の自己閉塞を2次元の自己閉塞マップに表現する新しい手法である。
表現マップは画像の質を高めるだけでなく,時間的コヒーレントな複雑な影効果をモデル化できることを示す。
論文 参考訳(メタデータ) (2022-05-14T05:35:35Z) - Pixel2Mesh++: 3D Mesh Generation and Refinement from Multi-View Images [82.32776379815712]
カメラポーズの有無にかかわらず、少数のカラー画像から3次元メッシュ表現における形状生成の問題について検討する。
我々は,グラフ畳み込みネットワークを用いたクロスビュー情報を活用することにより,形状品質をさらに向上する。
我々のモデルは初期メッシュの品質とカメラポーズの誤差に頑健であり、テスト時間最適化のための微分関数と組み合わせることができる。
論文 参考訳(メタデータ) (2022-04-21T03:42:31Z) - Learning Dense Correspondence from Synthetic Environments [27.841736037738286]
既存の方法では、実際の2D画像に手動でラベル付けされた人間のピクセルを3D表面にマッピングする。
本稿では,自動生成合成データを用いた2次元3次元人物マッピングアルゴリズムの訓練により,データ不足の問題を解決することを提案する。
論文 参考訳(メタデータ) (2022-03-24T08:13:26Z) - Diverse Plausible Shape Completions from Ambiguous Depth Images [7.652701739127332]
PSSNetは1枚の2.5D深度画像から可塑性3D再構成を生成するネットワークアーキテクチャである。
本研究では,Shapenetのマグカップと部分的に隠されたYCBオブジェクトを用いて実験を行い,あいまいさの少ないデータセットで比較可能であることを確認した。
論文 参考訳(メタデータ) (2020-11-18T16:42:51Z) - Hard Example Generation by Texture Synthesis for Cross-domain Shape
Similarity Learning [97.56893524594703]
画像に基づく3次元形状検索(IBSR)は、与えられた2次元画像の対応する3次元形状を、大きな3次元形状データベースから見つけることを目的としている。
いくつかの適応技法によるメートル法学習は、類似性学習を形作るための自然な解決策のようです。
テクスチャ合成を応用した幾何中心の多視点メトリック学習フレームワークを開発した。
論文 参考訳(メタデータ) (2020-10-23T08:52:00Z) - Canonical 3D Deformer Maps: Unifying parametric and non-parametric
methods for dense weakly-supervised category reconstruction [79.98689027127855]
独立オブジェクトの2次元画像の集合から学習できる共通オブジェクトカテゴリの3次元形状の表現を提案する。
提案手法は, パラメトリック変形モデル, 非パラメトリック3次元再構成, 標準埋め込みの概念に基づく新しい手法で構築する。
顔、車、鳥の野生のデータセットを3Dで再現することで、最先端の成果が得られます。
論文 参考訳(メタデータ) (2020-08-28T15:44:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。