論文の概要: 2nd Place Solution for IJCAI-PRICAI 2020 3D AI Challenge: 3D Object
Reconstruction from A Single Image
- arxiv url: http://arxiv.org/abs/2105.13575v1
- Date: Fri, 28 May 2021 03:54:39 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-31 20:36:59.545718
- Title: 2nd Place Solution for IJCAI-PRICAI 2020 3D AI Challenge: 3D Object
Reconstruction from A Single Image
- Title(参考訳): ijcai-pricai 2020 3d ai challengeの2位:1枚の画像から3dオブジェクトを再構築する
- Authors: Yichen Cao, Yufei Wei, Shichao Liu, Lin Xu
- Abstract要約: 我々はAtlasNetの亜種を開発し、単一の2次元画像を消費し、2次元から3次元のマッピングを通して3次元の点雲を生成する。
最終ラウンドでは,スコアが70.88ドル,シャムファー距離が36.87ドル,平均Fスコアが59.18ドルで2位となる。
- 参考スコア(独自算出の注目度): 9.31533617476093
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we present our solution for the {\it IJCAI--PRICAI--20 3D AI
Challenge: 3D Object Reconstruction from A Single Image}. We develop a variant
of AtlasNet that consumes single 2D images and generates 3D point clouds
through 2D to 3D mapping. To push the performance to the limit and present
guidance on crucial implementation choices, we conduct extensive experiments to
analyze the influence of decoder design and different settings on the
normalization, projection, and sampling methods. Our method achieves 2nd place
in the final track with a score of $70.88$, a chamfer distance of $36.87$, and
a mean f-score of $59.18$. The source code of our method will be available at
https://github.com/em-data/Enhanced_AtlasNet_3DReconstruction.
- Abstract(参考訳): 本稿では,1枚の画像から3Dオブジェクトを再構成する「ITIJCAI--PRICAI--20 3D AI Challenge」のソリューションを提案する。
我々は,2dから3dへのマッピングを通じて,単一の2dイメージを消費し,3dポイントクラウドを生成するatlasnetの変種を開発した。
性能を限界まで押し上げ,重要な実装選択に関するガイダンスを示すため,デコーダ設計と異なる設定が正規化,投影,サンプリング方法に与える影響を解析するための広範な実験を行った。
この方法は最終トラックで2位となり、スコアは70.88$、シャンファー距離は36.87$、平均fスコアは59.18$である。
このメソッドのソースコードはhttps://github.com/em-data/enhanced_atlasnet_3dreconstructionで入手できる。
関連論文リスト
- MPL: Lifting 3D Human Pose from Multi-view 2D Poses [75.26416079541723]
本稿では,大規模かつリッチなトレーニングデータセットが存在する2次元ポーズ推定と,トランスフォーマーネットワークを用いた2次元から3次元ポーズリフトを提案する。
実験の結果,MPJPEの誤差は2次元ポーズを三角測量した3次元ポーズと比較して最大45%減少することがわかった。
論文 参考訳(メタデータ) (2024-08-20T12:55:14Z) - EP2P-Loc: End-to-End 3D Point to 2D Pixel Localization for Large-Scale
Visual Localization [44.05930316729542]
本稿では,3次元点雲の大規模可視化手法EP2P-Locを提案する。
画像中の見えない3D点を除去する簡単なアルゴリズムを提案する。
このタスクで初めて、エンドツーエンドのトレーニングに差別化可能なツールを使用します。
論文 参考訳(メタデータ) (2023-09-14T07:06:36Z) - EpiGRAF: Rethinking training of 3D GANs [60.38818140637367]
本稿では,SotA画像品質の高い高解像度3Dジェネレータを,パッチワイズを単純に訓練するまったく異なる経路を辿ることによって実現可能であることを示す。
EpiGRAFと呼ばれる結果のモデルは、効率的で高解像度で純粋な3Dジェネレータである。
論文 参考訳(メタデータ) (2022-06-21T17:08:23Z) - Homography Loss for Monocular 3D Object Detection [54.04870007473932]
ホログラフィーロス(Homography Loss)と呼ばれる,2次元情報と3次元情報の両方を利用する識別可能なロス関数を提案する。
提案手法は,KITTI 3Dデータセットにおいて,他の最先端技術と比較して高い性能を示す。
論文 参考訳(メタデータ) (2022-04-02T03:48:03Z) - AutoShape: Real-Time Shape-Aware Monocular 3D Object Detection [15.244852122106634]
形状認識型2D/3D制約を3D検出フレームワークに組み込む手法を提案する。
具体的には、ディープニューラルネットワークを用いて、2次元画像領域の区別された2Dキーポイントを学習する。
2D/3Dキーポイントの基礎的真理を生成するために、自動的なモデル適合手法が提案されている。
論文 参考訳(メタデータ) (2021-08-25T08:50:06Z) - Unsupervised Learning of Fine Structure Generation for 3D Point Clouds
by 2D Projection Matching [66.98712589559028]
微細な構造を持つ3次元点雲生成のための教師なしアプローチを提案する。
本手法は2次元シルエット画像から異なる解像度で微細な3次元構造を復元することができる。
論文 参考訳(メタデータ) (2021-08-08T22:15:31Z) - FCOS3D: Fully Convolutional One-Stage Monocular 3D Object Detection [78.00922683083776]
一般的な2D検出器をこの3Dタスクで動作させることは簡単ではない。
本報告では,完全畳み込み型単段検出器を用いた手法を用いてこの問題を考察する。
私たちのソリューションは、NeurIPS 2020のnuScenes 3D検出チャレンジのすべてのビジョンのみの方法の中で1位を獲得します。
論文 参考訳(メタデータ) (2021-04-22T09:35:35Z) - Improved Modeling of 3D Shapes with Multi-view Depth Maps [48.8309897766904]
CNNを用いて3次元形状をモデル化するための汎用フレームワークを提案する。
オブジェクトの1つの深度画像だけで、3Dオブジェクトの高密度な多視点深度マップ表現を出力できる。
論文 参考訳(メタデータ) (2020-09-07T17:58:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。