論文の概要: Geometric Surface Image Prediction for Image Recognition Enhancement
- arxiv url: http://arxiv.org/abs/2012.08451v1
- Date: Tue, 15 Dec 2020 17:44:37 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-07 05:10:50.996091
- Title: Geometric Surface Image Prediction for Image Recognition Enhancement
- Title(参考訳): 画像認識強調のための幾何表面画像予測
- Authors: Tanasai Sucontphunt
- Abstract要約: 幾何学的表面像は、照明条件を克服するカラー画像よりも優れた表現として導入される。
幾何学的な表面画像とそのカラー写真は、まずGAN(Generative Adversarial Networks)モデルで訓練されます。
次に、入力された色画像から幾何学的表面像を予測するために訓練された生成モデルを用いる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This work presents a method to predict a geometric surface image from a
photograph to assist in image recognition. To recognize objects, several images
from different conditions are required for training a model or fine-tuning a
pre-trained model. In this work, a geometric surface image is introduced as a
better representation than its color image counterpart to overcome lighting
conditions. The surface image is predicted from a color image. To do so, the
geometric surface image together with its color photographs are firstly trained
with Generative Adversarial Networks (GAN) model. The trained generator model
is then used to predict the geometric surface image from the input color image.
The evaluation on a case study of an amulet recognition shows that the
predicted geometric surface images contain less ambiguity than their color
images counterpart under different lighting conditions and can be used
effectively for assisting in image recognition task.
- Abstract(参考訳): 本研究では,画像から幾何学的表面像を推定し,画像認識を支援する手法を提案する。
オブジェクトを認識するには、モデルのトレーニングや事前訓練されたモデルの微調整に、異なる条件からの複数のイメージが必要である。
本研究では、照明条件を克服するために、色画像よりも優れた表現として幾何学的表面像を導入する。
カラー画像から表面画像を予測する。
そのため、幾何学的表面画像とそのカラー写真は、まずGAN(Generative Adversarial Networks)モデルを用いて訓練される。
次に、入力された色画像から幾何学的表面像を予測するために訓練された生成モデルを用いる。
amulet 認識のケーススタディの評価は、予測された幾何面画像は、異なる照明条件下でのカラー画像よりも曖昧度が少なく、画像認識タスクの補助に効果的に使用できることを示す。
関連論文リスト
- Geometry Distributions [51.4061133324376]
本稿では,分布として幾何学をモデル化する新しい幾何学的データ表現を提案する。
提案手法では,新しいネットワークアーキテクチャを用いた拡散モデルを用いて表面点分布の学習を行う。
本研究では,多種多様な対象に対して質的かつ定量的に表現を評価し,その有効性を実証した。
論文 参考訳(メタデータ) (2024-11-25T04:06:48Z) - Geo-SIC: Learning Deformable Geometric Shapes in Deep Image Classifiers [8.781861951759948]
本稿では,画像分類の性能向上のために,変形空間における変形可能な形状を学習する最初のディープラーニングモデルGeo-SICを提案する。
画像空間と潜時形状空間の両方から特徴を同時に導出する,クラス内変動の大きい新設計のフレームワークを提案する。
幾何学的形状表現の教師なし学習を取り入れた強化型分類網を開発した。
論文 参考訳(メタデータ) (2022-10-25T01:55:17Z) - High-Quality RGB-D Reconstruction via Multi-View Uncalibrated
Photometric Stereo and Gradient-SDF [48.29050063823478]
本稿では、カメラのポーズ、照明、アルベド、表面の正規化に取り組み、新しい多視点RGB-Dベースの再構成手法を提案する。
提案手法は,特定の物理モデルを用いて画像描画過程を定式化し,実際の表面の体積量を最適化する。
論文 参考訳(メタデータ) (2022-10-21T19:09:08Z) - A Multiple-View Geometric Model for Specularity Prediction on
Non-Uniformly Curved Surfaces [45.07100273449755]
Augmented Reality (AR), Simultaneous Localisation and Mapping (SLAM), 3次元再構成, 物質モデリングなど,多くのコンピュータビジョンアプリケーションには特異性予測が不可欠である。
従来の作業では、所定のカメラポーズの特異性画像輪郭に収まる楕円体を用いて、明示的なモデルを作成することで、この問題に対処してきた。
本稿では,JOLIMASを任意の表面形状に一般化し,特異性予測の精度を向上させることにより,これらの手法を構築した。
論文 参考訳(メタデータ) (2021-08-20T21:21:26Z) - SIDER: Single-Image Neural Optimization for Facial Geometric Detail
Recovery [54.64663713249079]
SIDERは、教師なしの方法で単一の画像から詳細な顔形状を復元する新しい光度最適化手法である。
以前の作業とは対照的に、SIDERはデータセットの事前に依存せず、複数のビュー、照明変更、地上の真実の3D形状から追加の監視を必要としない。
論文 参考訳(メタデータ) (2021-08-11T22:34:53Z) - ShaRF: Shape-conditioned Radiance Fields from a Single View [54.39347002226309]
本稿では,単一の画像のみのオブジェクトの神経シーン表現を推定する手法を提案する。
この手法の核心は,対象物の幾何学的足場の推定である。
合成画像と実画像の両方において,提案手法の有効性を示す実験を行った。
論文 参考訳(メタデータ) (2021-02-17T16:40:28Z) - Pix2Surf: Learning Parametric 3D Surface Models of Objects from Images [64.53227129573293]
1つ以上の視点から見れば、新しいオブジェクトの3次元パラメトリック表面表現を学習する際の課題について検討する。
ビュー間で一貫した高品質なパラメトリックな3次元表面を生成できるニューラルネットワークを設計する。
提案手法は,共通対象カテゴリからの形状の公開データセットに基づいて,教師と訓練を行う。
論文 参考訳(メタデータ) (2020-08-18T06:33:40Z) - Implicit Mesh Reconstruction from Unannotated Image Collections [48.85604987196472]
本稿では,1枚のRGB画像から3次元形状,テクスチャ,カメラのポーズを推定する手法を提案する。
この形状を画像条件付暗黙関数として表現し、球面を予測メッシュのそれに変換するとともに、対応するテクスチャを予測する。
論文 参考訳(メタデータ) (2020-07-16T17:55:20Z) - Learning Implicit Surface Light Fields [34.89812112073539]
近年,3次元オブジェクトの暗示表現は,学習に基づく3次元再構成作業において顕著な成果を上げている。
本研究では,物体の視覚的外観を表面光界で捉えるための新しい暗黙表現を提案する。
我々のモデルは、影や鏡面反射を含むリッチな視覚的外観を推測することができる。
論文 参考訳(メタデータ) (2020-03-27T13:17:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。