論文の概要: Deep intrinsic decomposition trained on surreal scenes yet with
realistic light effects
- arxiv url: http://arxiv.org/abs/2009.06295v1
- Date: Mon, 14 Sep 2020 09:45:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-18 11:48:37.130701
- Title: Deep intrinsic decomposition trained on surreal scenes yet with
realistic light effects
- Title(参考訳): リアルな光効果を持つ超現実のシーンで訓練された深部内在分解
- Authors: Hassan Sial, Ramon Baldrich, Maria Vanrell
- Abstract要約: 本稿では,いくつかの古典的データセット問題を克服するフレキシブルな画像生成法を提案する。
提案手法は汎用的で,計算時間が少なく,最先端の計算結果が得られる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Estimation of intrinsic images still remains a challenging task due to
weaknesses of ground-truth datasets, which either are too small or present
non-realistic issues. On the other hand, end-to-end deep learning architectures
start to achieve interesting results that we believe could be improved if
important physical hints were not ignored. In this work, we present a twofold
framework: (a) a flexible generation of images overcoming some classical
dataset problems such as larger size jointly with coherent lighting appearance;
and (b) a flexible architecture tying physical properties through intrinsic
losses. Our proposal is versatile, presents low computation time, and achieves
state-of-the-art results.
- Abstract(参考訳): 内在的な画像の推定は、小さすぎるか非現実的な問題である地上真実のデータセットの弱点のため、依然として難しい課題である。
一方で、エンド・ツー・エンドのディープラーニングアーキテクチャは、重要な物理的ヒントを無視しなければ改善できると信じている興味深い結果を達成し始めています。
この本では、2つのフレームワークを紹介します。
(a)コヒーレントな照明の外観と大型化等の古典的データセット問題を克服したフレキシブルな画像の生成
(b)本質的損失によって物理的特性を結びつける柔軟なアーキテクチャ。
提案手法は汎用性が高く,計算時間が少なく,最先端の結果が得られる。
関連論文リスト
- Deep Learning of Crystalline Defects from TEM images: A Solution for the
Problem of "Never Enough Training Data" [0.0]
In-situ TEM実験は、転位がどのように振る舞うか、動きについて重要な洞察を与えることができる。
個々のビデオフレームの分析は有用な洞察を提供するが、自動識別の能力によって制限される。
本研究では,転位セグメンテーションのための合成トレーニングデータを生成するパラメトリックモデルを開発した。
論文 参考訳(メタデータ) (2023-07-12T17:37:46Z) - TexPose: Neural Texture Learning for Self-Supervised 6D Object Pose
Estimation [55.94900327396771]
合成データから6次元オブジェクトポーズ推定のためのニューラルネットワークによるテクスチャ学習を提案する。
実画像からオブジェクトの現実的なテクスチャを予測することを学ぶ。
画素完全合成データからポーズ推定を学習する。
論文 参考訳(メタデータ) (2022-12-25T13:36:32Z) - Sparse Relational Reasoning with Object-Centric Representations [78.83747601814669]
対象中心表現の操作において,リレーショナルニューラルアーキテクチャによって学習されたソフトルールの構成可能性について検討する。
特に特徴量の増加は,いくつかのモデルの性能を向上し,より単純な関係をもたらすことが判明した。
論文 参考訳(メタデータ) (2022-07-15T14:57:33Z) - Physics Informed Neural Fields for Smoke Reconstruction with Sparse Data [73.8970871148949]
まばらなマルチビューRGBビデオから流体を高忠実に再現することは、まだまだ難しい課題だ。
既存のソリューションは、障害物や照明に関する知識を前提とするか、障害物や複雑な照明のない単純な流体シーンのみに焦点を当てる。
本稿では, 制御物理(Navier-Stokes方程式)をエンドツーエンドの最適化で活用することにより, 動的流体を再構築する最初の方法を提案する。
論文 参考訳(メタデータ) (2022-06-14T03:38:08Z) - Perception Over Time: Temporal Dynamics for Robust Image Understanding [5.584060970507506]
ディープラーニングは、狭く特定の視覚タスクにおいて、人間レベルのパフォーマンスを上回る。
人間の視覚知覚は入力刺激の変化に対して、桁違いに頑丈である。
静的画像理解に時間力学を取り入れた新しい手法を提案する。
論文 参考訳(メタデータ) (2022-03-11T21:11:59Z) - DIB-R++: Learning to Predict Lighting and Material with a Hybrid
Differentiable Renderer [78.91753256634453]
そこで本研究では,単体画像から固有物体特性を推定する難題について,微分可能量を用いて検討する。
そこで本研究では、スペクトル化とレイトレーシングを組み合わせることで、これらの効果をサポートするハイブリッド微分可能なDIBR++を提案する。
より高度な物理ベースの微分可能値と比較すると、DIBR++はコンパクトで表現力のあるモデルであるため、高い性能を持つ。
論文 参考訳(メタデータ) (2021-10-30T01:59:39Z) - On the combined effect of class imbalance and concept complexity in deep
learning [11.178586036657798]
本稿では,従来の機械学習システムでは困難であったような環境下でのディープラーニングシステムの振る舞いについて考察する。
深いアーキテクチャは構造的な概念の複雑さに役立ちますが、単純な人工ドメインで重複する課題には役立ちません。
オーバーフィッティングが人工ドメインよりも大きな関心事である現実世界の画像ドメインでは、より深いアーキテクチャの利点は明らかではない。
論文 参考訳(メタデータ) (2021-07-29T17:30:00Z) - Causal Navigation by Continuous-time Neural Networks [108.84958284162857]
本研究では,連続時間ニューラルネットワークを用いた因果表現学習のための理論的,実験的枠組みを提案する。
本手法は,ドローンの視覚制御学習の文脈において,一連の複雑なタスクにおいて評価する。
論文 参考訳(メタデータ) (2021-06-15T17:45:32Z) - An Optical physics inspired CNN approach for intrinsic image
decomposition [0.0]
内在画像分解は、画像の構成成分を生成する開放的な問題である。
画像から導出した物理パラメータを用いてこの分解が可能なニューラルネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-05-21T00:54:01Z) - Dynamic Object Removal and Spatio-Temporal RGB-D Inpainting via
Geometry-Aware Adversarial Learning [9.150245363036165]
動的物体はロボットの環境に対する認識に大きな影響を及ぼす。
本研究は,動的物体によって隠蔽された領域における可塑性色,テクスチャ,幾何学を合成することにより,この問題に対処する。
本研究は, 対人訓練を用いて建築を最適化し, オンラインで色と深度構造を幻覚できるような, 微妙な現実的なテクスチャを合成する。
論文 参考訳(メタデータ) (2020-08-12T01:23:21Z) - DeFeat-Net: General Monocular Depth via Simultaneous Unsupervised
Representation Learning [65.94499390875046]
DeFeat-Netは、クロスドメインの高密度な特徴表現を同時に学習するアプローチである。
提案手法は, 誤差対策を全て10%程度減らすことで, 最先端技術よりも優れる。
論文 参考訳(メタデータ) (2020-03-30T13:10:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。