論文の概要: Illumination Normalization by Partially Impossible Encoder-Decoder Cost
Function
- arxiv url: http://arxiv.org/abs/2011.03428v2
- Date: Mon, 9 Nov 2020 15:43:42 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-29 05:08:29.098024
- Title: Illumination Normalization by Partially Impossible Encoder-Decoder Cost
Function
- Title(参考訳): 部分不可能エンコーダ・デコーダコスト関数による照明正規化
- Authors: Steve Dias Da Cruz, Bertram Taetz, Thomas Stifter, Didier Stricker
- Abstract要約: 本稿では,エンコーダデコーダネットワークのコスト関数定式化のための新しい手法を提案する。
本手法は,異なる照明条件と環境条件下での同一シーンの可利用性を利用した。
適用性は3つの公開データセットで評価される。
- 参考スコア(独自算出の注目度): 13.618797548020462
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Images recorded during the lifetime of computer vision based systems undergo
a wide range of illumination and environmental conditions affecting the
reliability of previously trained machine learning models. Image normalization
is hence a valuable preprocessing component to enhance the models' robustness.
To this end, we introduce a new strategy for the cost function formulation of
encoder-decoder networks to average out all the unimportant information in the
input images (e.g. environmental features and illumination changes) to focus on
the reconstruction of the salient features (e.g. class instances). Our method
exploits the availability of identical sceneries under different illumination
and environmental conditions for which we formulate a partially impossible
reconstruction target: the input image will not convey enough information to
reconstruct the target in its entirety. Its applicability is assessed on three
publicly available datasets. We combine the triplet loss as a regularizer in
the latent space representation and a nearest neighbour search to improve the
generalization to unseen illuminations and class instances. The importance of
the aforementioned post-processing is highlighted on an automotive application.
To this end, we release a synthetic dataset of sceneries from three different
passenger compartments where each scenery is rendered under ten different
illumination and environmental conditions: see https://sviro.kl.dfki.de
- Abstract(参考訳): コンピュータビジョンベースのシステムの寿命中に記録された画像は、トレーニング済みの機械学習モデルの信頼性に影響を与える幅広い照明と環境条件下で記録される。
したがって、画像の正規化はモデルの堅牢性を高める貴重な前処理コンポーネントである。
この目的のために,エンコーダ・デコーダネットワークのコスト関数定式化のための新しい戦略を導入し,入力画像中の重要でない情報(例えば,環境特徴や照明変化)を平均化し,健全な特徴(例えば,クラスインスタンス)の再構築に注力する。
本手法では,異なる照明条件と環境条件下で同一の景観を利用可能とし,部分的に不可能となる復元対象を定式化する。
適用性は3つの公開データセットで評価される。
潜在空間表現における正規化子として三重項損失と近辺探索を組み合わせることにより、非知覚照度やクラスインスタンスへの一般化を改善する。
上記の後処理の重要性は、自動車アプリケーションで強調される。
この目的のために、我々は3つの異なる乗客区画のシーンの合成データセットをリリースし、各シーンは10の異なる照明と環境条件の下でレンダリングされる。
関連論文リスト
- KRONC: Keypoint-based Robust Camera Optimization for 3D Car Reconstruction [58.04846444985808]
KRONCは、オブジェクトに関する事前知識を活用して、セマンティックキーポイントを通してその表現を再構築することで、ビューポーズを推論する新しいアプローチである。
車両シーンに焦点を当てたKRONCは、キーポイントのバックプロジェクションを特異点に収束させることを目的とした光最適化問題の解として、ビューの位置を推定することができる。
論文 参考訳(メタデータ) (2024-09-09T08:08:05Z) - UpFusion: Novel View Diffusion from Unposed Sparse View Observations [66.36092764694502]
UpFusionは、参照画像のスパースセットが与えられたオブジェクトに対して、新しいビュー合成と3D表現を推論することができる。
本研究では,この機構により,付加された(未提示)画像の合成品質を向上しつつ,高忠実度な新規ビューを生成することができることを示す。
論文 参考訳(メタデータ) (2023-12-11T18:59:55Z) - CarPatch: A Synthetic Benchmark for Radiance Field Evaluation on Vehicle
Components [77.33782775860028]
車両の新たな総合ベンチマークであるCarPatchを紹介する。
内在カメラパラメータと外在カメラパラメータを付加した画像のセットに加えて、各ビューに対して対応する深度マップとセマンティックセグメンテーションマスクが生成されている。
グローバルとパートベースのメトリクスは、いくつかの最先端技術を評価し、比較し、より良い特徴付けるために定義され、使われてきた。
論文 参考訳(メタデータ) (2023-07-24T11:59:07Z) - MS-PS: A Multi-Scale Network for Photometric Stereo With a New
Comprehensive Training Dataset [0.0]
光度ステレオ(PS)問題は、物体の3次元表面を再構成することである。
そこで我々は,PSのマルチスケールアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-11-25T14:01:54Z) - Shape, Pose, and Appearance from a Single Image via Bootstrapped
Radiance Field Inversion [54.151979979158085]
提案手法では,自然画像に対する基本的エンドツーエンド再構築フレームワークを導入し,正確な地平のポーズが得られない。
そこで,モデルが解の第一の推算を生成するハイブリッド・インバージョン・スキームを適用する。
当社のフレームワークでは,イメージを10ステップでデレンダリングすることが可能で,現実的なシナリオで使用することが可能です。
論文 参考訳(メタデータ) (2022-11-21T17:42:42Z) - Neural Radiance Transfer Fields for Relightable Novel-view Synthesis
with Global Illumination [63.992213016011235]
本稿では,ニューラル計算された放射光伝達関数を学習し,新しい視点下でのシーンリライティング手法を提案する。
本手法は,1つの未知の照明条件下で,シーンの実際の画像に対してのみ監視することができる。
その結果, シーンパラメータのアンタングルの復元は, 現状よりも有意に向上していることがわかった。
論文 参考訳(メタデータ) (2022-07-27T16:07:48Z) - Spatio-Temporal Outdoor Lighting Aggregation on Image Sequences using
Transformer Networks [23.6427456783115]
本研究は,画像からのノイズ推定を集約した屋外照明推定に焦点をあてる。
ディープニューラルネットワークに基づく最近の研究は、単一画像の照明推定に有望な結果を示しているが、堅牢性に悩まされている。
画像シーケンスの角領域と時間領域でサンプリングされた複数の画像ビューからの照明推定値を組み合わせることで、この問題に対処する。
論文 参考訳(メタデータ) (2022-02-18T14:11:16Z) - Learning Efficient Photometric Feature Transform for Multi-view Stereo [37.26574529243778]
各ビューのperpixelフォトメトリック情報を,空間的特徴とビュー不変の低レベル特徴に変換することを学ぶ。
本フレームワークは,様々な入力データで利用可能な幾何学情報を自動的に適用し,効率的な利用を行う。
論文 参考訳(メタデータ) (2021-03-27T02:53:15Z) - Scene relighting with illumination estimation in the latent space on an
encoder-decoder scheme [68.8204255655161]
本報告では,その目的を達成するための手法について述べる。
我々のモデルは、シーン内容、光源位置、色温度の異なる、人工的な場所のレンダリングデータセットに基づいて訓練されている。
本データセットでは,被写体の潜在空間表現における光条件の推測と置き換えを目的とした照明推定成分を用いたネットワークを用いた。
論文 参考訳(メタデータ) (2020-06-03T15:25:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。