論文の概要: Representing Camera Response Function by a Single Latent Variable and
Fully Connected Neural Network
- arxiv url: http://arxiv.org/abs/2209.03624v1
- Date: Thu, 8 Sep 2022 08:02:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-09 13:08:24.314341
- Title: Representing Camera Response Function by a Single Latent Variable and
Fully Connected Neural Network
- Title(参考訳): 単一潜在変数と完全連結ニューラルネットワークによるカメラ応答関数の表現
- Authors: Yunfeng Zhao, Stuart Ferguson, Huiyu Zhou and Karen Rafferty
- Abstract要約: 多くのコンピュータビジョンタスクにおいて、シーン照射から画像強度へのマッピングをモデル化することが不可欠である。
単一潜伏変数と完全連結ニューラルネットワークを用いた高性能カメラ応答モデルを提案する。
- 参考スコア(独自算出の注目度): 14.27259159089287
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modelling the mapping from scene irradiance to image intensity is essential
for many computer vision tasks. Such mapping is known as the camera response.
Most digital cameras use a nonlinear function to map irradiance, as measured by
the sensor to an image intensity used to record the photograph. Modelling of
the response is necessary for the nonlinear calibration. In this paper, a new
high-performance camera response model that uses a single latent variable and
fully connected neural network is proposed. The model is produced using
unsupervised learning with an autoencoder on real-world (example) camera
responses. Neural architecture searching is then used to find the optimal
neural network architecture. A latent distribution learning approach was
introduced to constrain the latent distribution. The proposed model achieved
state-of-the-art CRF representation accuracy in a number of benchmark tests,
but is almost twice as fast as the best current models when performing the
maximum likelihood estimation during camera response calibration due to the
simple yet efficient model representation.
- Abstract(参考訳): シーンの照度から画像強度へのマッピングのモデル化は、多くのコンピュータビジョンタスクに不可欠です。
このようなマッピングはカメラ応答として知られている。
ほとんどのデジタルカメラは、画像を記録するのに使用される画像強度にセンサーによって測定されるように、非線形機能を使用して照度をマッピングする。
非線形キャリブレーションには応答のモデル化が必要である。
本稿では,1つの潜伏変数と完全連結ニューラルネットワークを用いた新しい高性能カメラ応答モデルを提案する。
このモデルは、実世界(例)カメラ応答のオートエンコーダによる教師なし学習を用いて作成される。
ニューラルネットワーク探索は、最適なニューラルネットワークアーキテクチャを見つけるために使用される。
潜在分布を制約する潜在分布学習手法が導入された。
提案モデルは多くのベンチマークテストで最先端のcrf表現精度を実現したが、簡易かつ効率的なモデル表現のためにカメラ応答キャリブレーション時の最大精度推定を行う場合、最良モデルのほぼ2倍高速である。
関連論文リスト
- A Novel Spike Transformer Network for Depth Estimation from Event Cameras via Cross-modality Knowledge Distillation [3.355813093377501]
イベントカメラは従来のデジタルカメラとは異なる動作をし、データを継続的にキャプチャし、時間、位置、光強度を符号化するバイナリスパイクを生成する。
これは、イベントカメラに適した革新的でスパイク対応のアルゴリズムの開発を必要とする。
スパイクカメラデータから深度推定を行うために,純粋にスパイク駆動のスパイク変圧器ネットワークを提案する。
論文 参考訳(メタデータ) (2024-04-26T11:32:53Z) - Learning Robust Multi-Scale Representation for Neural Radiance Fields
from Unposed Images [65.41966114373373]
コンピュータビジョンにおけるニューラルイメージベースのレンダリング問題に対する改善された解決策を提案する。
提案手法は,テスト時に新たな視点からシーンのリアルなイメージを合成することができる。
論文 参考訳(メタデータ) (2023-11-08T08:18:23Z) - Inverting the Imaging Process by Learning an Implicit Camera Model [73.81635386829846]
本稿では,ディープニューラルネットワークとしてのカメラの物理画像処理を表現した,新しい暗黙カメラモデルを提案する。
本稿では,この暗黙カメラモデルが2つの逆撮像タスクに与える影響を実演する。
論文 参考訳(メタデータ) (2023-04-25T11:55:03Z) - DeepDC: Deep Distance Correlation as a Perceptual Image Quality
Evaluator [53.57431705309919]
ImageNet Pre-trained Deep Neural Network (DNN)は、効果的な画像品質評価(IQA)モデルを構築するための顕著な転送性を示す。
我々は,事前学習DNN機能のみに基づく新しいフル参照IQA(FR-IQA)モデルを開発した。
5つの標準IQAデータセット上で,提案した品質モデルの優位性を示すため,包括的実験を行った。
論文 参考訳(メタデータ) (2022-11-09T14:57:27Z) - Robustifying the Multi-Scale Representation of Neural Radiance Fields [86.69338893753886]
実世界の画像の両問題を克服するために,頑健なマルチスケールニューラルラジアンス場表現手法を提案する。
提案手法は,NeRFにインスパイアされたアプローチを用いて,マルチスケール画像効果とカメラ位置推定問題に対処する。
例えば、日常的に取得したマルチビュー画像からオブジェクトの正確な神経表現を行うためには、カメラの正確な位置推定が不可欠であることを示す。
論文 参考訳(メタデータ) (2022-10-09T11:46:45Z) - VMRF: View Matching Neural Radiance Fields [57.93631771072756]
VMRFは、カメラポーズやカメラポーズの分布に関する事前知識を必要とせずに、効果的なNeRFトレーニングを可能にする、革新的な視野マッチングNeRFである。
VMRFは、不均衡な最適輸送を利用するビューマッチングスキームを導入し、レンダリングされた画像をランダムにカメラのポーズで対応する実画像にマッピングする特徴輸送計画を生成する。
特徴伝達プランをガイダンスとして、レンダリング画像と実画像の相対的なポーズを予測することにより、初期ランダム化されたカメラポーズを補正する新しいポーズキャリブレーション手法を設計する。
論文 参考訳(メタデータ) (2022-07-06T12:26:40Z) - Dynamic Proximal Unrolling Network for Compressive Sensing Imaging [29.00266254916676]
本稿では,DPUNetと呼ばれる動的近位アンローリングネットワークについて述べる。
具体的には、DPUNetは、勾配降下による埋め込み物理モデルと、学習された動的近位写像による画像のインポーティングの両方を活用できる。
実験結果から,提案したDPUNetは,サンプル比や雑音レベルの異なる複数のCSIモダリティを1つのモデルで効果的に処理できることがわかった。
論文 参考訳(メタデータ) (2021-07-23T03:04:44Z) - Single-Image HDR Reconstruction by Learning to Reverse the Camera
Pipeline [100.5353614588565]
本稿では,LDR画像形成パイプラインの領域知識をモデルに組み込むことを提案する。
我々は,HDRto-LDR画像形成パイプラインを(1)ダイナミックレンジクリッピング,(2)カメラ応答関数からの非線形マッピング,(3)量子化としてモデル化する。
提案手法は,最先端の単一画像HDR再構成アルゴリズムに対して良好に動作することを示す。
論文 参考訳(メタデータ) (2020-04-02T17:59:04Z) - Text-to-Image Generation with Attention Based Recurrent Neural Networks [1.2599533416395765]
我々は,安定なキャプションベース画像生成モデルを構築した。
実験はMicrosoftデータセット上で行われる。
その結果,提案手法は現代の手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2020-01-18T12:19:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。