論文の概要: Inverting the Imaging Process by Learning an Implicit Camera Model
- arxiv url: http://arxiv.org/abs/2304.12748v1
- Date: Tue, 25 Apr 2023 11:55:03 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-26 20:53:56.522952
- Title: Inverting the Imaging Process by Learning an Implicit Camera Model
- Title(参考訳): 暗黙的カメラモデル学習による撮像過程の反転
- Authors: Xin Huang, Qi Zhang, Ying Feng, Hongdong Li, Qing Wang
- Abstract要約: 本稿では,ディープニューラルネットワークとしてのカメラの物理画像処理を表現した,新しい暗黙カメラモデルを提案する。
本稿では,この暗黙カメラモデルが2つの逆撮像タスクに与える影響を実演する。
- 参考スコア(独自算出の注目度): 73.81635386829846
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Representing visual signals with implicit coordinate-based neural networks,
as an effective replacement of the traditional discrete signal representation,
has gained considerable popularity in computer vision and graphics. In contrast
to existing implicit neural representations which focus on modelling the scene
only, this paper proposes a novel implicit camera model which represents the
physical imaging process of a camera as a deep neural network. We demonstrate
the power of this new implicit camera model on two inverse imaging tasks: i)
generating all-in-focus photos, and ii) HDR imaging. Specifically, we devise an
implicit blur generator and an implicit tone mapper to model the aperture and
exposure of the camera's imaging process, respectively. Our implicit camera
model is jointly learned together with implicit scene models under multi-focus
stack and multi-exposure bracket supervision. We have demonstrated the
effectiveness of our new model on a large number of test images and videos,
producing accurate and visually appealing all-in-focus and high dynamic range
images. In principle, our new implicit neural camera model has the potential to
benefit a wide array of other inverse imaging tasks.
- Abstract(参考訳): 暗黙の座標に基づくニューラルネットワークによる視覚的信号の表現は、従来の離散的信号表現の効果的な代替として、コンピュータビジョンやグラフィックスでかなりの人気を集めている。
本稿では、シーンのみをモデル化する既存の暗黙的ニューラルネットワークとは対照的に、カメラの物理的撮像過程をディープニューラルネットワークとして表現する新しい暗黙的カメラモデルを提案する。
新たな暗黙カメラモデルが2つの逆イメージングタスクに与える影響を実証する。
一 オールインフォーカス写真を生成して
ii) hdrイメージング。
具体的には、暗黙のぼかし発生器と暗黙のトーンマッパーを考案し、それぞれカメラの撮像プロセスの開口と露出をモデル化する。
我々の暗黙カメラモデルは、マルチフォーカススタックとマルチ露光ブラケット監視の下で暗黙のシーンモデルと共同で学習する。
我々は,多数のテスト画像とビデオに対して,新しいモデルの有効性を実証し,高精度で視覚に訴えるオールインフォーカスと高ダイナミックレンジの画像を生成する。
原則として、新しい暗黙的ニューラルカメラモデルは、他の様々な逆画像処理の恩恵を受ける可能性がある。
関連論文リスト
- Learning Robust Multi-Scale Representation for Neural Radiance Fields
from Unposed Images [65.41966114373373]
コンピュータビジョンにおけるニューラルイメージベースのレンダリング問題に対する改善された解決策を提案する。
提案手法は,テスト時に新たな視点からシーンのリアルなイメージを合成することができる。
論文 参考訳(メタデータ) (2023-11-08T08:18:23Z) - Robustifying the Multi-Scale Representation of Neural Radiance Fields [86.69338893753886]
実世界の画像の両問題を克服するために,頑健なマルチスケールニューラルラジアンス場表現手法を提案する。
提案手法は,NeRFにインスパイアされたアプローチを用いて,マルチスケール画像効果とカメラ位置推定問題に対処する。
例えば、日常的に取得したマルチビュー画像からオブジェクトの正確な神経表現を行うためには、カメラの正確な位置推定が不可欠であることを示す。
論文 参考訳(メタデータ) (2022-10-09T11:46:45Z) - im2nerf: Image to Neural Radiance Field in the Wild [47.18702901448768]
im2nerfは、野生の1つの入力イメージが与えられた連続的な神経オブジェクト表現を予測する学習フレームワークである。
Im2nerfは、野生の単視未表示画像から新しいビューを合成するための最先端性能を実現する。
論文 参考訳(メタデータ) (2022-09-08T23:28:56Z) - Representing Camera Response Function by a Single Latent Variable and
Fully Connected Neural Network [14.27259159089287]
多くのコンピュータビジョンタスクにおいて、シーン照射から画像強度へのマッピングをモデル化することが不可欠である。
単一潜伏変数と完全連結ニューラルネットワークを用いた高性能カメラ応答モデルを提案する。
論文 参考訳(メタデータ) (2022-09-08T08:02:57Z) - RelPose: Predicting Probabilistic Relative Rotation for Single Objects
in the Wild [73.1276968007689]
本稿では、任意のオブジェクトの複数の画像からカメラ視点を推定するデータ駆動手法について述べる。
本手法は, 画像の鮮明さから, 最先端のSfM法とSLAM法より優れていることを示す。
論文 参考訳(メタデータ) (2022-08-11T17:59:59Z) - VMRF: View Matching Neural Radiance Fields [57.93631771072756]
VMRFは、カメラポーズやカメラポーズの分布に関する事前知識を必要とせずに、効果的なNeRFトレーニングを可能にする、革新的な視野マッチングNeRFである。
VMRFは、不均衡な最適輸送を利用するビューマッチングスキームを導入し、レンダリングされた画像をランダムにカメラのポーズで対応する実画像にマッピングする特徴輸送計画を生成する。
特徴伝達プランをガイダンスとして、レンダリング画像と実画像の相対的なポーズを予測することにより、初期ランダム化されたカメラポーズを補正する新しいポーズキャリブレーション手法を設計する。
論文 参考訳(メタデータ) (2022-07-06T12:26:40Z) - Single-Image HDR Reconstruction by Learning to Reverse the Camera
Pipeline [100.5353614588565]
本稿では,LDR画像形成パイプラインの領域知識をモデルに組み込むことを提案する。
我々は,HDRto-LDR画像形成パイプラインを(1)ダイナミックレンジクリッピング,(2)カメラ応答関数からの非線形マッピング,(3)量子化としてモデル化する。
提案手法は,最先端の単一画像HDR再構成アルゴリズムに対して良好に動作することを示す。
論文 参考訳(メタデータ) (2020-04-02T17:59:04Z) - Text-to-Image Generation with Attention Based Recurrent Neural Networks [1.2599533416395765]
我々は,安定なキャプションベース画像生成モデルを構築した。
実験はMicrosoftデータセット上で行われる。
その結果,提案手法は現代の手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2020-01-18T12:19:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。