論文の概要: Adaptive Multiplane Image Generation from a Single Internet Picture
- arxiv url: http://arxiv.org/abs/2011.13317v1
- Date: Thu, 26 Nov 2020 14:35:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-20 09:04:28.062455
- Title: Adaptive Multiplane Image Generation from a Single Internet Picture
- Title(参考訳): 単一インターネット画像からの適応型多面体画像生成
- Authors: Diogo C. Luvizon, Gustavo Sutter P. Carvalho, Andreza A. dos Santos,
Jhonatas S. Conceicao, Jose L. Flores-Campana, Luis G. L. Decker, Marcos R.
Souza, Helio Pedrini, Antonio Joia, Otavio A. B. Penatti
- Abstract要約: 一つの高解像度画像から多面体画像(MPI)を生成する問題に対処する。
可変枚数の画像平面を持つMPIを生成する適応スライシングアルゴリズムを提案する。
本研究では,従来の手法に比べて一桁のパラメータで高品質な予測が可能であることを示す。
- 参考スコア(独自算出の注目度): 1.8961324344454253
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the last few years, several works have tackled the problem of novel view
synthesis from stereo images or even from a single picture. However, previous
methods are computationally expensive, specially for high-resolution images. In
this paper, we address the problem of generating a multiplane image (MPI) from
a single high-resolution picture. We present the adaptive-MPI representation,
which allows rendering novel views with low computational requirements. To this
end, we propose an adaptive slicing algorithm that produces an MPI with a
variable number of image planes. We present a new lightweight CNN for depth
estimation, which is learned by knowledge distillation from a larger network.
Occluded regions in the adaptive-MPI are inpainted also by a lightweight CNN.
We show that our method is capable of producing high-quality predictions with
one order of magnitude less parameters compared to previous approaches. The
robustness of our method is evidenced on challenging pictures from the
Internet.
- Abstract(参考訳): ここ数年、ステレオ画像や単一画像からの新しいビュー合成の問題に、いくつかの作品が取り組んできた。
しかし、従来の手法は計算に高価であり、特に高解像度画像に向いている。
本稿では,1枚の高解像度画像から多面体画像(MPI)を生成する問題に対処する。
本稿では,少ない計算要求で新しいビューをレンダリングできる適応MPI表現を提案する。
そこで本研究では,画像平面の可変数のMPIを生成する適応スライシングアルゴリズムを提案する。
本稿では,大規模ネットワークからの知識蒸留により学習した深度推定のための軽量CNNを提案する。
適応MPIの付加領域も軽量CNNによって塗装される。
提案手法は,従来手法に比べて1桁少ないパラメータで高品質な予測を生成できることを示す。
提案手法のロバスト性は,インターネットからの挑戦的な画像から証明される。
関連論文リスト
- Parameter-Inverted Image Pyramid Networks [49.35689698870247]
Inverted Image Pyramid Networks (PIIP) と呼ばれる新しいネットワークアーキテクチャを提案する。
私たちの中核となる考え方は、パラメータサイズの異なるモデルを使用して、画像ピラミッドの解像度の異なるレベルを処理することです。
PIIPは、オブジェクト検出、セグメンテーション、画像分類などのタスクにおいて優れたパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-06-06T17:59:10Z) - Hyper-VolTran: Fast and Generalizable One-Shot Image to 3D Object
Structure via HyperNetworks [53.67497327319569]
画像から3Dまでを1つの視点から解く新しいニューラルレンダリング手法を提案する。
提案手法では, 符号付き距離関数を表面表現として使用し, 幾何エンコードボリュームとハイパーネットワークスによる一般化可能な事前処理を取り入れた。
本実験は,一貫した結果と高速な生成による提案手法の利点を示す。
論文 参考訳(メタデータ) (2023-12-24T08:42:37Z) - MMPI: a Flexible Radiance Field Representation by Multiple Multi-plane
Images Blending [61.45757368117578]
本稿では,多平面画像(MPI)に基づく神経放射場のフレキシブルな表現について述べる。
MPIは、単純な定義、簡単な計算、非有界シーンを表現する強力な能力のために、NeRF学習で広く使われている。
MPIは複雑なシーンを多種多様なカメラ分布と視野方向で合成できることを示す。
論文 参考訳(メタデータ) (2023-09-30T04:36:43Z) - T-former: An Efficient Transformer for Image Inpainting [50.43302925662507]
トランスフォーマーと呼ばれる注目に基づくネットワークアーキテクチャのクラスは、自然言語処理の分野で大きなパフォーマンスを示している。
本稿では,Taylorの展開に応じて,解像度に線形に関連付けられた新たな注意を設計し,この注意に基づいて,画像インペイントのためのネットワークである$T$-formerを設計する。
いくつかのベンチマークデータセットの実験により,提案手法は比較的少ないパラメータ数と計算複雑性を維持しつつ,最先端の精度を達成できることが示されている。
論文 参考訳(メタデータ) (2023-05-12T04:10:42Z) - Efficient Textured Mesh Recovery from Multiple Views with Differentiable
Rendering [8.264851594332677]
マルチビュー画像からテクスチャメッシュを復元する手法を提案する。
学習ベース多視点ステレオアルゴリズムにより予測される深度との差を最小化することにより形状形状を最適化する。
形状や色に対する暗黙的なニューラル表現とは対照的に,物体の光と反射を共同で推定する物理ベース逆レンダリング方式を導入する。
論文 参考訳(メタデータ) (2022-05-25T03:33:55Z) - An Optical physics inspired CNN approach for intrinsic image
decomposition [0.0]
内在画像分解は、画像の構成成分を生成する開放的な問題である。
画像から導出した物理パラメータを用いてこの分解が可能なニューラルネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-05-21T00:54:01Z) - Deep Variational Network Toward Blind Image Restoration [60.45350399661175]
ブラインド画像復元はコンピュータビジョンでは一般的だが難しい問題である。
両利点を両立させることを目的として,新しいブラインド画像復元手法を提案する。
画像デノイングと超解像という2つの典型的なブラインド赤外線タスクの実験により,提案手法が現状よりも優れた性能を達成できることが実証された。
論文 参考訳(メタデータ) (2020-08-25T03:30:53Z) - The Power of Triply Complementary Priors for Image Compressive Sensing [89.14144796591685]
本稿では,一対の相補的な旅先を含むLRD画像モデルを提案する。
次に、画像CSのためのRDモデルに基づく新しいハイブリッド・プラグイン・アンド・プレイ・フレームワークを提案する。
そこで,提案したH-based image CS問題の解法として,単純で効果的なアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-05-16T08:17:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。