Fugu-MT 論文翻訳(概要): FaDIV-Syn: Fast Depth-Independent View Synthesis

論文の概要: FaDIV-Syn: Fast Depth-Independent View Synthesis

arxiv url: http://arxiv.org/abs/2106.13139v1
Date: Thu, 24 Jun 2021 16:14:01 GMT
ステータス: 翻訳完了
システム内更新日: 2021-06-25 15:05:40.232184
Title: FaDIV-Syn: Fast Depth-Independent View Synthesis
Title（参考訳）: FaDIV-Syn:高速深度非依存ビュー合成
Authors: Andre Rochow, Max Schwarz, Michael Weinmann, Sven Behnke
Abstract要約: 高速深度に依存しないビュー合成法であるFaDIV-Synを紹介する。我々の多視点アプローチは、ビュー合成法がしばしば深度推定段階によって制限される問題に対処する。
参考スコア（独自算出の注目度）: 27.468361999226886
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We introduce FaDIV-Syn, a fast depth-independent view synthesis method. Our multi-view approach addresses the problem that view synthesis methods are often limited by their depth estimation stage, where incorrect depth predictions can lead to large projection errors. To avoid this issue, we efficiently warp multiple input images into the target frame for a range of assumed depth planes. The resulting tensor representation is fed into a U-Net-like CNN with gated convolutions, which directly produces the novel output view. We therefore side-step explicit depth estimation. This improves efficiency and performance on transparent, reflective, and feature-less scene parts. FaDIV-Syn can handle both interpolation and extrapolation tasks and outperforms state-of-the-art extrapolation methods on the large-scale RealEstate10k dataset. In contrast to comparable methods, it is capable of real-time operation due to its lightweight architecture. We further demonstrate data efficiency of FaDIV-Syn by training from fewer examples as well as its generalization to higher resolutions and arbitrary depth ranges under severe depth discretization.
Abstract（参考訳）: 高速深度に依存しないビュー合成法であるFaDIV-Synを紹介する。我々のマルチビューアプローチは、視線合成法がしばしばその深度推定段階によって制限される問題に対処し、誤った深度予測が大きな予測誤差をもたらす可能性がある。この問題を回避するため,複数の入力画像を対象のフレームに効率よくワープし,推定深度を推定する。結果として得られるテンソル表現は、ゲート畳み込みを持つU-NetライクなCNNに入力され、新しい出力ビューを直接生成する。したがって、横方向の明示的な深さ推定を行う。これにより、透明で反射的で、機能のないシーン部分の効率とパフォーマンスが向上する。 FaDIV-Synは、補間タスクと補間タスクの両方を処理でき、大規模なRealEstate10kデータセット上で、最先端の補間メソッドより優れている。同等の手法とは対照的に、軽量アーキテクチャのためリアルタイム操作が可能である。さらに,FaDIV-Synのデータ効率を,より少ないサンプルから高分解能への一般化と深度離散化による任意の深度範囲の訓練により実証する。

関連論文リスト

Rethinking Transparent Object Grasping: Depth Completion with Monocular Depth Estimation and Instance Mask [10.472380465235629]
ReMakeは、インスタンスマスクと単眼深度推定によってガイドされる、新しい深度補完フレームワークである。提案手法は,ベンチマークデータセットと実世界のシナリオの両方において,既存の手法よりも優れている。
論文参考訳（メタデータ） (2025-08-04T15:14:47Z)
Pixel-Aligned Multi-View Generation with Depth Guided Decoder [86.1813201212539]
画素レベルの画像・マルチビュー生成のための新しい手法を提案する。従来の作業とは異なり、潜伏映像拡散モデルのVAEデコーダにマルチビュー画像にアテンション層を組み込む。本モデルにより,マルチビュー画像間の画素アライメントが向上する。
論文参考訳（メタデータ） (2024-08-26T04:56:41Z)
Efficient Depth-Guided Urban View Synthesis [52.841803876653465]
高速フィードフォワード推論とシーンごとのファインチューニングのための効率的な深層誘導型都市ビュー合成(EDUS)を提案する。 EDUSは、粗い入力画像から一般化可能な都市ビュー合成を可能にするためのガイダンスとして、ノイズの多い幾何学的先行情報を利用する。その結果,EDUSは高速なテスト時間最適化と組み合わせることで,スパース・ビュー・セッティングにおける最先端性能を達成できることが示唆された。
論文参考訳（メタデータ） (2024-07-17T08:16:25Z)
Q-SLAM: Quadric Representations for Monocular SLAM [85.82697759049388]
四角形のレンズを通して体積表現を再現する。我々は、RGB入力からノイズの深い深さ推定を正すために二次仮定を用いる。本研究では,新たな二次分割変換器を導入し,二次情報を集約する。
論文参考訳（メタデータ） (2024-03-12T23:27:30Z)
Metrically Scaled Monocular Depth Estimation through Sparse Priors for Underwater Robots [0.0]
三角特徴量からのスパース深度測定を融合して深度予測を改善する深度学習モデルを定式化する。このネットワークは、前方に見える水中データセットFLSeaで教師ありの方法で訓練されている。この方法は、ラップトップGPUで160FPS、単一のCPUコアで7FPSで実行することで、リアルタイムのパフォーマンスを実現する。
論文参考訳（メタデータ） (2023-10-25T16:32:31Z)
DiffusionDepth: Diffusion Denoising Approach for Monocular Depth Estimation [23.22005119986485]
DiffusionDepthは、単分子深度推定をデノナイズ拡散過程として再構成する新しいアプローチである。ランダムな深度分布をモノラルな視覚条件のガイダンスで深度マップに分解する反復的復調過程を学習する。 KITTIとNYU-Depth-V2データセットの実験結果は、シンプルだが効率的な拡散アプローチが、許容可能な推論時間を持つ屋内および屋外の両方のシナリオで最先端のパフォーマンスに達することを示唆している。
論文参考訳（メタデータ） (2023-03-09T03:48:24Z)
DARF: Depth-Aware Generalizable Neural Radiance Field [51.29437249009986]
本稿では,Depth-Aware Dynamic Smpling(DADS)戦略を用いたDARF(Depth-Aware Generalizable Neural Radiance Field)を提案する。筆者らのフレームワークは,数枚の入力画像で,画素レベルと幾何学レベルの両方の見えないシーンを推測する。 DARFは、最先端の一般化可能なNeRF法と比較して、レンダリング品質と深さ推定を改善しつつ、サンプルを50%削減する。
論文参考訳（メタデータ） (2022-12-05T14:00:59Z)
RA-Depth: Resolution Adaptive Self-Supervised Monocular Depth Estimation [27.679479140943503]
本研究では,シーン深さのスケール不変性を学習し,自己教師付き単眼深度推定法(RA-Depth)を提案する。 RA-Depthは最先端の性能を達成し、解像度適応の優れた能力を示す。
論文参考訳（メタデータ） (2022-07-25T08:49:59Z)
DeepRM: Deep Recurrent Matching for 6D Pose Refinement [77.34726150561087]
DeepRMは、6Dポーズ改善のための新しいリカレントネットワークアーキテクチャである。アーキテクチャにはLSTMユニットが組み込まれ、各改善ステップを通じて情報を伝達する。 DeepRMは、2つの広く受け入れられている課題データセットで最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (2022-05-28T16:18:08Z)
Unpaired Single-Image Depth Synthesis with cycle-consistent Wasserstein GANs [1.0499611180329802]
実環境深度のリアルタイム推定は、様々な自律システムタスクにとって必須のモジュールである。本研究では、生成型ニューラルネットワークの分野における最近の進歩を、教師なしの単一画像深度合成に活用する。
論文参考訳（メタデータ） (2021-03-31T09:43:38Z)
Learning Monocular Dense Depth from Events [53.078665310545745]
イベントカメラは、強度フレームではなく、非同期イベントのストリームの形式で輝度を変化させる。最近の学習に基づくアプローチは、単眼深度予測のようなイベントベースのデータに適用されている。本稿では,この課題を解決するための繰り返しアーキテクチャを提案し,標準フィードフォワード法よりも大幅に改善されていることを示す。
論文参考訳（メタデータ） (2020-10-16T12:36:23Z)
Adaptive Context-Aware Multi-Modal Network for Depth Completion [107.15344488719322]
我々は,観測された空間コンテキストを捉えるために,グラフ伝搬を採用することを提案する。次に、注意機構を伝搬に適用し、ネットワークが文脈情報を適応的にモデル化することを奨励する。最後に、抽出したマルチモーダル特徴を効果的に活用するための対称ゲート融合戦略を導入する。本稿では,Adaptive Context-Aware Multi-Modal Network (ACMNet) を2つのベンチマークで評価した。
論文参考訳（メタデータ） (2020-08-25T06:00:06Z)
Fast Depth Estimation for View Synthesis [9.243157709083672]
ステレオ画像のシーケンスからの距離/深さを推定することは、3次元視覚において重要な要素である。本稿では,拡張畳み込み,密結合型畳み込みモジュール,コンパクトデコーダ,スキップ接続を利用した新しい学習ベースフレームワークを提案する。筆者らのネットワークは,それぞれ45%,34%の深さ推定とビュー合成を平均的に改善し,最先端の手法よりも優れていた。
論文参考訳（メタデータ） (2020-03-14T14:10:42Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。