Fugu-MT 論文翻訳(概要): Redundancy-Aware Camera Selection for Indoor Scene Neural Rendering

論文の概要: Redundancy-Aware Camera Selection for Indoor Scene Neural Rendering

arxiv url: http://arxiv.org/abs/2409.07098v1
Date: Wed, 11 Sep 2024 08:36:49 GMT
ステータス: 翻訳完了
システム内更新日: 2024-09-12 15:14:01.432635
Title: Redundancy-Aware Camera Selection for Indoor Scene Neural Rendering
Title（参考訳）: 室内シーンニューラルレンダリングのための冗長性を考慮したカメラ選択
Authors: Zehao Wang, Han Zhou, Matthew B. Blaschko, Tinne Tuytelaars, Minye Wu,
Abstract要約: カメラの空間的多様性と画像の意味的変動の両方を取り入れた類似度行列を構築した。カメラ選択を最適化するために,多様性に基づくサンプリングアルゴリズムを適用した。 IndoorTrajという新しいデータセットも開発しています。仮想屋内環境で人間が捉えた、長くて複雑なカメラの動きが含まれています。
参考スコア（独自算出の注目度）: 54.468355408388675
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Novel view synthesis of indoor scenes can be achieved by capturing a monocular video sequence of the environment. However, redundant information caused by artificial movements in the input video data reduces the efficiency of scene modeling. In this work, we tackle this challenge from the perspective of camera selection. We begin by constructing a similarity matrix that incorporates both the spatial diversity of the cameras and the semantic variation of the images. Based on this matrix, we use the Intra-List Diversity (ILD) metric to assess camera redundancy, formulating the camera selection task as an optimization problem. Then we apply a diversity-based sampling algorithm to optimize the camera selection. We also develop a new dataset, IndoorTraj, which includes long and complex camera movements captured by humans in virtual indoor environments, closely mimicking real-world scenarios. Experimental results demonstrate that our strategy outperforms other approaches under time and memory constraints. Remarkably, our method achieves performance comparable to models trained on the full dataset, while using only an average of 15% of the frames and 75% of the allotted time.
Abstract（参考訳）: 室内シーンの新たなビュー合成は、環境の単眼ビデオシーケンスをキャプチャすることで実現できる。しかし、入力ビデオデータ中の人工的な動きによって生じる冗長な情報は、シーンモデリングの効率を低下させる。本研究では,カメラ選択の観点から,この課題に取り組む。まず、カメラの空間的多様性と画像の意味的変動の両方を取り入れた類似度行列を構築する。この行列に基づいて、カメラの冗長性を評価するためにILD(Intra-List Diversity)メトリクスを使用し、カメラ選択タスクを最適化問題として定式化する。次に、多様性に基づくサンプリングアルゴリズムを適用し、カメラ選択を最適化する。 IndoorTrajという新しいデータセットも開発しています。仮想屋内環境で人間が捉えた、長くて複雑なカメラの動きが、現実世界のシナリオを忠実に模倣しています。実験の結果、我々の戦略は時間とメモリの制約下で他のアプローチよりも優れていることが示された。注目すべきことに,本手法は全データセットでトレーニングしたモデルに匹敵する性能を達成し,フレームの平均15%と割り当て時間の75%しか使用していない。

関連論文リスト

CamMimic: Zero-Shot Image To Camera Motion Personalized Video Generation Using Diffusion Models [47.65379612084075]
CamMimicは、所定のリファレンスビデオで観察されたカメラモーションを、ユーザの選択したシーンにシームレスに転送するように設計されている。非関連シーン間のカメラの動き伝達を評価するための確立された指標が存在しないため,CameraScoreを提案する。
論文参考訳（メタデータ） (2025-04-13T08:04:11Z)
FRAME: Floor-aligned Representation for Avatar Motion from Egocentric Video [52.33896173943054]
ヘッドマウントのボディフェイスステレオカメラを備えたエゴセントリックなモーションキャプチャーは、VRやARアプリケーションには不可欠だ。既存の方法は、合成事前学習と、現実の環境で滑らかで正確な予測を生成するのに苦労している。本稿では、デバイスポーズとカメラフィードを組み合わせて、最先端のボディポーズ予測を行う、シンプルで効果的なアーキテクチャFRAMEを提案する。
論文参考訳（メタデータ） (2025-03-29T14:26:06Z)
Neural Observation Field Guided Hybrid Optimization of Camera Placement [9.872016726487]
本稿では,勾配法と非勾配法を併用したハイブリッドカメラ配置最適化手法を提案する。提案手法は,従来の計算時間の一部(8倍)しか必要とせず,最先端の性能を実現する。
論文参考訳（メタデータ） (2024-12-11T10:31:06Z)
Boost 3D Reconstruction using Diffusion-based Monocular Camera Calibration [34.18403601269181]
DM-Calibは単一の入力画像からピンホールカメラ固有のパラメータを推定するための拡散に基づくアプローチである。我々は、カメラ画像と呼ばれる新しい画像ベース表現を導入し、数値カメラの内在を無意味に符号化する。一つのRGB入力からカメラ画像を生成するための安定拡散モデルを微調整することにより、RANSAC操作を介してカメラ固有の特徴を抽出することができる。
論文参考訳（メタデータ） (2024-11-26T09:04:37Z)
VICAN: Very Efficient Calibration Algorithm for Large Camera Networks [49.17165360280794]
ポースグラフ最適化手法を拡張する新しい手法を提案する。我々は、カメラを含む二部グラフ、オブジェクトの動的進化、各ステップにおけるカメラオブジェクト間の相対変換について考察する。我々のフレームワークは従来のPGOソルバとの互換性を維持しているが、その有効性はカスタマイズされた最適化方式の恩恵を受けている。
論文参考訳（メタデータ） (2024-03-25T17:47:03Z)
Learning Robust Multi-Scale Representation for Neural Radiance Fields from Unposed Images [65.41966114373373]
コンピュータビジョンにおけるニューラルイメージベースのレンダリング問題に対する改善された解決策を提案する。提案手法は,テスト時に新たな視点からシーンのリアルなイメージを合成することができる。
論文参考訳（メタデータ） (2023-11-08T08:18:23Z)
Joint Video Multi-Frame Interpolation and Deblurring under Unknown Exposure Time [101.91824315554682]
本研究では,より現実的で挑戦的なタスク – 複数フレームのジョイントビデオと,未知の露光時間下での劣化 – を野心的に目標とする。我々はまず,入力されたぼやけたフレームから露出認識表現を構築するために,教師付きコントラスト学習の変種を採用する。次に、プログレッシブ露光適応型畳み込みと動き改善による露出と動きの表現に基づいて、映像再構成ネットワークを構築した。
論文参考訳（メタデータ） (2023-03-27T09:43:42Z)
A Portable Multiscopic Camera for Novel View and Time Synthesis in Dynamic Scenes [42.00094186447837]
ダイナミックなシーンにおける新しいビューと時間合成のための専用モデルを備えた携帯型マルチスコープカメラシステムを提案する。私たちのゴールは、ポータブルなマルチスコープカメラを使って、いつでもあらゆる視点から、ダイナミックなシーンの高品質な画像をレンダリングすることです。
論文参考訳（メタデータ） (2022-08-30T17:53:17Z)
Cross-View Cross-Scene Multi-View Crowd Counting [56.83882084112913]
従来,複数カメラを用いて1台のカメラの視野を拡大する手法が提案されてきた。任意のカメラレイアウトで異なるシーンでトレーニングやテストを行う,クロスビュー・クロスシーン(CVCS)のマルチビュー・クラウドカウント・パラダイムを提案する。
論文参考訳（メタデータ） (2022-05-03T15:03:44Z)
Self-Supervised Camera Self-Calibration from Video [34.35533943247917]
汎用カメラモデルの効率的なファミリーを用いてシーケンスごとのキャリブレーションパラメータを回帰する学習アルゴリズムを提案する。提案手法は,サブピクセル再投射誤差による自己校正を行い,他の学習手法よりも優れる。
論文参考訳（メタデータ） (2021-12-06T19:42:05Z)
DeepMultiCap: Performance Capture of Multiple Characters Using Sparse Multiview Cameras [63.186486240525554]
deep multicapは、スパースマルチビューカメラを用いたマルチパーソンパフォーマンスキャプチャのための新しい手法である。本手法では,事前走査型テンプレートモデルを用いることなく,時間変化した表面の詳細をキャプチャできる。
論文参考訳（メタデータ） (2021-05-01T14:32:13Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。