Fugu-MT 論文翻訳(概要): RealCam-Vid: High-resolution Video Dataset with Dynamic Scenes and Metric-scale Camera Movements

論文の概要: RealCam-Vid: High-resolution Video Dataset with Dynamic Scenes and Metric-scale Camera Movements

arxiv url: http://arxiv.org/abs/2504.08212v1
Date: Fri, 11 Apr 2025 02:35:19 GMT
ステータス: 翻訳完了
システム内更新日: 2025-04-21 21:40:05.878617
Title: RealCam-Vid: High-resolution Video Dataset with Dynamic Scenes and Metric-scale Camera Movements
Title（参考訳）: RealCam-Vid:ダイナミックシーンとメトリスケールカメラによる高解像度ビデオデータセット
Authors: Guangcong Zheng, Teng Li, Xianpan Zhou, Xi Li,
Abstract要約: RealCam-Vidは、メトリックスケールカメラアノテーションを備えたオープンソースの高解像度ダイナミックシーンデータセットである。本稿では,メトリックスケールカメラアノテーションを付加した,オープンソースのハイレゾダイナミックシーンデータセットについて紹介する。
参考スコア（独自算出の注目度）: 9.714839452308581
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Recent advances in camera-controllable video generation have been constrained by the reliance on static-scene datasets with relative-scale camera annotations, such as RealEstate10K. While these datasets enable basic viewpoint control, they fail to capture dynamic scene interactions and lack metric-scale geometric consistency-critical for synthesizing realistic object motions and precise camera trajectories in complex environments. To bridge this gap, we introduce the first fully open-source, high-resolution dynamic-scene dataset with metric-scale camera annotations in https://github.com/ZGCTroy/RealCam-Vid.
Abstract（参考訳）: カメラ制御可能なビデオ生成の最近の進歩は、RealEstate10Kのような比較的大規模なカメラアノテーションを持つ静的シーンデータセットに依存することで制限されている。これらのデータセットは、基本的な視点制御を可能にするが、動的なシーンの相互作用を捉えることができず、複雑な環境で現実的な物体の動きと正確なカメラ軌道を合成するために、計量スケールの幾何的整合性が欠如している。このギャップを埋めるために、https://github.com/ZGCTroy/RealCam-Vidでメトリクススケールのカメラアノテーションを備えた、完全にオープンソースで高解像度のダイナミックシーンデータセットを導入しました。

関連論文リスト

Dynamic Camera Poses and Where to Find Them [36.249380390918816]
我々はDynPose-100Kを紹介した。DynPose-100Kはカメラポーズを付加した動的インターネットビデオの大規模データセットである。ポーズ推定には,最新のポイントトラッキング,動的マスキング,構造からの移動といった手法を組み合わせる。分析と実験により,DynPose-100Kは大規模かつ多様であることがわかった。
論文参考訳（メタデータ） (2025-04-24T17:59:56Z)
Back on Track: Bundle Adjustment for Dynamic Scene Reconstruction [78.27956235915622]
従来のSLAMシステムは、カジュアルなビデオでよく見られる非常にダイナミックなシーンと格闘する。この研究は3Dポイントトラッカーを利用して、カメラによる動的物体の動きからカメラによる動きを分離する。私たちのフレームワークは、従来のSLAM -- バンドル調整 -- の中核を、堅牢な学習ベースの3Dトラッカーフロントエンドと組み合わせています。
論文参考訳（メタデータ） (2025-04-20T07:29:42Z)
CameraCtrl II: Dynamic Scene Exploration via Camera-controlled Video Diffusion Models [89.63787060844409]
CameraCtrl IIは、カメラ制御ビデオ拡散モデルによる大規模動的シーン探索を可能にするフレームワークである。動的シーンの生成を段階的に拡大するアプローチを採っている。
論文参考訳（メタデータ） (2025-03-13T17:42:01Z)
RealCam-I2V: Real-World Image-to-Video Generation with Interactive Complex Camera Control [10.939379611590333]
RealCam-I2Vは拡散型ビデオ生成フレームワークである。単分子距離深度推定を統合し、前処理ステップで3次元シーン再構成を確立する。トレーニング中、再構成された3Dシーンは、絶対値に対するカメラパラメータのスケーリングを可能にする。 RealCam-I2Vは、RealEstate10Kおよびドメイン外画像の制御性とビデオ品質を大幅に改善する。
論文参考訳（メタデータ） (2025-02-14T10:21:49Z)
RoMo: Robust Motion Segmentation Improves Structure from Motion [46.77236343300953]
本稿では,固定世界フレームを移動中のシーンの構成要素を特定するために,映像に基づくモーションセグメンテーションの新たなアプローチを提案する。我々の単純かつ効果的な反復法であるRoMoは、光フローとエピポーラキューと事前訓練されたビデオセグメンテーションモデルを組み合わせたものである。さらに重要なのは、市販のSfMパイプラインとセグメンテーションマスクを組み合わせることで、ダイナミックなコンテンツを持つシーンに対する最先端のカメラキャリブレーションを新たに確立し、既存の手法を実質的なマージンで上回ることだ。
論文参考訳（メタデータ） (2024-11-27T01:09:56Z)
DATAP-SfM: Dynamic-Aware Tracking Any Point for Robust Structure from Motion in the Wild [85.03973683867797]
本稿では,スムーズなカメラ軌跡を推定し,野生のカジュアルビデオのための高密度点雲を得るための,簡潔でエレガントでロバストなパイプラインを提案する。提案手法は,複雑な動的課題シーンにおいても,カメラポーズ推定による最先端性能を実現する。
論文参考訳（メタデータ） (2024-11-20T13:01:16Z)
DynIBaR: Neural Dynamic Image-Based Rendering [79.44655794967741]
複雑な動的シーンを描写したモノクロ映像から新しいビューを合成する問題に対処する。我々は,近傍のビューから特徴を集約することで,新しい視点を合成するボリューム画像ベースのレンダリングフレームワークを採用する。動的シーンデータセットにおける最先端手法の大幅な改善を示す。
論文参考訳（メタデータ） (2022-11-20T20:57:02Z)
ParticleSfM: Exploiting Dense Point Trajectories for Localizing Moving Cameras in the Wild [57.37891682117178]
本稿では,一対の光流からの高密度対応に基づく動画の高密度間接構造抽出手法を提案する。不規則点軌道データを処理するために,新しいニューラルネットワークアーキテクチャを提案する。 MPIシンテルデータセットを用いた実験により,我々のシステムはより正確なカメラ軌道を生成することがわかった。
論文参考訳（メタデータ） (2022-07-19T09:19:45Z)
NeuralDiff: Segmenting 3D objects that move in egocentric videos [92.95176458079047]
観測された3次元シーンを静的な背景と動的前景に分解する問題について検討する。このタスクは、古典的な背景の減算問題を連想させるが、静的でダイナミックなシーンの全ての部分が大きな動きを生じさせるため、非常に難しい。特に、自我中心のビデオについて検討し、動的コンポーネントを観察・移動するオブジェクトとアクターにさらに分離する。
論文参考訳（メタデータ） (2021-10-19T12:51:35Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。