Fugu-MT 論文翻訳(概要): 360DVD: Controllable Panorama Video Generation with 360-Degree Video Diffusion Model

論文の概要: 360DVD: Controllable Panorama Video Generation with 360-Degree Video Diffusion Model

arxiv url: http://arxiv.org/abs/2401.06578v1
Date: Fri, 12 Jan 2024 13:52:29 GMT
ステータス: 翻訳完了
システム内更新日: 2024-01-15 19:21:28.699958
Title: 360DVD: Controllable Panorama Video Generation with 360-Degree Video Diffusion Model
Title（参考訳）: 360DVD:360度ビデオ拡散モデルによるパノラマ映像生成
Authors: Qian Wang, Weiqi Li, Chong Mou, Xinhua Cheng, Jian Zhang
Abstract要約: 与えられたプロンプトと動作条件に基づいてパノラマ映像を生成するために360DVD(360-Degree Video Diffusion model)という制御可能なパノラマ映像生成パイプラインを提案する。また,360度ビデオテキストペアで360DVDのトレーニングを行うWEB360というパノラマデータセットを提案する。
参考スコア（独自算出の注目度）: 25.43604697729229
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: 360-degree panoramic videos recently attract more interest in both studies and applications, courtesy of the heightened immersive experiences they engender. Due to the expensive cost of capturing 360-degree panoramic videos, generating desirable panoramic videos by given prompts is urgently required. Recently, the emerging text-to-video (T2V) diffusion methods demonstrate notable effectiveness in standard video generation. However, due to the significant gap in content and motion patterns between panoramic and standard videos, these methods encounter challenges in yielding satisfactory 360-degree panoramic videos. In this paper, we propose a controllable panorama video generation pipeline named 360-Degree Video Diffusion model (360DVD) for generating panoramic videos based on the given prompts and motion conditions. Concretely, we introduce a lightweight module dubbed 360-Adapter and assisted 360 Enhancement Techniques to transform pre-trained T2V models for 360-degree video generation. We further propose a new panorama dataset named WEB360 consisting of 360-degree video-text pairs for training 360DVD, addressing the absence of captioned panoramic video datasets. Extensive experiments demonstrate the superiority and effectiveness of 360DVD for panorama video generation. The code and dataset will be released soon.
Abstract（参考訳）: 360度パノラマ動画は最近、没入体験の高まりによって、研究と応用の両方により多くの関心を寄せている。 360度パノラマビデオを撮影するコストがかかるため、所定のプロンプトで所望のパノラマ動画を生成する必要がある。近年,テキスト・ツー・ビデオ(T2V)拡散法が標準映像生成において顕著な効果を示した。しかし、パノラマビデオと標準ビデオの間のコンテンツと動きのパターンが著しく異なるため、これらの手法は満足のいく360度パノラマビデオを生み出すという困難に直面する。本稿では,パノラマ映像を生成するための360DVD(360-Degree Video Diffusion model)という制御可能なパノラマ映像生成パイプラインを提案する。具体的には、360-Adapterと呼ばれる軽量モジュールを導入し、360度ビデオ生成のための事前学習されたT2Vモデルを変換する。さらに,360度ビデオテキストペアによるパノラマデータセット WEB360 を提案し,キャプション付きパノラマビデオデータセットの欠如に対処する。パノラマビデオ生成における360dvdの優位性と有効性を示す広範な実験。コードとデータセットは間もなくリリースされる。

関連論文リスト

PanoLora: Bridging Perspective and Panoramic Video Generation with LoRA Adaptation [17.498427118787045]
パノラマビデオは視野が限られている単一の視点に依存しており、標準のビデオ生成モデルが適応することが困難である。既存のソリューションは、しばしば複雑なアーキテクチャや大規模なトレーニングを導入し、非効率性と準最適結果をもたらす。本研究では,パノラマ画像生成を視点から見た適応問題として扱うことを提案する。提案手法は,高品質なパノラマ生成を実現しつつ,約1,000本のビデオのみを用いて,事前学習したビデオ拡散モデルを効率よく微調整する。
論文参考訳（メタデータ） (2025-09-14T05:05:27Z)
ViewPoint: Panoramic Video Generation with Pretrained Diffusion Models [52.87334248847314]
本研究では,パノラマ映像の生成に事前学習した視点映像モデルを用いた新しいフレームワークを提案する。具体的には,世界空間の連続性と細かな視覚的詳細を同時に持つビューポイントマップという新しいパノラマ表現を設計する。提案手法は,パノラマ映像を高度にダイナミックかつ空間的に一貫したパノラマ映像を合成し,最先端の性能を達成し,従来の手法を超越することができる。
論文参考訳（メタデータ） (2025-06-30T04:33:34Z)
PanoWan: Lifting Diffusion Video Generation Models to 360° with Latitude/Longitude-aware Mechanisms [41.92179513409301]
既存のパノラマビデオ生成モデルは、高品質なパノラマビデオのための従来のテキスト・ツー・ビデオ・モデルから事前訓練された生成先を活用するのに苦労している。本稿では,パノラマ領域に最小限のモジュールを備えた事前学習されたテキスト・ビデオ・モデルを効果的に持ち上げるパノラマモデルを提案する。これらの揚力表現を学習するためのパノラマビデオを提供するため、キャプションと多様なシナリオを備えた高品質なパノラマビデオデータセットであるPanoVidをコントリビュートする。
論文参考訳（メタデータ） (2025-05-28T06:24:21Z)
VideoPanda: Video Panoramic Diffusion with Multi-view Attention [57.87428280844657]
高解像度パノラマビデオコンテンツはバーチャルリアリティーの没入体験にとって最重要であるが、特殊な機器や複雑なカメラのセットアップを必要とするため、収集は容易ではない。 VideoPandaは、既存の方法と比較して、すべての入力条件に対してよりリアルでコヒーレントな360$のパノラマを生成する。
論文参考訳（メタデータ） (2025-04-15T16:58:15Z)
Beyond the Frame: Generating 360° Panoramic Videos from Perspective Videos [64.10180665546237]
360degのビデオは、私たちの周囲のより完全な視点を提供する。既存のビデオモデルは、標準的なビデオを作るのに優れているが、完全なパノラマビデオを生成する能力は、まだ明らかになっていない。高品質なデータフィルタリングパイプラインを開発し、双方向のトレーニングデータをキュレートし、360度ビデオ生成の品質を向上させる。実験結果から,本モデルでは実写的でコヒーレントな360デグ映像を撮影できることが示された。
論文参考訳（メタデータ） (2025-04-10T17:51:38Z)
WorldPrompter: Traversable Text-to-Scene Generation [18.405299478122693]
テキストプロンプトから可逆3Dシーンを合成するための新しい生成パイプラインであるWorldPrompterを紹介する。 WorldPrompterには条件付き360度パノラマビデオジェネレータが組み込まれており、仮想環境を歩いたり捉えたりする人をシミュレートする128フレームのビデオを生成することができる。得られたビデオは、高速フィードフォワード3Dコンストラクタによってガウススプラッターとして再構成され、3Dシーン内で真の歩行可能な体験を可能にする。
論文参考訳（メタデータ） (2025-04-02T18:04:32Z)
Imagine360: Immersive 360 Video Generation from Perspective Anchor [79.97844408255897]
Imagine360は、360円から360ドル程度のビデオ生成フレームワークだ。 360ドル(約3万3000円)の限られたビデオデータから、細粒の球面と動きのパターンを学習する。最先端の360ドル(約3万3000円)の動画生成方法では、グラフィック品質とモーションコヒーレンスに優れています。
論文参考訳（メタデータ） (2024-12-04T18:50:08Z)
DiffPano: Scalable and Consistent Text to Panorama Generation with Spherical Epipolar-Aware Diffusion [60.45000652592418]
本稿では,テキスト駆動型パノラマ生成フレームワークDiffPanoを提案し,拡張性,一貫性,多様なパノラマシーン生成を実現する。 DiffPanoは、不明瞭なテキスト記述とカメラのポーズによって、一貫した多様なパノラマ画像を生成することができることを示す。
論文参考訳（メタデータ） (2024-10-31T17:57:02Z)
VidPanos: Generative Panoramic Videos from Casual Panning Videos [73.77443496436749]
パノラマ画像ステッチは、カメラの視野を越えて広がるシーンの統一された広角ビューを提供する。本稿では,カジュアルにキャプチャされたパンニングビデオからパノラマ動画を合成する方法を提案する。我々のシステムは、人、車、流れる水など、さまざまな場所のシーンにビデオパノラマを作成できる。
論文参考訳（メタデータ） (2024-10-17T17:53:24Z)
SceneDreamer360: Text-Driven 3D-Consistent Scene Generation with Panoramic Gaussian Splatting [53.32467009064287]
テキスト駆動型3D一貫性シーン生成モデルSceneDreamer360を提案する。提案手法は,テキスト駆動パノラマ画像生成モデルを3次元シーン生成の先行モデルとして活用する。 SceneDreamer360はそのパノラマ画像生成と3DGSにより、より高品質で空間的に整合性があり、視覚的に魅力的な3Dシーンを任意のテキストプロンプトから生成できることを示した。
論文参考訳（メタデータ） (2024-08-25T02:56:26Z)
LayerPano3D: Layered 3D Panorama for Hyper-Immersive Scene Generation [105.52153675890408]
3D没入型シーン生成はコンピュータビジョンとグラフィックスにおいて難しいが重要な課題である。 Layerpano3Dは、単一のテキストプロンプトからフルビューで探索可能なパノラマ3Dシーンを生成するための新しいフレームワークである。
論文参考訳（メタデータ） (2024-08-23T17:50:23Z)
SVG: 3D Stereoscopic Video Generation via Denoising Frame Matrix [60.48666051245761]
本研究では,3次元立体映像生成のためのポーズフリーかつトレーニングフリーな手法を提案する。提案手法は, 推定ビデオ深度を用いた立体視ベースライン上のカメラビューにモノクロ映像をワープする。本研究では,映像の画質向上を図るために,非閉塞境界再注入方式を開発した。
論文参考訳（メタデータ） (2024-06-29T08:33:55Z)
4K4DGen: Panoramic 4D Generation at 4K Resolution [67.98105958108503]
一つのパノラマを没入的な4D体験に高めるという課題に取り組む。初めて、4K解像度で360$circ$のビューで全方位動的シーンを生成する能力を実証した。高品質なパノラマ・ト・4Dを4Kの解像度で初めて実現した。
論文参考訳（メタデータ） (2024-06-19T13:11:02Z)
See360: Novel Panoramic View Interpolation [24.965259708297932]
See360は、潜在空間視点推定を用いた360パノラマビューのための汎用的で効率的なフレームワークである。提案手法は,4つのデータセットに対する任意のビューのリアルタイムレンダリングを実現するのに十分な汎用性を有することを示す。
論文参考訳（メタデータ） (2024-01-07T09:17:32Z)
PanoVOS: Bridging Non-panoramic and Panoramic Views with Transformer for Video Segmentation [39.269864548255576]
パノラマビデオデータセットPanoVOSを提案する。データセットは150本のビデオに高解像度と多様なモーションを提供する。パノラマ空間整合変換器(PSCFormer)は,従来のフレームのセマンティック境界情報を,現在のフレームとの画素レベルのマッチングに有効に利用することができる。
論文参考訳（メタデータ） (2023-09-21T17:59:02Z)
360-Degree Panorama Generation from Few Unregistered NFoV Images [16.05306624008911]
360$circ$パノラマはコンピュータグラフィックスの環境光源として広く利用されている。 360ドルドルタイムス 180ドルパノラマは特殊で高価な装置のために困難を招きますパノディフと呼ばれる新しいパイプラインを提案し、パノラマを360ドル円で効率よく生成する。
論文参考訳（メタデータ） (2023-08-28T16:21:51Z)
NeO 360: Neural Fields for Sparse View Synthesis of Outdoor Scenes [59.15910989235392]
屋外シーンのスパースビュー合成のためのNeO 360, Neural Fieldを紹介する。 NeO 360は、単一のまたは少数のRGB画像から360degのシーンを再構成する一般化可能な方法である。我々の表現は、Voxel-basedとBird's-eye-view (BEV)の両方の表現の長所を組み合わせたものである。
論文参考訳（メタデータ） (2023-08-24T17:59:50Z)
Revisiting Optical Flow Estimation in 360 Videos [9.997208301312956]
我々は、視点ビデオドメインから360度ビデオドメインへのドメイン適応フレームワークとしてLiteFlowNet360を設計する。我々は、Kernel Transformer Network(KTN)にインスパイアされた単純なカーネル変換技術を用いて、360度ビデオの固有の歪みに対処する。実験結果から,提案アーキテクチャを用いた360度ビデオ光流量推定の有望な結果が得られた。
論文参考訳（メタデータ） (2020-10-15T22:22:21Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。