論文の概要: Visionary: The World Model Carrier Built on WebGPU-Powered Gaussian Splatting Platform
- arxiv url: http://arxiv.org/abs/2512.08478v1
- Date: Tue, 09 Dec 2025 10:54:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-10 22:28:07.928185
- Title: Visionary: The World Model Carrier Built on WebGPU-Powered Gaussian Splatting Platform
- Title(参考訳): Visionary: WebGPUを使ったガウシアンスプレイティングプラットフォーム上に構築された世界モデルキャリア
- Authors: Yuning Gong, Yifei Liu, Yifan Zhan, Muyao Niu, Xueying Li, Yuanjun Liao, Jiaming Chen, Yuanyuan Gao, Jiaqi Chen, Minming Chen, Li Zhou, Yuning Zhang, Wei Wang, Xiaoqing Hou, Huaxi Huang, Shixiang Tang, Le Ma, Dingwen Zhang, Xue Yang, Junchi Yan, Yanchi Zhang, Yinqiang Zheng, Xiao Sun, Zhihang Zhong,
- Abstract要約: Visionaryは、リアルタイムな様々なガウススティングとレンダリングのための、オープンでWebネイティブなプラットフォームである。
Visionaryは、軽量で“クリック・トゥ・ラン”なブラウザエクスペリエンスを維持しながら、動的ニューラル処理を可能にする。
- 参考スコア(独自算出の注目度): 104.39464309969253
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Neural rendering, particularly 3D Gaussian Splatting (3DGS), has evolved rapidly and become a key component for building world models. However, existing viewer solutions remain fragmented, heavy, or constrained by legacy pipelines, resulting in high deployment friction and limited support for dynamic content and generative models. In this work, we present Visionary, an open, web-native platform for real-time various Gaussian Splatting and meshes rendering. Built on an efficient WebGPU renderer with per-frame ONNX inference, Visionary enables dynamic neural processing while maintaining a lightweight, "click-to-run" browser experience. It introduces a standardized Gaussian Generator contract, which not only supports standard 3DGS rendering but also allows plug-and-play algorithms to generate or update Gaussians each frame. Such inference also enables us to apply feedforward generative post-processing. The platform further offers a plug in three.js library with a concise TypeScript API for seamless integration into existing web applications. Experiments show that, under identical 3DGS assets, Visionary achieves superior rendering efficiency compared to current Web viewers due to GPU-based primitive sorting. It already supports multiple variants, including MLP-based 3DGS, 4DGS, neural avatars, and style transformation or enhancement networks. By unifying inference and rendering directly in the browser, Visionary significantly lowers the barrier to reproduction, comparison, and deployment of 3DGS-family methods, serving as a unified World Model Carrier for both reconstructive and generative paradigms.
- Abstract(参考訳): ニューラルレンダリング、特に3Dガウススプラッティング(3DGS)は急速に進化し、世界モデル構築の鍵となるコンポーネントとなった。
しかし、既存のビューアソリューションは、レガシパイプラインによって断片化されたり、重いり、制約されたままであり、結果としてデプロイメントの摩擦が高く、動的コンテンツや生成モデルのサポートが制限される。
本研究では,リアルタイムなガウススティングとメッシュレンダリングのためのオープンなWebネイティブプラットフォームであるVisionaryを紹介する。
フレーム単位のONNX推論を備えた効率的なWebGPUレンダラー上に構築されたVisionaryは、軽量で“クリック・トゥ・ラン”なブラウザエクスペリエンスを維持しながら、動的ニューラル処理を実現する。
これは標準の3DGSレンダリングをサポートするだけでなく、プラグイン・アンド・プレイのアルゴリズムで各フレームの生成や更新を可能にする。
このような推論により、フィードフォワード生成後処理を適用することもできる。
プラットフォームはさらに、既存のWebアプリケーションにシームレスに統合するための簡潔なTypeScript APIを備えた3.jsライブラリのプラグインを提供する。
実験によると、同じ3DGSアセットの下では、VisionaryはGPUベースのプリミティブソートにより、現在のWebビューアよりも優れたレンダリング効率を実現する。
MLPベースの3DGS、4DGS、ニューラルアバター、スタイル変換や拡張ネットワークなど、すでに複数のバリエーションをサポートしている。
ブラウザで直接推論とレンダリングを統一することにより、Visionaryは3DGSファミリーメソッドの再現、比較、デプロイの障壁を大幅に減らし、再構成と生成の両方のパラダイムのための統一されたワールドモデルキャリアとして機能する。
関連論文リスト
- VolSplat: Rethinking Feed-Forward 3D Gaussian Splatting with Voxel-Aligned Prediction [45.95623374754385]
VolSplatは新しいマルチビューフィードフォワードパラダイムで、ピクセルアライメントとボクセルアライメントのガウスを置き換えている。
これは、画素アライメントがエラーを起こしやすい2D特徴マッチングに依存していることを克服し、堅牢なマルチビュー一貫性を確保する。
RealEstate10KやScanNetなど、広く使用されているベンチマークの実験では、VolSplatが最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2025-09-23T17:59:02Z) - FlexGS: Train Once, Deploy Everywhere with Many-in-One Flexible 3D Gaussian Splatting [57.97160965244424]
3Dガウススプラッティング(3DGS)は、3Dシーン表現や新しいビュー合成に様々な応用を可能にしている。
従来のアプローチでは、重要でないガウス人を刈り取ることに重点を置いており、3DGSを効果的に圧縮している。
本稿では3DGSの弾性推論手法を提案する。
論文 参考訳(メタデータ) (2025-06-04T17:17:57Z) - iVR-GS: Inverse Volume Rendering for Explorable Visualization via Editable 3D Gaussian Splatting [8.689359004580258]
本稿では,ガウススプラッティング(iVR-GS)による逆ボリュームレンダリングを提案する。
iVR-GSは、インタラクティブなボリューム探索のためのシーン編集を可能にしながら、レンダリングコストを削減する。
我々は,他のNVSソリューションと比較して,iVR-GSの再現性や構成性に優れることを示す。
論文 参考訳(メタデータ) (2025-04-24T21:56:53Z) - EVolSplat: Efficient Volume-based Gaussian Splatting for Urban View Synthesis [61.1662426227688]
既存のNeRFおよび3DGSベースの手法は、フォトリアリスティックレンダリングを実現する上で有望な結果を示すが、スローでシーンごとの最適化が必要である。
本稿では,都市景観を対象とした効率的な3次元ガウススプレイティングモデルEVolSplatを紹介する。
論文 参考訳(メタデータ) (2025-03-26T02:47:27Z) - Generative Gaussian Splatting: Generating 3D Scenes with Video Diffusion Priors [11.156009461711639]
GGS(Generative Gaussian Splatting)は、3D表現と事前学習された遅延ビデオ拡散モデルを統合する新しい手法である。
本研究では,シーン合成のための2つの共通ベンチマークデータセットであるRealEstate10KとScanNet+について検討した。
論文 参考訳(メタデータ) (2025-03-17T15:24:04Z) - GaussRender: Learning 3D Occupancy with Gaussian Rendering [86.89653628311565]
GaussRenderは、投影的一貫性を強制することによって3D占有学習を改善するモジュールである。
提案手法は,不整合な2次元プロジェクションを生成する3次元構成をペナライズすることにより,より一貫性のある3次元構造を実現する。
論文 参考訳(メタデータ) (2025-02-07T16:07:51Z) - NovelGS: Consistent Novel-view Denoising via Large Gaussian Reconstruction Model [57.92709692193132]
NovelGSは、スパースビュー画像が与えられたガウススプラッティングの拡散モデルである。
我々は3Dガウスを生成するためにトランスフォーマーネットワークを経由する新しい視点を利用する。
論文 参考訳(メタデータ) (2024-11-25T07:57:17Z) - Gaussian Splatting Decoder for 3D-aware Generative Adversarial Networks [10.207899254360374]
NeRFをベースとしたGAN(Generative Adversarial Networks)は非常に高いレンダリング品質を示す。
Neural Radiance Fieldsによるレンダリングは、3Dアプリケーションに課題をもたらす。
我々は、NeRFベースの3D対応GANの高レンダリング品質と3DGSの柔軟性と計算上の利点を組み合わせた新しいアプローチを提案する。
論文 参考訳(メタデータ) (2024-04-16T14:48:40Z) - Gaussian Shell Maps for Efficient 3D Human Generation [96.25056237689988]
3次元生成敵ネットワーク(GAN)は、生成資産の最先端(SOTA)品質と多様性を実証している。
しかし、現在の3D GANアーキテクチャはレンダリングが遅いボリューム表現に依存しており、GANのトレーニングを妨害し、マルチビュー非一貫性の2Dアップサンプラーを必要とする。
論文 参考訳(メタデータ) (2023-11-29T18:04:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。