論文の概要: Sphinx: Efficiently Serving Novel View Synthesis using Regression-Guided Selective Refinement
- arxiv url: http://arxiv.org/abs/2511.18672v1
- Date: Mon, 24 Nov 2025 01:09:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-25 18:34:24.962513
- Title: Sphinx: Efficiently Serving Novel View Synthesis using Regression-Guided Selective Refinement
- Title(参考訳): Sphinx: 回帰誘導選択リファインメントを用いた新規ビュー合成の効率化
- Authors: Yuchen Xia, Souvik Kundu, Mosharaf Chowdhury, Nishil Talati,
- Abstract要約: スフィンクス(Sphinx)は、拡散レベルの忠実度を計算量的に大幅に低い値で達成する、訓練不要なハイブリッド推論フレームワークである。
スフィンクスは拡散モデル推論よりも平均1.8倍のスピードアップを達成するが、知覚的劣化は5%未満である。
- 参考スコア(独自算出の注目度): 9.67064002183396
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Novel View Synthesis (NVS) is the task of generating new images of a scene from viewpoints that were not part of the original input. Diffusion-based NVS can generate high-quality, temporally consistent images, however, remains computationally prohibitive. Conversely, regression-based NVS offers suboptimal generation quality despite requiring significantly lower compute; leaving the design objective of a high-quality, inference-efficient NVS framework an open challenge. To close this critical gap, we present Sphinx, a training-free hybrid inference framework that achieves diffusion-level fidelity at a significantly lower compute. Sphinx proposes to use regression-based fast initialization to guide and reduce the denoising workload for the diffusion model. Additionally, it integrates selective refinement with adaptive noise scheduling, allowing more compute to uncertain regions and frames. This enables Sphinx to provide flexible navigation of the performance-quality trade-off, allowing adaptation to latency and fidelity requirements for dynamically changing inference scenarios. Our evaluation shows that Sphinx achieves an average 1.8x speedup over diffusion model inference with negligible perceptual degradation of less than 5%, establishing a new Pareto frontier between quality and latency in NVS serving.
- Abstract(参考訳): 新規ビュー合成(NVS)は、元の入力の一部ではない視点からシーンの新しい画像を生成するタスクである。
拡散に基づくNVSは、高画質で時間的に一貫した画像を生成することができるが、計算的に禁じられている。
逆に回帰ベースのNVSは、計算量が大幅に少ないにもかかわらず、最適でない生成品質を提供し、高品質で推論効率のよいNVSフレームワークの設計目標をオープンな課題に残している。
この致命的なギャップを埋めるために、我々は、非常に低い計算で拡散レベル忠実性を達成する訓練不要なハイブリッド推論フレームワークSphinxを提示する。
Sphinx氏は、回帰ベースの高速初期化を使って拡散モデルにおける遅延ワークロードをガイドし、削減することを提案している。
さらに、選択的な改善と適応的なノイズスケジューリングを統合し、不確実な領域やフレームにより多くの計算を可能にする。
これによりSphinxは、パフォーマンス品質のトレードオフの柔軟なナビゲーションを提供し、動的に変化する推論シナリオに対するレイテンシと忠実度要件への適応を可能にする。
以上の結果から,スフィンクスは拡散モデル推論よりも平均1.8倍の速度アップを達成でき,知覚的劣化は5%未満であり,NVSサービスにおける品質とレイテンシーの間に新たなパレートフロンティアを確立した。
関連論文リスト
- BADiff: Bandwidth Adaptive Diffusion Model [55.10134744772338]
従来の拡散モデルは、下流の伝送制限によらず、一定数のデノナイジングステップを実行することで、高忠実度画像を生成する。
実際のクラウド・ツー・デバイス・シナリオでは、帯域幅の制限はしばしば重い圧縮を必要とし、微妙なテクスチャや無駄な計算が失われる。
使用可能な帯域幅から導かれる目標品質レベルに拡散モデルを条件付けする,共同エンドツーエンドのトレーニング戦略を導入する。
論文 参考訳(メタデータ) (2025-10-24T11:50:03Z) - EC-Diff: Fast and High-Quality Edge-Cloud Collaborative Inference for Diffusion Models [57.059991285047296]
高速な推論と高品質な生成を実現するために,ハイブリッドエッジクラウドコラボレーションフレームワークが最近提案されている。
過度の雲が推論時間を延ばす一方、不十分なステップは意味的な曖昧さを引き起こし、エッジモデルの出力の不整合を引き起こす。
勾配に基づく雑音推定により雲の推測を高速化するEC-Diffを提案する。
提案手法は, エッジ推定に比べて生成品質を著しく向上する一方で, クラウド推定に比べて平均2倍の速度アップを達成できる。
論文 参考訳(メタデータ) (2025-07-16T07:23:14Z) - Spatial Annealing for Efficient Few-shot Neural Rendering [73.49548565633123]
我々はtextbfSpatial textbf Annealing regularized textbfNeRF (textbfSANeRF) という,正確で効率的な数発のニューラルレンダリング手法を導入する。
単に1行のコードを追加することで、SANeRFは、現在の数ショットのニューラルレンダリング方法と比較して、より優れたレンダリング品質とはるかに高速な再構築速度を提供する。
論文 参考訳(メタデータ) (2024-06-12T02:48:52Z) - SGCNeRF: Few-Shot Neural Rendering via Sparse Geometric Consistency Guidance [136.15885067858298]
本研究では、空間的に一貫した幾何フィルタリング機構と周波数誘導幾何正規化戦略により強化された特徴マッチングに基づくスパース幾何正規化モジュールを提案する。
実験により, SGCNeRFは, LLFFおよびDTUにおけるPSNRの0.7dBの改善により, 優れた幾何整合性を実現し, かつFreeNeRFを超えていることが示された。
論文 参考訳(メタデータ) (2024-04-01T08:37:57Z) - FRDiff : Feature Reuse for Universal Training-free Acceleration of Diffusion Models [16.940023904740585]
拡散モデルに固有の時間的冗長性を活用する高度な加速手法を提案する。
時間的類似度の高い特徴マップの再利用は、出力品質を損なうことなく計算資源を節約する新たな機会を開く。
論文 参考訳(メタデータ) (2023-12-06T14:24:26Z) - VQ-NeRF: Vector Quantization Enhances Implicit Neural Representations [25.88881764546414]
VQ-NeRFは、ベクトル量子化による暗黙の神経表現を強化するための効率的なパイプラインである。
圧縮および原スケールの両スケールでNeRFモデルを同時に最適化する,革新的なマルチスケールNeRFサンプリング方式を提案する。
我々は3次元再構成の幾何学的忠実度とセマンティックコヒーレンスを改善するためにセマンティックロス関数を組み込んだ。
論文 参考訳(メタデータ) (2023-10-23T01:41:38Z) - Conditional Denoising Diffusion for Sequential Recommendation [62.127862728308045]
GAN(Generative Adversarial Networks)とVAE(VAE)の2つの顕著な生成モデル
GANは不安定な最適化に苦しむ一方、VAEは後続の崩壊と過度に平らな世代である。
本稿では,シーケンスエンコーダ,クロスアテンティブデノナイジングデコーダ,ステップワイズディフューザを含む条件付きデノナイジング拡散モデルを提案する。
論文 参考訳(メタデータ) (2023-04-22T15:32:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。