論文の概要: UniSHARP: Universal Sharp Monocular View Synthesis
- arxiv url: http://arxiv.org/abs/2606.07514v1
- Date: Fri, 05 Jun 2026 17:59:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-08 14:33:29.889802
- Title: UniSHARP: Universal Sharp Monocular View Synthesis
- Title(参考訳): UniSHARP:Universal Sharp Monocular View Synthesis
- Authors: Meixi Song, Dizhe Zhang, Hao Ren, Ruiyang Zhang, Bo Du, Ming-Hsuan Yang, Lu Qi,
- Abstract要約: 我々は、カメラシステムの連続体にまたがる一眼レフレンダリングのための一般的なビュー合成手法であるSHARPの拡張に焦点をあてる。
SHARPのピンホール固有の仮定を克服するために、我々は様々な画像を全方位潜在空間に整列させることが重要である。
特徴空間とガウス空間の両方において暗黙的なアライメントを行うUniSHARPを提案する。
- 参考スコア(独自算出の注目度): 69.33495127820123
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this work, we focus on extending SHARP, the popular photorealistic view synthesis method, for universal monocular rendering across a continuum of camera systems, from conventional perspective cameras to wide-field-of-view, fisheye and omnidirectional panoramic settings. To overcome the pinhole-specific assumptions of SHARP, our key idea is to align various images in a unified omnidirectional latent space. Thus, we propose UniSHARP, which performs implicit alignment in both feature and Gaussian spaces. Specifically, Gaussian primitives are arranged along rays and radial distances in a ray-based universal representation, while 2D semantic and 3D spatial features extracted from UniK3D-inspired encoders are jointly decoded to generate the complete Gaussian cloud. To comprehensively evaluate our method, we construct a benchmark covering diverse imaging systems across various scenes. The benchmark is further stratified by field of view (FoV) to enable fine-grained assessment of the universal monocular rendering task. Extensive experiments on the proposed benchmark demonstrate the effectiveness of UniSHARP, outperforming alternative methods by a large margin. The project page can be found at: https://insta360-research-team.github.io/Unisharp-website/
- Abstract(参考訳): 本研究では,従来の視点カメラからワイドフィールド・オブ・ビュー,魚眼,全方位パノラマ設定まで,カメラシステムの連続体を一眼レフで一眼レフレンダリングするための,人気のフォトリアリスティックビュー合成手法であるSHARPの拡張に焦点をあてる。
SHARPのピンホール固有の仮定を克服するために、我々は様々な画像を全方位潜在空間に整列させることが重要である。
そこで我々は,特徴空間とガウス空間の両方において暗黙的なアライメントを行うUniSHARPを提案する。
特に、ガウス原始体は、線に基づく普遍表現において、光線と放射距離に沿って配置され、2次元意味的および3次元空間的特徴は、UniK3Dにインスパイアされたエンコーダから抽出され、完全にガウス雲を生成するために共同でデコードされる。
本手法を網羅的に評価するために,様々なシーンにまたがる多様な画像システムをカバーするベンチマークを構築した。
ベンチマークは視野(FoV)によってさらに階層化され、普遍的な単分子描画タスクのきめ細かい評価を可能にする。
提案したベンチマークの大規模な実験では、UniSHARPの有効性が示され、大きなマージンで代替手法よりも優れていた。
プロジェクトページは、https://insta360-research-team.github.io/Unisharp-website/で見ることができる。
関連論文リスト
- Spherical-GOF: Geometry-Aware Panoramic Gaussian Opacity Fields for 3D Scene Reconstruction [17.20174890101058]
Spherical-GOF(Spherical-GOF)は、ガウスのOpacity Fields(GOF)上に構築された一方向レンダリングフレームワークである。
GOFは球面上の単位球面に直接GOF線サンプリングを行い、パノラマ描画のための一貫した光-ガウス相互作用を可能にする。
標準的なパノラマベンチマークの実験は、競争力のある測光品質を示し、一貫性を大幅に改善した。
論文 参考訳(メタデータ) (2026-03-09T15:35:56Z) - WorldMirror: Universal 3D World Reconstruction with Any-Prior Prompting [51.69408870574092]
汎用的な3次元幾何予測タスクのためのオールインワンフィードフォワードモデルであるWorldMirrorを提案する。
我々のフレームワークは、カメラのポーズ、内在性、深度マップなど、様々な幾何学的先入観を柔軟に統合する。
WorldMirrorは、カメラ、ポイントマップ、深さ、表面正規推定から新しいビュー合成に至るまで、さまざまなベンチマークで最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2025-10-12T17:59:09Z) - PFDepth: Heterogeneous Pinhole-Fisheye Joint Depth Estimation via Distortion-aware Gaussian-Splatted Volumetric Fusion [61.6340987158734]
ヘテロジニアス多視点深度推定のための最初のピンホール・フィッシュアイ・フレームワークPFDepthを提案する。
PFDepthは、ピンホールと魚眼カメラの任意の組み合わせを、様々な内在と外生とで処理できる統一アーキテクチャを採用している。
我々は,現在の主流深度ネットワーク上でのKITTI-360およびRealHetデータセットに対して,PFDepthが最先端の性能を示すことを示す。
論文 参考訳(メタデータ) (2025-09-30T09:38:59Z) - MSI-NeRF: Linking Omni-Depth with View Synthesis through Multi-Sphere Image aided Generalizable Neural Radiance Field [1.3162012586770577]
深層学習全方位深度推定と新しいビュー合成を組み合わせたMSI-NeRFを提案する。
入力画像の特徴抽出とワープにより,コストボリュームとして多面体画像を構築する。
ネットワークには,4つの画像のみを用いて未知のシーンを効率的に再構築する一般化機能がある。
論文 参考訳(メタデータ) (2024-03-16T07:26:50Z) - MuRF: Multi-Baseline Radiance Fields [117.55811938988256]
スパースビュー合成におけるフィードフォワードアプローチであるmulti-Baseline Radiance Fields(MuRF)を提案する。
MuRFは、複数の異なるベースライン設定で最先端のパフォーマンスを達成する。
また、Mip-NeRF 360データセット上でゼロショットの一般化能力を示す。
論文 参考訳(メタデータ) (2023-12-07T18:59:56Z) - Unsupervised OmniMVS: Efficient Omnidirectional Depth Inference via
Establishing Pseudo-Stereo Supervision [40.58193195996798]
魚眼画像に基づく一方向一方向MVSフレームワークを提案する。
2つの360deg画像は特別なポーズでステレオ対を定式化し、光度一貫性を利用して教師なし制約を確立する。
実験の結果、教師なしのソリューションのパフォーマンスは、最先端の教師付き手法と競合することがわかった。
論文 参考訳(メタデータ) (2023-02-20T11:35:55Z) - SurroundDepth: Entangling Surrounding Views for Self-Supervised
Multi-Camera Depth Estimation [101.55622133406446]
本研究では,複数の周囲からの情報を組み込んだSurroundDepth法を提案し,カメラ間の深度マップの予測を行う。
具体的には、周囲のすべてのビューを処理し、複数のビューから情報を効果的に融合するクロスビュー変換器を提案する。
実験において,本手法は,挑戦的なマルチカメラ深度推定データセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2022-04-07T17:58:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。