Fugu-MT 論文翻訳(概要): Scaling View Synthesis Transformers

論文の概要: Scaling View Synthesis Transformers

arxiv url: http://arxiv.org/abs/2602.21341v1
Date: Tue, 24 Feb 2026 20:18:55 GMT
ステータス: 翻訳完了
システム内更新日: 2026-02-26 18:19:16.595295
Title: Scaling View Synthesis Transformers
Title（参考訳）: スケーリングビュー合成変換器
Authors: Evan Kim, Hyunwoo Ryu, Thomas W. Mitchel, Vincent Sitzmann,
Abstract要約: 幾何学フリーなビュー合成変換器は、最近、新しいビュー合成(NVS)において最先端の性能を達成した。本稿では,ビュー合成変換器のスケーリング法則を体系的に研究し,計算最適NVSモデルをトレーニングするための設計原則を導出する。
参考スコア（独自算出の注目度）: 14.587384620293784
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Geometry-free view synthesis transformers have recently achieved state-of-the-art performance in Novel View Synthesis (NVS), outperforming traditional approaches that rely on explicit geometry modeling. Yet the factors governing their scaling with compute remain unclear. We present a systematic study of scaling laws for view synthesis transformers and derive design principles for training compute-optimal NVS models. Contrary to prior findings, we show that encoder-decoder architectures can be compute-optimal; we trace earlier negative results to suboptimal architectural choices and comparisons across unequal training compute budgets. Across several compute levels, we demonstrate that our encoder-decoder architecture, which we call the Scalable View Synthesis Model (SVSM), scales as effectively as decoder-only models, achieves a superior performance-compute Pareto frontier, and surpasses the previous state-of-the-art on real-world NVS benchmarks with substantially reduced training compute.
Abstract（参考訳）: 幾何学に依存しないビュー合成変換器は、最近、新しいビュー合成(NVS)において最先端のパフォーマンスを達成し、明示的な幾何モデリングに依存する従来のアプローチよりも優れている。しかし、彼らのスケーリングを計算で支配する要因は依然として不明である。本稿では,ビュー合成変換器のスケーリング法則を体系的に研究し,計算最適NVSモデルをトレーニングするための設計原則を導出する。従来の結果とは対照的に,エンコーダ-デコーダアーキテクチャは計算最適化が可能であり,より初期のネガティブな結果から,不平等なトレーニング計算予算間でのアーキテクチャ選択と比較を行った。いくつかの計算レベルにおいて、当社のエンコーダ-デコーダアーキテクチャは、スケーラブルビュー合成モデル (SVSM) と呼ばれ、デコーダのみのモデルと同様に効果的にスケールし、性能的に優れたParetoフロンティアを実現し、トレーニング計算を大幅に削減した実世界のNVSベンチマークに先立つ最先端を超越していることを示す。

関連論文リスト

Scaling Transformer-Based Novel View Synthesis Models with Token Disentanglement and Synthetic Data [53.040873127309766]
本稿では,トランスアーキテクチャ内でのトークンのアンタングル化プロセスを提案し,特徴分離を向上し,より効果的な学習を実現する。提案手法は,データセット内およびデータセット間の評価において,既存のモデルよりも優れる。
論文参考訳（メタデータ） (2025-09-08T17:58:06Z)
SimpleGVR: A Simple Baseline for Latent-Cascaded Video Super-Resolution [46.311223206965934]
後続の超解像モデルの設計原理について検討し,その設計原理について検討する。まず、ベースモデルの出力特性をよりよく模倣し、VSRモデルと上流ジェネレータとの整合性を確保するための2つのトレーニングペアを生成する方法を提案する。第2に,(1)時間ステップサンプリング戦略,(2)低分解能(LR)入力に対する雑音増強効果の系統的解析を通じて,VSRモデル行動に対する批判的洞察を提供する。
論文参考訳（メタデータ） (2025-06-24T17:57:26Z)
STAR: Synthesis of Tailored Architectures [61.080157488857516]
本稿では, 適合型アーキテクチャ (STAR) の新規な合成手法を提案する。提案手法は線形入力可変系の理論に基づく新しい探索空間を結合し,階層的な数値エンコーディングをアーキテクチャゲノムに支持する。STARゲノムは,複数のモデル品質と効率の指標に最適化するために,勾配のない進化的アルゴリズムで自動的に精製・組換えされる。 STARを用いて、多種多様な計算単位と相互接続パターンを活用し、品質、パラメータサイズ、および自動回帰言語モデリングのための推論キャッシュのフロンティアにおける高度に最適化されたトランスフォーマーとストライプハイブリッドモデルを改善する。
論文参考訳（メタデータ） (2024-11-26T18:42:42Z)
Novel View Synthesis with Pixel-Space Diffusion Models [4.844800099745365]
新規ビュー合成(NVS)に遺伝子モデルがますます採用されている画素空間における終端NVSに対して,現代的な拡散モデルアーキテクチャを適用した。単視点データセットを利用した新しいNVSトレーニングスキームを導入し,その相対的多元性に着目した。
論文参考訳（メタデータ） (2024-11-12T12:58:33Z)
Learning to Compare Hardware Designs for High-Level Synthesis [44.408523725466374]
高レベル合成(HLS)は、高レベルコードをハードウェア設計に変換する自動設計プロセスである。 HLSは、ソースコードに挿入されたディレクティブであるプラグマに依存して合成プロセスを導く。ハードウェア設計を比較して効率的なHLS最適化を行う新しい手法であるComparXploreを提案する。
論文参考訳（メタデータ） (2024-09-20T00:47:29Z)
Mechanistic Design and Scaling of Hybrid Architectures [114.3129802943915]
我々は、様々な計算プリミティブから構築された新しいハイブリッドアーキテクチャを特定し、テストする。本研究では,大規模計算最適法則と新しい状態最適スケーリング法則解析を用いて,結果のアーキテクチャを実験的に検証する。我々は,MAD合成法と計算-最適パープレキシティを相関させ,新しいアーキテクチャの正確な評価を可能にする。
論文参考訳（メタデータ） (2024-03-26T16:33:12Z)
Uncovering mesa-optimization algorithms in Transformers [61.06055590704677]
いくつかの自己回帰モデルは、入力シーケンスが処理されたときに学習でき、パラメータの変更を受けずに、それを行うように明示的に訓練されていない。我々は,新しい入力が明らかになったときにモデルを調整するための補助学習アルゴリズムが,標準の次トーケン予測誤差最小化によって生まれることを示す。本研究は、自己回帰損失最小化の産物としてコンテキスト内学習を説明し、新しい最適化ベースのトランスフォーマー層の設計を通知する。
論文参考訳（メタデータ） (2023-09-11T22:42:50Z)
Joint Hierarchical Priors and Adaptive Spatial Resolution for Efficient Neural Image Compression [11.25130799452367]
ニューラル画像圧縮(NIC)のための絶対画像圧縮変換器(ICT)を提案する。 ICTは、潜在表現からグローバルコンテキストとローカルコンテキストの両方をキャプチャし、量子化された潜在表現の分布をパラメータ化する。我々のフレームワークは、多目的ビデオ符号化(VVC)参照符号化(VTM-18.0)とニューラルスウィンT-ChARMに対する符号化効率とデコーダ複雑性のトレードオフを大幅に改善する。
論文参考訳（メタデータ） (2023-07-05T13:17:14Z)
Towards Theoretically Inspired Neural Initialization Optimization [66.04735385415427]
我々は,ニューラルネットワークの初期状態を評価するための理論的知見を備えた,GradCosineという微分可能な量を提案する。標準制約下でGradCosineを最大化することにより、ネットワークのトレーニングとテストの両方の性能を向上させることができることを示す。サンプル分析から実際のバッチ設定に一般化されたNIOは、無視可能なコストで、より優れた初期化を自動で探すことができる。
論文参考訳（メタデータ） (2022-10-12T06:49:16Z)
Effective Invertible Arbitrary Image Rescaling [77.46732646918936]
Invertible Neural Networks (INN)は、ダウンスケーリングとアップスケーリングのサイクルを共同で最適化することにより、アップスケーリングの精度を大幅に向上させることができる。本研究の1つのモデルのみをトレーニングすることにより、任意の画像再スケーリングを実現するために、単純で効果的な非可逆的再スケーリングネットワーク(IARN)を提案する。 LR出力の知覚品質を損なうことなく、双方向任意再スケーリングにおいて最先端(SOTA)性能を実現する。
論文参考訳（メタデータ） (2022-09-26T22:22:30Z)
A Graph Deep Learning Framework for High-Level Synthesis Design Space Exploration [11.154086943903696]
High-Level Synthesisは、アプリケーション固有の高速プロトタイピングのためのソリューションである。本稿では,加速性能とハードウェアコストを共同で予測するグラフニューラルネットワークHLSを提案する。提案手法は,一般的なシミュレータと同等の精度で予測できることを示す。
論文参考訳（メタデータ） (2021-11-29T18:17:45Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。