論文の概要: Learning to Solve Generative ODEs Beyond the Linear Span
- arxiv url: http://arxiv.org/abs/2606.08672v1
- Date: Sun, 07 Jun 2026 15:22:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:06.379546
- Title: Learning to Solve Generative ODEs Beyond the Linear Span
- Title(参考訳): 線形スパンを超えて生成するODEを解くことを学ぶ
- Authors: Sihyeon Kim, Seunghun Lee, Vikas Singh, Hyunwoo J. Kim,
- Abstract要約: 空間残留演算子を用いてスカラー係数更新を増強する軽量ニューラルソルバであるSpanLiftを提案する。
SpanLiftは、ピクセル空間の拡散、潜水流のマッチング、降水は今、最先端の数ステップのサンプリングを実現している。
- 参考スコア(独自算出の注目度): 50.13853710831612
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diffusion and flow generative models sample by integrating a learned ODE, but high quality still requires many sequential model evaluations. Solver learning reduces this cost by adapting scalar coefficients, timesteps, or both, while keeping the backbone model fixed. In this work, we identify a structural bottleneck in this update family: each step remains span-limited. Since the scalar-coefficient update lies in the span of buffered velocity evaluations, it can fit only the in-span component while leaving any out-of-span residual unreachable by scalar recombination alone. We propose SpanLift, a lightweight neural solver that augments scalar-coefficient updates with a spatial residual operator. SpanLift keeps a fixed base solver as an in-span prior and learns a spatial residual operator over the state and velocity buffer. The operator is trained by endpoint teacher matching, preserves the pretrained backbone, and adds no model NFEs. Empirically, the learned correction transfers across base solvers and is predominantly out-of-span. Across pixel-space diffusion, latent flow matching, and precipitation nowcasting, SpanLift achieves state-of-the-art few-step sampling. With only 3 NFE, it improves CIFAR-10 FID from 8.16 to 5.69 and ImageNet FID from 17.37 to 11.83.
- Abstract(参考訳): 学習したODEを統合することで、拡散およびフロー生成モデルがサンプリングされるが、高品質なモデル評価には、多くのシーケンシャルなモデル評価が必要である。
ソルバー学習は、バックボーンモデルを固定しながらスカラー係数、タイムステップ、あるいはその両方を適用することで、このコストを削減する。
この作業では、この更新ファミリにおける構造的ボトルネックを特定します。
スカラー係数の更新は緩衝速度評価の範囲内にあるため、スカラー再結合だけでは到達不能な残差を残しながら、スカラー成分のみを適合させることができる。
空間残留演算子を用いてスカラー係数更新を増強する軽量ニューラルソルバであるSpanLiftを提案する。
SpanLiftは固定ベースソルバをインスパンとして保持し、状態と速度バッファ上で空間残留演算子を学習する。
オペレータはエンドポイントの教師マッチングによってトレーニングされ、事前訓練されたバックボーンを保持し、モデルNFEを追加しない。
経験的に、学習された補正はベースソルバ間で伝達され、主にアウトオブスパンである。
SpanLiftは、ピクセル空間の拡散、潜水流のマッチング、降水は今、最先端の数ステップのサンプリングを実現している。
CIFAR-10 FIDを8.16から5.69に改善し、ImageNet FIDを17.37から11.83に改善した。
関連論文リスト
- Closed-Form Linear-Probe Dataset Distillation for Pre-trained Vision Models [37.194177406897964]
サンプル空間カーネルリッジソルバを用いて合成集合によって誘導される線形プローブを計算する閉形式定式化を提案する。
事前訓練された4つのバックボーンを持つImageNet-100では、CLP-DDはDSAなしでLGMよりも大幅に改善され、計算コストのごく一部でDSAでLGMにアプローチする。
ImageNet-1Kでは、CLP-DDが4つのバックボーンのうち3つでLGMとDSAをマッチまたはオーバーし、約14時間で動作し、GPUメモリの8分の1以下を使用する。
論文 参考訳(メタデータ) (2026-05-08T03:41:51Z) - SLE-FNO: Single-Layer Extensions for Task-Agnostic Continual Learning in Fourier Neural Operators [0.4369550829556577]
新たな実験条件やシミュレーション体制は、以前のデータに再アクセスすることなく、外挿やモデル更新を必要とするため、大きく異なる場合がある。
これにより、破滅的な忘れを防ぎながら、分散シフトに適応できる継続的学習(CL)フレームワークの必要性が生まれます。
本稿では,SLE(Single-Layer Extension)とFNO(Fourier Neural Operator)を組み合わせたアーキテクチャベースアプローチ(SLE-FNO)を提案する。
論文 参考訳(メタデータ) (2026-03-20T18:30:38Z) - SCORE: Replacing Layer Stacking with Contractive Recurrent Depth [0.0]
残余接続は、現代のディープニューラルネットワークの中心である。
本稿では,従来の層積み重ねに代わる離散的再帰型 SCORE (Skip-Connection ODE Recurrent Embedding) を提案する。
論文 参考訳(メタデータ) (2026-03-11T08:49:03Z) - Network-Optimised Spiking Neural Network for Event-Driven Networking [2.5941336499463383]
スパイキングニューラルネットワークは、異常検出、ローカルルーティング制御、エッジでの混雑管理など、時間クリティカルなネットワークタスクに適したイベント駆動型計算を提供する。
本稿では,正規化された待ち行列の占有状態と回復資源を符号化したコンパクトな2変数ユニットであるNetwork-Optimized Spiking (NOS)を紹介する。
我々は、データ駆動初期化、リセットシャープネスに基づくホモトピーによる代理段階トレーニング、リソース制約されたデプロイメントのための境界のトポロジによる明確な安定性チェックのガイダンスを提供する。
論文 参考訳(メタデータ) (2025-09-27T22:31:24Z) - VoxelOpt: Voxel-Adaptive Message Passing for Discrete Optimization in Deformable Abdominal CT Registration [15.78340001680369]
離散最適化に基づく変形可能な画像登録フレームワークであるVoxelOptを提案する。
学習ベースの長所と反復的手法を組み合わせて、登録精度と実行時のバランスを改善する。
腹部CTの登録では、これらの変更により、VoxelOptは、ラベルの監督によって訓練された最先端の学習ベースの手法と一致しながら、効率と正確性の両方において、リード反復性を上回っている。
論文 参考訳(メタデータ) (2025-06-24T19:44:04Z) - A Stable Whitening Optimizer for Efficient Neural Network Training [99.7641280234926]
アルゴリズムのシャンプー系をベースとして,3つの重要な問題を同定・緩和し,SPlus法を提案する。
まず,行列逆が長期にわたってキャッシュされる場合,素早いシャンプーは分岐しがちであることがわかった。
第二に、ネットワーク幅をまたいで学習率の伝達を可能にするために、形状認識スケーリングを適用する。
第3に,高い学習率によってパラメータノイズが大きくなり,より高速な学習をブロックする簡単な反復学習方式を提案する。
論文 参考訳(メタデータ) (2025-06-08T18:43:31Z) - Winner-Take-All Column Row Sampling for Memory Efficient Adaptation of Language Model [89.8764435351222]
分散を低減した行列生成のために, WTA-CRS と呼ばれる新しい非バイアス推定系を提案する。
我々の研究は、チューニング変換器の文脈において、提案した推定器が既存のものよりも低い分散を示すという理論的および実験的証拠を提供する。
論文 参考訳(メタデータ) (2023-05-24T15:52:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。