論文の概要: Derived Fields Preserve Fine-Scale Detail in Budgeted Neural Simulators
- arxiv url: http://arxiv.org/abs/2603.29224v1
- Date: Tue, 31 Mar 2026 03:43:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-01 15:25:03.088772
- Title: Derived Fields Preserve Fine-Scale Detail in Budgeted Neural Simulators
- Title(参考訳): 予算型ニューラルネットワークシミュレータにおける微細な詳細を保存した導電界
- Authors: Wenshuo Wang, Fan Zhang,
- Abstract要約: 厳格なストレージ予算の下では, 搬送状態設計が主要なボトルネックとなることがよく示される。
我々は、どの物理フィールドが運ばれるか、どのようにストレージ予算が割り当てられるかを選択する一般的な状態設計フレームワークを定式化する。
以上の結果から, 輸送状態設計はアーキテクチャ, 損失, ロールアウト戦略とともに, 第一級の設計軸として扱われるべきであることが示唆された。
- 参考スコア(独自算出の注目度): 5.24655241578805
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Fine-scale-faithful neural simulation under fixed storage budgets remains challenging. Many existing methods reduce high-frequency error by improving architectures, training objectives, or rollout strategies. However, under budgeted coarsen-quantize-decode pipelines, fine detail can already be lost when the carried state is constructed. In the canonical periodic incompressible Navier-Stokes setting, we show that primitive and derived fields undergo systematically different retained-band distortions under the same operator. Motivated by this observation, we formulate Derived-Field Optimization (DerivOpt), a general state-design framework that chooses which physical fields are carried and how storage budget is allocated across them under a calibrated channel model. Across the full time-dependent forward subset of PDEBench, DerivOpt not only improves pooled mean rollout nRMSE, but also delivers a decisive advantage in fine-scale fidelity over a broad set of strong baselines. More importantly, the gains are already visible at input time, before rollout learning begins. This indicates that the carried state is often the dominant bottleneck under tight storage budgets. These results suggest a broader conclusion: in budgeted neural simulation, carried-state design should be treated as a first-class design axis alongside architecture, loss, and rollout strategy.
- Abstract(参考訳): 固定ストレージ予算下でのファインスケールフルなニューラルシミュレーションは依然として困難である。
既存の多くの手法は、アーキテクチャの改善、目標の訓練、ロールアウト戦略によって高周波エラーを減らす。
しかし、予算化された粗粒度デコードパイプラインでは、搬送された状態が構築されると、詳細な詳細が失われる。
正準周期的非圧縮性ナビエ・ストークス・セッティングにおいて、原始体と導出体が、同じ作用素の下で体系的に異なる残留バンド歪みを受けることを示す。
この観測で動機付けられたDerived-Field Optimization (DerivOpt, DerivOpt) を定式化した。
PDEBenchの完全な時間依存のフォワードサブセットであるDerivOptは、プールされた平均ロールアウト nRMSE を改善するだけでなく、広範囲の強いベースラインに対して、スケールの忠実さにおいて決定的な優位性をもたらす。
さらに重要なのは、ロールアウト学習が始まる前に、すでにゲインは入力時に表示されます。
これは、輸送された状態が、しばしば厳格なストレージ予算の下で支配的なボトルネックであることを示している。
これらの結果は、より広範な結論を示唆している: 予算付きニューラルネットワークでは、輸送状態の設計はアーキテクチャ、損失、ロールアウト戦略とともに第一級の設計軸として扱われるべきである。
関連論文リスト
- Adaptive Domain Models: Bayesian Evolution, Warm Rotation, and Principled Training for Geometric and Neuromorphic AI [0.0]
本稿では,3つの事前結果に基づいて,代替的なトレーニングアーキテクチャを開発する。
本稿では,一般目的モデルの潜在事前構造をADMトレーニングシステムを介して抽出する機構であるベイズ蒸留を導入する。
デプロイには、更新されたモデルがサービスを中断することなくアクティブな推論経路に遷移する運用パターンであるウォームローテーションを導入する。
論文 参考訳(メタデータ) (2026-03-18T12:36:19Z) - StepVAR: Structure-Texture Guided Pruning for Visual Autoregressive Models [98.72926158261937]
本稿では,Visual AutoRegressive モデルのためのトレーニングフリートークン解析フレームワークを提案する。
我々は局所的なテクスチャの詳細を捉えるために軽量なハイパスフィルタを使用し、グローバルな構造情報を保存するために主成分分析(PCA)を活用している。
スパーストークンの下で有効な次世代の予測を維持するために,近接した特徴伝達戦略を導入する。
論文 参考訳(メタデータ) (2026-03-02T11:35:05Z) - Bridging Training and Merging Through Momentum-Aware Optimization [8.035521056416242]
大規模ニューラルネットワークとタスク固有の計算モデルのトレーニングには、パラメータの重要度推定が必要である。
トレーニング中に現在の計算曲率情報を処理し、それを破棄し、類似した情報をマージするために再計算する。
トレーニング中に運動量と曲率の統計を分解し、類似した情報をマージするために再計算する統合フレームワークを導入する。
論文 参考訳(メタデータ) (2025-12-18T22:37:33Z) - The Curious Case of In-Training Compression of State Space Models [49.819321766705514]
ステートスペースモデル(SSM)は、並列化可能なトレーニングと高速推論の両方を提供する。
鍵となる設計上の課題は、表現力の最大化と計算負荷の制限の間の適切なバランスを打つことだ。
我々のアプローチである textscCompreSSM はリニアリカレントユニットのような線形時間不変SSMに適用されるが、選択モデルにも拡張可能である。
論文 参考訳(メタデータ) (2025-10-03T09:02:33Z) - Deep Hierarchical Learning with Nested Subspace Networks [53.71337604556311]
大規模ニューラルネットワークのためのNested Subspace Networks (NSN)を提案する。
NSNは、単一のモデルを連続した計算予算の範囲で動的かつきめ細かな調整を可能にする。
我々は,NSNを訓練済みのLLMに外科的に適用し,スムーズで予測可能な計算性能フロンティアを解き放つことができることを示した。
論文 参考訳(メタデータ) (2025-09-22T15:13:14Z) - READER: Retrieval-Assisted Drafter for Efficient LLM Inference [0.0386965802948046]
自己回帰言語モデルはトークンシーケンスよりも分解された確率をインスタンス化するが、その厳密なシーケンシャルなデコーディングプロセスは、遅延推論に固有の低いバウンドを課す。
このボトルネックは、大規模生成モデルのスケーラブルなデプロイにおける中心的な障害として現れています。
本稿では,補助的ドラフトモデルのトレーニングを回避した投機的復号化フレームワークREADERを提案する。
論文 参考訳(メタデータ) (2025-08-12T16:47:48Z) - Towards Continual Learning Desiderata via HSIC-Bottleneck
Orthogonalization and Equiangular Embedding [55.107555305760954]
本稿では,レイヤワイドパラメータのオーバーライトや決定境界の歪みに起因する,概念的にシンプルで効果的な手法を提案する。
提案手法は,ゼロの指数バッファと1.02倍の差が絶対的に優れていても,競争精度が向上する。
論文 参考訳(メタデータ) (2024-01-17T09:01:29Z) - Deep Equilibrium Optical Flow Estimation [80.80992684796566]
最近のSOTA(State-of-the-art)光フローモデルでは、従来のアルゴリズムをエミュレートするために有限ステップの更新操作を使用する。
これらのRNNは大きな計算とメモリオーバーヘッドを課し、そのような安定した推定をモデル化するために直接訓練されていない。
暗黙的層の無限レベル固定点として直接流れを解く手法として,Deep equilibrium Flow estimatorを提案する。
論文 参考訳(メタデータ) (2022-04-18T17:53:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。