論文の概要: Field-Space Attention for Structure-Preserving Earth System Transformers
- arxiv url: http://arxiv.org/abs/2512.20350v1
- Date: Tue, 23 Dec 2025 13:31:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-24 19:17:49.88792
- Title: Field-Space Attention for Structure-Preserving Earth System Transformers
- Title(参考訳): 構造保存型地球系変圧器のフィールド空間アテンション
- Authors: Maximilian Witte, Johannes Meuer, Étienne Plésiat, Christopher Kadow,
- Abstract要約: 本研究では、学習された潜伏空間ではなく、物理領域における注意を演算する地球システムトランスフォーマーのメカニズムであるフィールド空間アテンションを紹介する。
このモデルは固定された非学習型マルチスケール分解を採用し、入力フィールドの構造保存変形を学習する。
これらの結果は、次世代地球システム予測および生成モデルフレームワークのためのコンパクトで、解釈可能で、物理的に接地されたビルディングブロックとして、フィールド空間注意(Field-Space Attention)を位置づけている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurate and physically consistent modeling of Earth system dynamics requires machine-learning architectures that operate directly on continuous geophysical fields and preserve their underlying geometric structure. Here we introduce Field-Space attention, a mechanism for Earth system Transformers that computes attention in the physical domain rather than in a learned latent space. By maintaining all intermediate representations as continuous fields on the sphere, the architecture enables interpretable internal states and facilitates the enforcement of scientific constraints. The model employs a fixed, non-learned multiscale decomposition and learns structure-preserving deformations of the input field, allowing coherent integration of coarse and fine-scale information while avoiding the optimization instabilities characteristic of standard single-scale Vision Transformers. Applied to global temperature super-resolution on a HEALPix grid, Field-Space Transformers converge more rapidly and stably than conventional Vision Transformers and U-Net baselines, while requiring substantially fewer parameters. The explicit preservation of field structure throughout the network allows physical and statistical priors to be embedded directly into the architecture, yielding improved fidelity and reliability in data-driven Earth system modeling. These results position Field-Space Attention as a compact, interpretable, and physically grounded building block for next-generation Earth system prediction and generative modeling frameworks.
- Abstract(参考訳): 地球系の力学の正確な、物理的に一貫したモデリングには、連続した物理場を直接操作し、基礎となる幾何学的構造を保持する機械学習アーキテクチャが必要である。
ここでは、学習された潜在空間ではなく、物理領域における注意を演算する地球システムトランスフォーマーのメカニズムであるフィールド空間アテンションを紹介する。
全ての中間表現を球面上の連続体として維持することにより、アーキテクチャは解釈可能な内部状態を可能にし、科学的制約の実施を促進する。
このモデルは、固定された非学習型マルチスケール分解を採用し、入力フィールドの構造保存変形を学習し、標準の単一スケール視覚変換器の最適化不安定性を回避するとともに、粗い情報と細かな情報のコヒーレントな統合を可能にする。
HEALPixグリッド上の大域的温度超解像に適用すると、フィールド空間変換器は従来のビジョン変換器やU-Netベースラインよりも高速かつ安定に収束する。
ネットワーク全体のフィールド構造の明示的な保存により、物理および統計的な事前情報をアーキテクチャに直接組み込むことができ、データ駆動の地球システムモデリングにおける忠実さと信頼性が向上する。
これらの結果は、次世代地球システム予測および生成モデルフレームワークのためのコンパクトで、解釈可能で、物理的に接地されたビルディングブロックとして、フィールド空間注意(Field-Space Attention)を位置づけている。
関連論文リスト
- Learning Spatial Decay for Vision Transformers [50.63391799053993]
視覚変換器(ViT)はコンピュータビジョンに革命をもたらしたが、その自己認識機構には明らかに空間誘導バイアスがない。
既存のアプローチでは、固定距離メトリクスに基づくデータ非依存の空間減衰が導入されている。
データ依存型空間減衰の2次元視覚変換器への適応が最初に成功した例を示す。
論文 参考訳(メタデータ) (2025-08-13T06:18:32Z) - Graph Transformers for inverse physics: reconstructing flows around arbitrary 2D airfoils [0.0]
メッシュ上の一般的な逆物理エンジンとして機能するグラフトランスフォーマーフレームワークを導入する。
本枠組みは,種々の翼の測地に関する定常RANSシミュレーションのデータセットを用いて評価する。
メッシュベースの逆問題における局所的幾何処理と大域的注意機構の相対的重要性に関する実験と知見を提供する。
論文 参考訳(メタデータ) (2025-01-28T17:06:09Z) - FACTS: A Factored State-Space Framework For World Modelling [24.08175276756845]
本研究では,時空間空間モデリングのための新しいリカレントフレームワークであるtextbfFACTored textbfState-space (textbfFACTS) モデルを提案する。
FACTSフレームワークは、置換可能なメモリ表現を学習するルーティング機構を備えたグラフメモリを構築する。
汎用的な世界モデリング設計にもかかわらず、常に最先端のモデルに勝ったり、マッチする。
論文 参考訳(メタデータ) (2024-10-28T11:04:42Z) - EmerNeRF: Emergent Spatial-Temporal Scene Decomposition via
Self-Supervision [85.17951804790515]
EmerNeRFは動的駆動シーンの時空間表現を学習するためのシンプルだが強力なアプローチである。
シーンの幾何学、外観、動き、セマンティクスを自己ブートストラップで同時にキャプチャする。
本手法はセンサシミュレーションにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2023-11-03T17:59:55Z) - Alignment-free HDR Deghosting with Semantics Consistent Transformer [76.91669741684173]
高ダイナミックレンジイメージングは、複数の低ダイナミックレンジ入力から情報を取得し、リアルな出力を生成することを目的としている。
既存の手法では、前景やカメラの動きによって引き起こされる入力フレーム間の空間的ずれに焦点を当てることが多い。
本研究では,SCTNet(Semantics Consistent Transformer)を用いたアライメントフリーネットワークを提案する。
論文 参考訳(メタデータ) (2023-05-29T15:03:23Z) - Global-to-Local Modeling for Video-based 3D Human Pose and Shape
Estimation [53.04781510348416]
フレーム内精度とフレーム間スムーズさにより,映像に基づく3次元人間のポーズと形状推定を評価する。
エンドツーエンドフレームワークGLoT(Global-to-Local Transformer)における長期的・短期的相関のモデル化を構造的に分離することを提案する。
我々のGLoTは、一般的なベンチマーク(3DPW、MPI-INF-3DHP、Human3.6M)において、最も低いモデルパラメータを持つ従来の最先端の手法を上回る。
論文 参考訳(メタデータ) (2023-03-26T14:57:49Z) - Mitigation of Spatial Nonstationarity with Vision Transformers [1.690637178959708]
深層学習モデル予測性能に対する2種類の測地的空間非定常性の影響を示す。
本稿では,自己注意モデル(ビジョン・トランスフォーマー)を用いて,そのような影響の緩和を提案する。
論文 参考訳(メタデータ) (2022-12-09T02:16:05Z) - A physics-based domain adaptation framework for modelling and
forecasting building energy systems [5.8010446129208155]
最先端の機械学習ベースのモデルは、建物内のエネルギー挙動のモデリングと予測に一般的な選択肢である。
しかし、それらの構造は、物理現象の制御と結びついた物理的・機械的構造を持たない。
我々はラベル付きデータの代わりに、熱伝達常微分方程式によって支配されるLTIの幾何学構造を利用する新しいSDA手法を導入する。
論文 参考訳(メタデータ) (2022-08-19T17:27:39Z) - CSformer: Bridging Convolution and Transformer for Compressive Sensing [65.22377493627687]
本稿では,CNNからの詳細な空間情報を活用するためのハイブリッドフレームワークと,表現学習の強化を目的としたトランスフォーマーが提供するグローバルコンテキストを統合することを提案する。
提案手法は、適応的なサンプリングとリカバリからなるエンドツーエンドの圧縮画像センシング手法である。
実験により, 圧縮センシングにおける専用トランスアーキテクチャの有効性が示された。
論文 参考訳(メタデータ) (2021-12-31T04:37:11Z) - Video Frame Interpolation Transformer [86.20646863821908]
本稿では,トランスフォーマーをベースとした動画フレームワークを提案し,コンテンツ認識集約の重み付けと,自己注意操作による長距離依存を考慮した。
グローバルな自己注意の計算コストが高くなるのを避けるため、ビデオに局所的注意の概念を導入する。
さらに,トランスフォーマーの可能性を完全に実現するためのマルチスケール・フレーム・スキームを開発した。
論文 参考訳(メタデータ) (2021-11-27T05:35:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。