Fugu-MT 論文翻訳(概要): A Multimodal Vision Transformer-based Modeling Framework for Prediction of Fluid Flows in Energy Systems

論文の概要: A Multimodal Vision Transformer-based Modeling Framework for Prediction of Fluid Flows in Energy Systems

arxiv url: http://arxiv.org/abs/2604.02483v1
Date: Thu, 02 Apr 2026 19:34:38 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-06 17:20:24.1862
Title: A Multimodal Vision Transformer-based Modeling Framework for Prediction of Fluid Flows in Energy Systems
Title（参考訳）: エネルギーシステムにおける流体予測のためのマルチモーダル視覚変換器に基づくモデリングフレームワーク
Authors: Kiran Yalamanchi, Shivam Barwey, Ibrahim Jarrah, Pinaki Pal,
Abstract要約: 本稿では,流動予測のための変圧器を用いたモデリングフレームワークを提案する。機関の往復に関係した高圧ガス噴射現象を実演する。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Computational fluid dynamics (CFD) simulations of complex fluid flows in energy systems are prohibitively expensive due to strong nonlinearities and multiscale-multiphysics interactions. In this work, we present a transformer-based modeling framework for prediction of fluid flows, and demonstrate it for high-pressure gas injection phenomena relevant to reciprocating engines. The approach employs a hierarchical Vision Transformer (SwinV2-UNet) architecture that processes multimodal flow datasets from multi-fidelity simulations. The model architecture is conditioned on auxiliary tokens explicitly encoding the data modality and time increment. Model performance is assessed on two different tasks: (1) spatiotemporal rollouts, where the model autoregressively predicts the flow state at future times; and (2) feature transformation, where the model infers unobserved fields/views from observed fields/views. We train separate models on multimodal datasets generated from in-house CFD simulations of argon jet injection into a nitrogen environment, encompassing multiple grid resolutions, turbulence models, and equations of state. The resulting data-driven models learn to generalize across resolutions and modalities, accurately forecasting the flow evolution and reconstructing missing flow-field information from limited views. This work demonstrates how large vision transformer-based models can be adapted to advance predictive modeling of complex fluid flow systems.
Abstract（参考訳）: エネルギー系における複雑な流体流れの計算流体力学(CFD)シミュレーションは、強い非線形性とマルチスケール・マルチ物理相互作用のため、極めて高価である。本研究では, 流動予測のための変圧器を用いたモデリングフレームワークを提案し, 逆流エンジンに関連する高圧ガス噴射現象について実証する。このアプローチではマルチモードフローデータセットを処理する階層型ビジョントランスフォーマー(SwinV2-UNet)アーキテクチャを採用している。モデルアーキテクチャは、データモダリティと時間インクリメントを明示的に符号化する補助トークンに条件付けされている。モデルの性能は,(1)時空間のロールアウト,(2)時空間のモデルが将来の流れ状態を自動回帰予測する,2)時空間のフィールドやビューを観測対象のフィールドやビューから推定する,という2つの異なるタスクで評価される。我々は、窒素環境へのアルゴンジェット噴射のCFDシミュレーションから生成されたマルチモーダルデータセット上で、複数の格子分解能、乱流モデル、状態方程式を含む、別々のモデルを訓練する。得られたデータ駆動モデルは、解像度とモダリティをまたいだ一般化を学び、フローの進化を正確に予測し、限られたビューから行方不明のフローフィールド情報を再構築する。この研究は、複雑な流体系の予測モデルに大規模な視覚変換器をベースとしたモデルをどのように適用できるかを示す。

関連論文リスト

DiTS: Multimodal Diffusion Transformers Are Time Series Forecasters [50.43534351968113]
既存の生成時系列モデルは、時系列データの多次元特性にうまく対応していない。動画生成にテキストガイダンスを組み込んだマルチモーダル拡散変換器に着想を得て,Diffusion Transformer for Time Series (DiTS)を提案する。
論文参考訳（メタデータ） (2026-02-06T10:48:13Z)
Future Optical Flow Prediction Improves Robot Control & Video Generation [100.87884718953099]
本稿では,VLM(Vision-Language Model)と拡散アーキテクチャを組み合わせた新しい光フロー予測モデルFOFPredを紹介する。我々のモデルは、高度にスケーラブルだが非構造化のソースである、Webスケールの人間活動データに基づいて訓練されている。言語駆動設定下でのロボット操作とビデオ生成による評価は、FOFPredのクロスドメインの汎用性を確立する。
論文参考訳（メタデータ） (2026-01-15T18:49:48Z)
Unfolding Time: Generative Modeling for Turbulent Flows in 4D [49.843505326598596]
本研究では,4次元生成拡散モデルと物理インフォームドガイダンスを導入し,現実的な流れ状態列の生成を可能にする。提案手法は, 乱流多様体からのサブシーケンス全体のサンプリングに有効であることが示唆された。この進展は、乱流の時間的進化を分析するために生成モデリングを適用するための扉を開く。
論文参考訳（メタデータ） (2024-06-17T10:21:01Z)
Event-Based Simulation of Stochastic Memristive Devices for Neuromorphic Computing [41.66366715982197]
イベントベースシステムのシミュレーションに適したメムリスタの一般モデルを構築した。既存のmemristorの汎用モデルをイベント駆動設定に拡張する。本稿では,イベントベースモデルのパラメータをドリフトモデルに適合させる手法を示す。
論文参考訳（メタデータ） (2024-06-14T13:17:19Z)
Physics-enhanced Neural Operator for Simulating Turbulent Transport [9.923888452768919]
本稿では、偏微分方程式(PDE)の物理知識を取り入れた物理強化型ニューラル演算子(PENO)について、正確に流れのダイナミクスをモデル化する。提案手法は,2つの異なる3次元乱流データに対して,その性能評価を行う。
論文参考訳（メタデータ） (2024-05-31T20:05:17Z)
Forecasting through deep learning and modal decomposition in two-phase concentric jets [2.362412515574206]
本研究はターボファンエンジンにおける燃料室噴射器の性能向上を目的としている。燃料/空気混合物のリアルタイム予測と改善を可能にするモデルの開発が必要である。
論文参考訳（メタデータ） (2022-12-24T12:59:41Z)
Machine Learning model for gas-liquid interface reconstruction in CFD numerical simulations [59.84561168501493]
流体の体積(VoF)法は多相流シミュレーションにおいて2つの不混和性流体間の界面を追跡・見つけるために広く用いられている。 VoF法の主なボトルネックは、計算コストが高く、非構造化グリッド上での精度が低いため、インタフェース再構成のステップである。一般的な非構造化メッシュ上でのインタフェース再構築を高速化するために,グラフニューラルネットワーク(GNN)に基づく機械学習拡張VoF手法を提案する。
論文参考訳（メタデータ） (2022-07-12T17:07:46Z)
Machine learning for rapid discovery of laminar flow channel wall modifications that enhance heat transfer [56.34005280792013]
任意の, 平坦な, 非平坦なチャネルの正確な数値シミュレーションと, ドラッグ係数とスタントン数を予測する機械学習モデルを組み合わせる。畳み込みニューラルネットワーク(CNN)は,数値シミュレーションのわずかな時間で,目標特性を正確に予測できることを示す。
論文参考訳（メタデータ） (2021-01-19T16:14:02Z)
Normalizing Flows with Multi-Scale Autoregressive Priors [131.895570212956]
マルチスケール自己回帰前処理(mAR)を通した遅延空間におけるチャネルワイド依存性を導入する。我々のmARは、分割結合フロー層(mAR-SCF)を持つモデルに先立って、複雑なマルチモーダルデータの依存関係をよりよく捉えます。我々は,mAR-SCFにより画像生成品質が向上し,FIDとインセプションのスコアは最先端のフローベースモデルと比較して向上したことを示す。
論文参考訳（メタデータ） (2020-04-08T09:07:11Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。