論文の概要: Physics-Guided Spatiotemporal State Space Modeling for Lookahead Molten Pool Segmentation in Laser Wire-Feed Welding
- arxiv url: http://arxiv.org/abs/2606.23028v1
- Date: Mon, 22 Jun 2026 08:39:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-25 00:38:20.042566
- Title: Physics-Guided Spatiotemporal State Space Modeling for Lookahead Molten Pool Segmentation in Laser Wire-Feed Welding
- Title(参考訳): レーザーワイヤー溶接におけるルックアヘッド溶融プールセグメンテーションのための物理誘導時空間モデル
- Authors: Sen Li, Haichao Cui, Changhao Yin, Chendong Shao, Yaqi Wang, Xinhua Tang, Fenggui Lu,
- Abstract要約: 本稿では,ルックアヘッド溶接プールセグメンテーションのための物理誘導型状態空間ネットワークを提案する。
このモデルは、3つの物理的に意味のある領域の将来のレイアウトを予測するために、歴史的な画像、溶接プロセスパラメータ、信号を使用する。
- 参考スコア(独自算出の注目度): 4.820306226075129
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Real-time weld-pool perception is critical for closed-loop control in laser wire-feed welding, where sensing, computation, and actuator response introduce unavoidable delay. This paper presents a physics-guided spatiotemporal state space network for lookahead weld-pool segmentation. The model uses historical coaxial grayscale images, welding process parameters, and aligned wire-state electrical signals to predict the future semantic layout of three physically meaningful regions: keyhole, wire, and molten pool. It combines a visual encoder, process- and sensor-conditioned feature normalization, patch-level temporal state space modeling, horizon-conditioned latent prediction, dense future feature prediction, and a motion-aware mask decoder. Auxiliary signed-distance-function supervision, temporal consistency, feature distillation, and fine-grained keyhole losses further constrain the predicted geometry and local motion. Experiments on a 43-sequence laser welding dataset show that the proposed WeldMamba reaches 74.63\% mIoU at a 500 ms lookahead. Ablation studies further show that temporal history, patch-level state space modeling, and keyhole motion awareness are the main contributors to robust future segmentation.
- Abstract(参考訳): レーザワイヤファイド溶接において、リアルタイム溶接プール認識はクローズドループ制御において重要であり、センシング、計算、アクチュエータ応答は避けられない遅延をもたらす。
本稿では,ルックアヘッド溶接プールセグメンテーションのための物理誘導時空間ネットワークを提案する。
このモデルは、歴史的に同軸のグレイスケールの画像、溶接プロセスパラメータ、およびアライメントされたワイヤステート電気信号を使用して、キーホール、ワイヤ、溶融プールの3つの物理的意味のある領域の将来の意味的レイアウトを予測する。
ビジュアルエンコーダ、プロセスおよびセンサーによる特徴正規化、パッチレベルの時間空間モデリング、地平線条件付き潜伏予測、密度の高い将来の特徴予測、モーション対応マスクデコーダを組み合わせる。
補助的な符号-距離関数の監督、時間的一貫性、特徴蒸留、きめ細かいキーホールの損失は、予測された幾何学と局所運動をさらに制限した。
43列のレーザー溶接データセットの実験では、提案されたウェルドマンバは500msの視界で74.63\% mIoUに達することが示されている。
アブレーション研究は、時間的履歴、パッチレベルの状態空間モデリング、およびキーホール運動認識が、堅牢な将来のセグメンテーションの主要な貢献者であることを示している。
関連論文リスト
- Graph Neural ODE Digital Twins for Control-Oriented Reactor Thermal-Hydraulic Forecasting Under Partial Observability [6.370970195988317]
高度原子炉のリアルタイム監視制御には、プラント全体の熱水和状態の正確な予測が必要である。
物理インフォームドメッセージパス型微分ニューラルネットワークとニューラル正規方程式(GNN-ODE)を提案する。
GNN-ODEサロゲートはシステムダイナミクス予測に満足な結果が得られる。
論文 参考訳(メタデータ) (2026-04-08T16:58:14Z) - LAtent Phase Inference from Short time sequences using SHallow REcurrent Decoders (LAPIS-SHRED) [2.2618027531198313]
空間と時間の両方における軌道からのフル時間ダイナミクスは、複雑なシステムにおいて中心的な課題である。
LAPIS-SH(LAPIS-SH)は,スパースセンサ観測から完全なモジュラーダイナミクスを再構築し,/または予測するモジュラーアーキテクチャである。
複雑な物理を対象とする6つの実験(フロー,マルチスケール物理,燃焼,衛星ベース推進)についてLAPIS-SHを評価した。
論文 参考訳(メタデータ) (2026-04-01T17:55:10Z) - SPECTRA: An Efficient Spectral-Informed Neural Network for Sensor-Based Activity Recognition [11.283502671153109]
広範コンピューティングにおけるリアルタイムセンサベースのアプリケーションは、低レイテンシのプライバシと効率的なインタラクションを保証するために、エッジデプロイ可能なモデルを必要とする。
SPECTRAは、短時間のフーリエ変換STFT特徴抽出とチャネルワイズ・セルフアテンションを統合し、実エッジランタイムとメモリ制約下でのスペクトル時間依存性をキャプチャする。
注目プーリングを施したコンパクトな双方向GRUは、精度を保ちながら、低コストでダウンストリームモデルの負担を軽減する。
論文 参考訳(メタデータ) (2026-03-27T14:45:27Z) - SLAT-Phys: Fast Material Property Field Prediction from Structured 3D Latents [55.26273954022457]
物理に基づくシミュレーション、ロボット工学、デジタルツインジェネレーションにおいて、3Dアセットの材料特性場を推定することが重要である。
本稿では,1枚のRGB画像から空間的に変化する3次元資産の材料特性場を,明示的な3次元再構成なしに直接予測するSLAT-Physを提案する。
論文 参考訳(メタデータ) (2026-03-25T06:14:03Z) - End-to-End Spatial-Temporal Transformer for Real-time 4D HOI Reconstruction [74.31251139839047]
THOは、ビデオと3Dテンプレートから、人間の動きと調整された物体の動きを前方に予測する、エンドツーエンドの空間-時間変換器である。
実験により、THOは1つの4090 GPU上で31.5 FPSの推論速度で動作し、以前の最適化ベースの手法よりも600倍のスピードアップを達成した。
論文 参考訳(メタデータ) (2026-03-15T15:21:36Z) - Cross-Modal Reconstruction Pretraining for Ramp Flow Prediction at Highway Interchanges [30.274689865122056]
STDAEは、クロスモーダルな再構築事前トレーニングを利用する2段階のフレームワークである。
STDAE-GWNETは13の最先端ベースラインを一貫して上回っている。
このことは、検出器の不足を克服する効果と、様々な予測パイプラインに対するプラグアンドプレイの可能性を示す。
論文 参考訳(メタデータ) (2025-10-03T15:26:56Z) - Future Does Matter: Boosting 3D Object Detection with Temporal Motion Estimation in Point Cloud Sequences [25.74000325019015]
クロスフレーム動作予測情報を用いた時空間特徴学習を容易にするために,新しいLiDAR 3Dオブジェクト検出フレームワークLiSTMを導入する。
我々は,本フレームワークが優れた3次元検出性能を実現することを示すため,アグリゲーションとnuScenesデータセットの実験を行った。
論文 参考訳(メタデータ) (2024-09-06T16:29:04Z) - Think Twice before Driving: Towards Scalable Decoders for End-to-End
Autonomous Driving [74.28510044056706]
既存のメソッドは通常、分離されたエンコーダ-デコーダパラダイムを採用する。
本研究は,この問題を2つの原則で緩和することを目的としている。
まず、エンコーダの特徴に基づいて、粗い将来の位置と行動を予測する。
そして、その位置と動作を条件に、将来のシーンを想像して、それに従って運転した場合にその影響を確認する。
論文 参考訳(メタデータ) (2023-05-10T15:22:02Z) - Overhead-Free Blockage Detection and Precoding Through Physics-Based
Graph Neural Networks: LIDAR Data Meets Ray Tracing [58.73924499067486]
物理ベースグラフニューラルネットワーク(GNN)による光検出・測光(LIDAR)データの分類によりブロック検出を実現する
プリコーダ設計には、LIDARデータから得られた3D面にレイトレーシングを行うことにより、予備チャネル推定を行う。
数値シミュレーションにより、ブロック検出は95%精度で成功していることが示された。
論文 参考訳(メタデータ) (2022-09-15T15:04:55Z) - A Graph Convolutional Network with Signal Phasing Information for
Arterial Traffic Prediction [63.470149585093665]
動脈交通予測は 現代のインテリジェント交通システムの発展に 重要な役割を担っています
動脈交通予測に関する既存の研究の多くは、ループセンサからの流量と占有率の時間的測定のみを考慮し、上流と下流の検出器間のリッチな空間的関係を無視している。
我々は,信号タイミング計画から発生する空間情報を用いて,深層学習アプローチである拡散畳み込みリカレントニューラルネットワークを強化することで,このギャップを埋める。
論文 参考訳(メタデータ) (2020-12-25T01:40:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。