論文の概要: SPADE: Split-and-Delay Embeddings for Autoregressive High-Granularity Calorimeter Simulation
- arxiv url: http://arxiv.org/abs/2606.11304v1
- Date: Tue, 09 Jun 2026 18:00:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-11 16:42:38.118837
- Title: SPADE: Split-and-Delay Embeddings for Autoregressive High-Granularity Calorimeter Simulation
- Title(参考訳): SPADE: 自己回帰型高グラニュラリティカロリメータシミュレーションのためのスプリット・アンド・遅延埋め込み
- Authors: Joschka Birk, Frank Gaede, Anna Hallin, Gregor Kasieczka, Martina Mozzanica, Henning Rose,
- Abstract要約: トークンが複数の特徴を持つシーケンスを自動回帰変換するSPADE(SPlit And Delay Embeddings)を紹介する。
前のものと比較して各特徴ストリームを遅延させることで、標準の自己認識機構で学習できる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce SPADE (SPlit And Delay Embeddings), an autoregressive transformer for sequences whose tokens carry multiple features. Rather than embedding these features jointly, SPADE embeds them independently. Delaying each feature stream relative to the previous one allows intra-token correlations to be learned by the standard self-attention mechanism. Applied to point-cloud calorimeter shower generation in the highly granular ILD detector, SPADE is competitive with the state of the art AllShowers model on photon showers, and substantially outperforms its VQ-VAE-based predecessor OmniJet-$α_C$. The mechanism is applicable to any generative task with multi-feature tokens, enabling LLM-style pretraining workflows for higher-dimensional data.
- Abstract(参考訳): トークンが複数の特徴を持つシーケンスを自動回帰変換するSPADE(SPlit And Delay Embeddings)を紹介する。
これらの機能を一緒に組み込むのではなく、SPADEは独立して組み込む。
前のものと比較して各特徴ストリームを遅延させることで、標準の自己認識メカニズムで学習できる。
高粒度ILD検出器におけるポイントクラウド温度計のシャワー発生に応用して、SPADEは光子シャワーにおける最先端のAllShowersモデルと競合し、VQ-VAEベースの先駆者であるOmniJet-$α_C$を大幅に上回っている。
この機構は多機能トークンを持つ任意の生成タスクに適用可能であり、高次元データに対するLLMスタイルの事前訓練ワークフローを可能にする。
関連論文リスト
- EgoPressDiff: Multimodal Video Diffusion for Egocentric UV-Domain Hand-Pressure Estimation [68.71388815638576]
視覚入力から紫外線圧マップを生成する条件付きビデオ拡散フレームワークであるemphEgoPressDiffを提案する。
EgoPressDiffは最先端の結果を達成し、Volumetric IoUを以前のベースラインと比較して34%以上改善した。
論文 参考訳(メタデータ) (2026-06-05T03:40:10Z) - A Lightweight Sparse Interaction Network for Time Series Forecasting [9.398256560898448]
TSFタスクのための軽量スパースインタラクションネットワーク(LSINet)を提案する。
自己注意の空間性から着想を得たマルチヘッドスパース相互作用機構(MSIM)を提案する。
MSIMは、時間ステップ間の重要な接続をスパーシリティによって引き起こされるBernoulli分布を通じて学習し、TSFの時間的依存関係をキャプチャする。
LSINetは、TSFタスクにおける高度な線形モデルとトランスフォーマーモデルよりも精度と効率の両立を実現している。
論文 参考訳(メタデータ) (2026-02-02T03:24:14Z) - AllShowers: One model for all calorimeter showers [0.0]
AllShowersは、複数の粒子種にわたるカロリーメータシャワーをシミュレートする統合生成モデルである。
非常に粒度の高いILD検出器で、様々なシミュレートされたシャワーのデータセットで訓練される。
論文 参考訳(メタデータ) (2026-01-16T19:09:57Z) - Latent Stochastic Interpolants [4.674313947272508]
Evidence Interpolants (SI) は2つの確率分布間の柔軟変換が可能な生成モデリングのための強力なフレームワークである。
この研究は、エンドツーエンドの最適化モデルを用いた潜在空間でのジョイントラーニングを可能にする遅延補間(LSI)を提示する。
我々は、標準的な大規模画像ネット生成ベンチマークにおいて、包括的な実験を通してLSIの有効性を実証する。
論文 参考訳(メタデータ) (2025-06-02T21:34:50Z) - FELLE: Autoregressive Speech Synthesis with Token-Wise Coarse-to-Fine Flow Matching [56.30231216917128]
FELLEは、言語モデリングとトークンワイドフローマッチングを統合する自動回帰モデルである。
各連続値トークンに対して、FELLEは、前ステップからの情報を組み込んで、フローマッチングにおける一般的な事前分布を変更する。
FELLEは、言語モデルの出力に基づいて階層的に連続値のトークンを生成する。
論文 参考訳(メタデータ) (2025-02-16T13:54:32Z) - Exploring Representation-Aligned Latent Space for Better Generation [86.45670422239317]
生成性能を改善するために,セマンティックな事前情報を統合するReaLSを導入する。
本研究では、ReaLSでトレーニングされたDETとSiTが、FID測定値の15%改善を実現することを示す。
拡張されたセマンティック潜在空間は、セグメンテーションや深さ推定のようなより知覚的な下流タスクを可能にする。
論文 参考訳(メタデータ) (2025-02-01T07:42:12Z) - DyFADet: Dynamic Feature Aggregation for Temporal Action Detection [70.37707797523723]
カーネル重みと受容フィールドを異なるタイムスタンプで適応できる新しい動的特徴集約(DFA)モジュールを構築した。
DFAを使用することで動的DADヘッド(DyHead)の開発を支援し、パラメータを調整したマルチスケール機能を適応的に集約する。
新しい動的TADモデルであるDyFADetは、一連の挑戦的なTADベンチマークで有望なパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-07-03T15:29:10Z) - EPiC-GAN: Equivariant Point Cloud Generation for Particle Jets [0.0]
EPiC-GAN - 同変点雲生成逆数ネットワーク - を導入し、可変多重性の点雲を生成する。
EPiC-GANは、大規模粒子乗数によく対応し、ベンチマークジェット生成タスクにおける高世代忠実性を実現する。
論文 参考訳(メタデータ) (2023-01-17T19:00:00Z) - Shunted Self-Attention via Multi-Scale Token Aggregation [124.16925784748601]
最近のビジョン変換器(ViT)モデルは、様々なコンピュータビジョンタスクにまたがる励振結果を実証している。
注意層ごとのハイブリッドスケールでの注意をViTsでモデル化するShunted Self-attention(SSA)を提案する。
SSAベースの変換器は84.0%のTop-1精度を実現し、ImageNetの最先端のFocal Transformerより優れている。
論文 参考訳(メタデータ) (2021-11-30T08:08:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。