論文の概要: ZUNA: Flexible EEG Superresolution with Position-Aware Diffusion Autoencoders
- arxiv url: http://arxiv.org/abs/2602.18478v1
- Date: Mon, 09 Feb 2026 18:36:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-02 07:21:25.603538
- Title: ZUNA: Flexible EEG Superresolution with Position-Aware Diffusion Autoencoders
- Title(参考訳): zuna: 位置認識拡散オートエンコーダを用いたフレキシブル脳波超解像
- Authors: Christopher Warner, Jonas Mago, JR Huml, Mohamed Osman, Beren Millidge,
- Abstract要約: texttzunaは380Mのマスク付き拡散オートエンコーダで、マスク付きチャネルの埋め込みと超解像を行うように訓練されている。
texttzunaのパフォーマンスは、新しいデータセットや問題に直接適用できるように、データセットとチャネル位置を横断して一般化する。
その生成能力にもかかわらず、 texttzuna はいまだに計算学的にデプロイに実用的である。
- 参考スコア(独自算出の注目度): 9.717613953440894
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present \texttt{ZUNA}, a 380M-parameter masked diffusion autoencoder trained to perform masked channel infilling and superresolution for arbitrary electrode numbers and positions in EEG signals. The \texttt{ZUNA} architecture tokenizes multichannel EEG into short temporal windows and injects spatiotemporal structure via a 4D rotary positional encoding over (x,y,z,t), enabling inference on arbitrary channel subsets and positions. We train ZUNA on an aggregated and harmonized corpus spanning 208 public datasets containing approximately 2 million channel-hours using a combined reconstruction and heavy channel-dropout objective. We show that \texttt{ZUNA} substantially improves over ubiquitous spherical-spline interpolation methods, with the gap widening at higher dropout rates. Crucially, compared to other deep learning methods in this space, \texttt{ZUNA}'s performance \emph{generalizes} across datasets and channel positions allowing it to be applied directly to novel datasets and problems. Despite its generative capabilities, \texttt{ZUNA} remains computationally practical for deployment. We release Apache-2.0 weights and an MNE-compatible preprocessing/inference stack to encourage reproducible comparisons and downstream use in EEG analysis pipelines.
- Abstract(参考訳): 本稿では、任意の電極数とEEG信号の位置に対して、マスク付きチャネル埋め込みおよび超解像を行うために訓練された380Mパラメーターマスク拡散オートエンコーダである「texttt{zuNA}」を提案する。
texttt{ZUNA}アーキテクチャは、マルチチャネルEEGを短い時間窓にトークン化し、4D回転位置符号化(x,y,z,t)を介して時空間構造を注入し、任意のチャネルサブセットと位置の推測を可能にする。
約200万チャンネル時間を含む208の公開データセットにまたがる集合的・調和したコーパス上で,複合的な再構築と重チャネルドロップアウトの目的を用いて,zunaを訓練する。
これらの結果から,<texttt{zuNA} は任意の球面-スプライン補間法よりも大幅に向上し,ギャップは高いドロップアウト速度で拡大することが示された。
重要なことに、この分野の他のディープラーニング手法と比較して、データセットとチャネル位置をまたいだ \texttt{zuNA} のパフォーマンス \emph{ Generalizes} は、新しいデータセットや問題に直接適用することができる。
生成能力にもかかわらず、‘texttt{zuNA} は計算的にデプロイに有効である。
私たちは、EEG分析パイプラインにおける再現可能な比較と下流使用を促進するために、Apache-2.0ウェイトとMNE互換のプリプロセス/推論スタックをリリースします。
関連論文リスト
- Context-Aware Semantic Segmentation via Stage-Wise Attention [0.10995326465245929]
CASWiT(Context-Aware Stage-Wise Transformer)は,グローバルキューを微細なUHR機能に注入する,デュアルブランチのスウィンベースアーキテクチャである。
クロスアテンションとゲート機能インジェクションを組み合わせたクロススケールフュージョンモジュールは、高解像度トークンをコンテキストと統合する。
大規模IGN FLAIR-HUB航空データセットの実験は、CASWiTの有効性を実証している。
論文 参考訳(メタデータ) (2026-01-16T14:06:46Z) - GSPN-2: Efficient Parallel Sequence Modeling [101.33780567131716]
一般化空間伝搬ネットワーク(GSPN)は2次自己アテンションを直線走査型伝搬方式に置き換えることでこの問題に対処する。
GSPN-2は、視覚アプリケーションにおけるグローバル空間コンテキストをモデル化するための新しい効率フロンティアを確立する。
論文 参考訳(メタデータ) (2025-11-28T07:26:45Z) - Unsupervised Radio Map Construction in Mixed LoS/NLoS Indoor Environments [34.91945910235526]
本稿では,チャネル伝播シーケンスから直接データ収集軌道を復元することを目的とする。
提案手法は,室内環境における平均局部位置精度0.65mを実現する。
論文 参考訳(メタデータ) (2025-10-09T09:53:24Z) - LUMA: Low-Dimension Unified Motion Alignment with Dual-Path Anchoring for Text-to-Motion Diffusion Model [18.564067196226436]
本稿では,2経路アンカーを組み込んだテキスト・ツー・モーション拡散モデルを提案し,セマンティックアライメントを強化する。
FIDスコアはそれぞれ0.035と0.123である。
論文 参考訳(メタデータ) (2025-09-29T17:58:28Z) - Deep Learning Based Joint Channel Estimation and Positioning for Sparse XL-MIMO OFDM Systems [25.910259131859185]
位置推定とチャネル推定を組み合わせた深層学習に基づく2段階のフレームワークを提案する。
位置決め段階では、ユーザの座標を予測し、チャネル推定段階で利用する。
本稿では,チャネル推定と位置推定のためのU字型マンバアーキテクチャを提案する。
論文 参考訳(メタデータ) (2025-07-26T12:47:39Z) - FLEX: A Backbone for Diffusion-Based Modeling of Spatio-temporal Physical Systems [51.15230303652732]
FLEX (F Low Expert) は、時間物理系の生成モデリングのためのバックボーンアーキテクチャである。
拡散モデルにおける速度場の分散を低減し、トレーニングの安定化に役立つ。
少数の特徴を2つの逆拡散ステップとして用いて、超解像および予測タスクの正確な予測を行う。
論文 参考訳(メタデータ) (2025-05-23T00:07:59Z) - AdaFortiTran: An Adaptive Transformer Model for Robust OFDM Channel Estimation [22.40154714677385]
本稿では,アダフォーティトラン(Adaptive Fortified Transformer, AdaFortiTran)を提案する。
AdaFortiTranは最先端モデルと比較して平均2乗誤差(MSE)を最大6dB削減する。
論文 参考訳(メタデータ) (2025-05-14T02:22:37Z) - Bridging the Gap Between Vision Transformers and Convolutional Neural
Networks on Small Datasets [91.25055890980084]
小さなデータセットでスクラッチからトレーニングする場合、ビジョントランスフォーマー(ViT)と畳み込みニューラルネットワーク(CNN)の間には、依然として極端なパフォーマンスギャップがある。
本稿では2つの帰納バイアスを緩和する解として動的ハイブリッドビジョン変換器(DHVT)を提案する。
我々のDHVTは、CIFAR-100が85.68%、22.8Mパラメータが82.3%、ImageNet-1Kが24.0Mパラメータが82.3%の軽量モデルで、最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2022-10-12T06:54:39Z) - Manifold Interpolating Optimal-Transport Flows for Trajectory Inference [64.94020639760026]
最適輸送流(MIOFlow)を補間するマニフォールド補間法を提案する。
MIOFlowは、散発的なタイムポイントで撮影された静的スナップショットサンプルから、連続的な人口動態を学習する。
本手法は, 胚体分化および急性骨髄性白血病の治療から得られたscRNA-seqデータとともに, 分岐とマージによるシミュレーションデータについて検討した。
論文 参考訳(メタデータ) (2022-06-29T22:19:03Z) - MixSTE: Seq2seq Mixed Spatio-Temporal Encoder for 3D Human Pose
Estimation in Video [75.23812405203778]
近年, 学習時間相関のため, 全フレームのボディジョイントを世界規模で考慮し, 2次元キーポイントシーケンスから3次元人間のポーズを推定する手法が提案されている。
本研究では,各関節の時間的動きを別々にモデル化する時間的変圧器ブロックと,関節間空間相関を有する変圧器ブロックを有するミキシングミキシングを提案する。
さらに、ネットワーク出力は、中央フレームから入力ビデオの全フレームに拡張され、入力と出力のベンチマーク間のコヒーレンスが改善される。
論文 参考訳(メタデータ) (2022-03-02T04:20:59Z) - Optical-Flow-Reuse-Based Bidirectional Recurrent Network for Space-Time
Video Super-Resolution [52.899234731501075]
時空間ビデオ超解像(ST-VSR)は、与えられたビデオの空間解像度とフレームレートを同時に増加させる。
既存の手法は通常、近隣の幅広いフレームからの情報を効率的に活用する方法の難しさに悩まされる。
本稿では,隣接するフレーム間の知識を活用するために,ConvLSTMの代わりに粗大な双方向リカレントニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2021-10-13T15:21:30Z) - DTWSSE: Data Augmentation with a Siamese Encoder for Time Series [8.019203034348083]
本稿では,DTWSSE という名前のサイムズエンコーダを用いた DTW に基づく合成マイノリティオーバーサンプリング手法を提案する。
時系列の距離を合理的に測定するために、有効な方法として検証されたDTWを距離計量として用いる。
エンコーダは、DTW隠れ空間からユークリッド深い特徴空間に時系列データをマッピングするニューラルネットワークであり、デコーダを使用して、深い特徴空間をDTW隠れ空間にマッピングする。
論文 参考訳(メタデータ) (2021-08-23T01:46:24Z) - Energy-Efficient Model Compression and Splitting for Collaborative
Inference Over Time-Varying Channels [52.60092598312894]
本稿では,エッジノードとリモートノード間のモデル圧縮と時間変化モデル分割を利用して,エッジデバイスにおける総エネルギーコストを削減する手法を提案する。
提案手法は, 検討されたベースラインと比較して, エネルギー消費が最小限であり, 排出コストが$CO$となる。
論文 参考訳(メタデータ) (2021-06-02T07:36:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。