論文の概要: Variational decomposition autoencoding improves disentanglement of latent representations
- arxiv url: http://arxiv.org/abs/2601.06844v1
- Date: Sun, 11 Jan 2026 10:16:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-13 19:08:01.025412
- Title: Variational decomposition autoencoding improves disentanglement of latent representations
- Title(参考訳): 変分自動符号化による潜在表現の歪み改善
- Authors: Ioannis Ziogas, Aamna Al Shehhi, Ahsan H. Khandoker, Leontios J. Hadjileontiadis,
- Abstract要約: 信号分解に対する強い構造バイアスを組み込むことで、VAEを拡張するフレームワークである変分分解自動符号化(VDA)を導入する。
VDAは変分分解オートエンコーダ(DecVAE)、すなわち信号分解モデル、コントラスト自己監督タスク、変分事前近似を組み合わせたエンコーダのみのニューラルネットワークによってインスタンス化される。
シミュレーションデータと3つの公開科学データセットに対するDecVAEsの有効性を実証し, 音声認識, 難聴度評価, 感情音声分類を行った。
- 参考スコア(独自算出の注目度): 14.3216921403324
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Understanding the structure of complex, nonstationary, high-dimensional time-evolving signals is a central challenge in scientific data analysis. In many domains, such as speech and biomedical signal processing, the ability to learn disentangled and interpretable representations is critical for uncovering latent generative mechanisms. Traditional approaches to unsupervised representation learning, including variational autoencoders (VAEs), often struggle to capture the temporal and spectral diversity inherent in such data. Here we introduce variational decomposition autoencoding (VDA), a framework that extends VAEs by incorporating a strong structural bias toward signal decomposition. VDA is instantiated through variational decomposition autoencoders (DecVAEs), i.e., encoder-only neural networks that combine a signal decomposition model, a contrastive self-supervised task, and variational prior approximation to learn multiple latent subspaces aligned with time-frequency characteristics. We demonstrate the effectiveness of DecVAEs on simulated data and three publicly available scientific datasets, spanning speech recognition, dysarthria severity evaluation, and emotional speech classification. Our results demonstrate that DecVAEs surpass state-of-the-art VAE-based methods in terms of disentanglement quality, generalization across tasks, and the interpretability of latent encodings. These findings suggest that decomposition-aware architectures can serve as robust tools for extracting structured representations from dynamic signals, with potential applications in clinical diagnostics, human-computer interaction, and adaptive neurotechnologies.
- Abstract(参考訳): 複雑な非定常、高次元の時間進化信号の構造を理解することは、科学データ分析における中心的な課題である。
音声やバイオメディカル信号処理などの多くの領域では、非絡み合いや解釈可能な表現を学習する能力は、潜在的な生成機構を明らかにするために重要である。
変分オートエンコーダ(VAE)を含む、教師なし表現学習への伝統的なアプローチは、そのようなデータに固有の時間的およびスペクトル的多様性を捉えるのにしばしば苦労する。
本稿では、信号分解に対する強い構造バイアスを組み込むことで、VAEを拡張するフレームワークである変分分解自動符号化(VDA)を紹介する。
VDAは、変動分解オートエンコーダ(DecVAE)、すなわち信号分解モデル、コントラスト自己監督タスク、および変動前の近似を組み合わせたエンコーダのみのニューラルネットワークによってインスタンス化され、時間周波数特性に整合した複数の潜伏部分空間を学習する。
シミュレーションデータと3つの公開科学データセットに対するDecVAEsの有効性を実証し, 音声認識, 難聴度評価, 感情音声分類を行った。
以上の結果から,DecVAEsは現状のVAEベースの手法を超越し,不整合品質,タスク間の一般化,潜時符号化の解釈可能性を示した。
これらの結果は,分解認識アーキテクチャが動的信号から構造化表現を抽出するための堅牢なツールとして機能し,臨床診断,人-コンピュータインタラクション,適応型神経技術に応用できることを示唆している。
関連論文リスト
- BEAT-Net: Injecting Biomimetic Spatio-Temporal Priors for Interpretable ECG Classification [1.3909285316906435]
BEAT-NetはTokenizationフレームワークを用いたバイオミメティックECG分析である。
局所的なビート形態を抽出する特殊なエンコーダによって心臓生理を分解する。
例外的なデータ効率を示し、注釈付きデータの30~35%しか使用せずに、完全に教師付きのパフォーマンスを回復する。
論文 参考訳(メタデータ) (2026-01-12T08:37:47Z) - A Novel Data Augmentation Strategy for Robust Deep Learning Classification of Biomedical Time-Series Data: Application to ECG and EEG Analysis [2.355460994057843]
本研究では,様々な信号タイプにまたがる最先端性能を実現する,新しい統合型深層学習フレームワークを提案する。
従来の研究とは異なり、将来予測能力を達成するために信号の複雑さを科学的に増加させ、最高の予測を導いた。
アーキテクチャには130MBのメモリとプロセスが10ミリ秒で必要であり、ローエンドデバイスやウェアラブルデバイスへのデプロイに適していることを示唆している。
論文 参考訳(メタデータ) (2025-07-16T21:38:10Z) - Clinical NLP with Attention-Based Deep Learning for Multi-Disease Prediction [44.0876796031468]
本稿では,電子健康記録テキストの非構造的性質と高次元意味論的複雑さがもたらす課題について論じる。
情報抽出と多ラベル病予測のための統合モデリングを実現するために,注意機構に基づく深層学習手法を提案する。
論文 参考訳(メタデータ) (2025-07-02T07:45:22Z) - Spatial-Temporal-Spectral Unified Modeling for Remote Sensing Dense Prediction [20.1863553357121]
リモートセンシングのための現在のディープラーニングアーキテクチャは、基本的に堅固である。
本稿では,統合モデリングのための空間時間スペクトル統一ネットワーク(STSUN)について紹介する。
STSUNは任意の空間サイズ、時間長、スペクトル帯域で入力および出力データに適応することができる。
様々な密集した予測タスクと多様な意味クラス予測を統一する。
論文 参考訳(メタデータ) (2025-05-18T07:39:17Z) - Explainable AI for Multivariate Time Series Pattern Exploration: Latent Space Visual Analytics with Temporal Fusion Transformer and Variational Autoencoders in Power Grid Event Diagnosis [1.170167705525779]
本稿では、時間融合変換器(TFT)と変分自動符号化器(VAE)の2つの生成AIモデルを統合する新しい視覚分析フレームワークを提案する。
複雑なパターンを低次元の潜在空間に還元し、PCA, t-SNE, UMAPなどの次元還元技術を用いて2次元でDBSCANで可視化する。
このフレームワークは電力グリッド信号データのケーススタディを通じて実証され、多様な根本原因を持つ障害や異常を含むマルチラベルグリッドイベントシグネチャを識別する。
論文 参考訳(メタデータ) (2024-12-20T17:41:11Z) - Multi-Source and Test-Time Domain Adaptation on Multivariate Signals using Spatio-Temporal Monge Alignment [59.75420353684495]
コンピュータビジョンやバイオメディカルデータなどの信号に対する機械学習の応用は、ハードウェアデバイスやセッション記録にまたがる変動のため、しばしば課題に直面している。
本研究では,これらの変動を緩和するために,時空間モンジュアライメント(STMA)を提案する。
我々はSTMAが、非常に異なる設定で取得したデータセット間で、顕著で一貫したパフォーマンス向上をもたらすことを示す。
論文 参考訳(メタデータ) (2024-07-19T13:33:38Z) - Deep Equilibrium Assisted Block Sparse Coding of Inter-dependent
Signals: Application to Hyperspectral Imaging [71.57324258813675]
相互依存信号のデータセットは、列が強い依存を示す行列として定義される。
ニューラルネットワークは、事前に構造として機能し、基礎となる信号相互依存性を明らかにするために使用される。
ディープ・アンローリングとディープ・平衡に基づくアルゴリズムが開発され、高度に解釈可能で簡潔なディープ・ラーニング・ベース・アーキテクチャを形成する。
論文 参考訳(メタデータ) (2022-03-29T21:00:39Z) - Adaptive Discrete Communication Bottlenecks with Dynamic Vector
Quantization [76.68866368409216]
入力に条件付けされた離散化の厳密度を動的に選択する学習を提案する。
コミュニケーションボトルネックの動的に変化する厳密さは、視覚的推論や強化学習タスクにおけるモデル性能を向上させることができることを示す。
論文 参考訳(メタデータ) (2022-02-02T23:54:26Z) - Deep Co-Attention Network for Multi-View Subspace Learning [73.3450258002607]
マルチビューサブスペース学習のための深層コアテンションネットワークを提案する。
共通情報と相補情報の両方を敵意で抽出することを目的としている。
特に、新しいクロス再構成損失を使用し、ラベル情報を利用して潜在表現の構築を誘導する。
論文 参考訳(メタデータ) (2021-02-15T18:46:44Z) - G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for
Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。
2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文 参考訳(メタデータ) (2021-01-27T19:28:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。