論文の概要: VCR: Learning Valid Contextual Representation for Incomplete Wearable Signals
- arxiv url: http://arxiv.org/abs/2605.18837v1
- Date: Wed, 13 May 2026 03:11:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-20 15:03:08.655018
- Title: VCR: Learning Valid Contextual Representation for Incomplete Wearable Signals
- Title(参考訳): VCR:不完全なウェアラブル信号に対する有効文脈表現の学習
- Authors: Yuxuan Weng, Wenhan Luo, Qijia Shao,
- Abstract要約: 本稿では,モダリティの欠如に頑健な有効な表現を抽出する自己教師型フレームワークであるVCRを提案する。
VCRは、フル、シングルミス、マルチミスモード設定におけるパフォーマンスとロバスト性を一貫して改善する。
- 参考スコア(独自算出の注目度): 26.890638722471902
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Wearable devices enable continuous health monitoring from multimodal signals, but real-world deployment is hindered by limited labeled data and pervasive sensor incompleteness. While large-scale self-supervised pretraining reduces label dependence, most existing methods assume full modality availability. Current approaches for handling modality missingness often reconstruct entire absent signals, which can encourage hallucinating modality-specific details that are not inferable from the observed sensor signals and degrade robustness. We propose VCR, a self-supervised framework that learns to extract valid representations robust to modality missingness. VCR employs an orthogonal tokenizer to enforce strict orthogonal disentanglement by rectifying latent manifolds and applying a geometric projection, separating each modality into shared semantics and modality-specific residuals. This design preserves complete information integrity while serving as a structural foundation for robust learning under modality missingness. The resulting tokens are processed by a missing-aware mixture-of-experts backbone that adapts to varying patterns of modality availability. By constraining the objective to reconstruct only the shared components of missing modalities, VCR effectively mitigates hallucinations of non-inferable modality-specific details. Across multiple health monitoring tasks, VCR consistently improves performance and robustness under full, single-missing, and multiple-missing modality settings compared with strong supervised and self-supervised baselines.
- Abstract(参考訳): ウェアラブルデバイスは、マルチモーダル信号からの継続的な健康モニタリングを可能にするが、実世界の展開は、ラベル付きデータと広汎なセンサーの不完全さによって妨げられる。
大規模自己監督型事前学習はラベル依存を減少させるが、既存の手法の多くは完全なモダリティを前提としている。
モダリティの欠如に対処する現在のアプローチは、しばしば欠落した信号全体を再構成し、観測されたセンサー信号から推測できない幻覚的なモダリティ固有の詳細を奨励し、ロバスト性を低下させる。
本稿では,モダリティの欠如に頑健な有効な表現を抽出する自己教師型フレームワークであるVCRを提案する。
VCRは直交トークン化器を用いて、潜在多様体を整形し、幾何学的射影を適用し、各モダリティを共有意味論とモダリティ固有残差に分離する。
この設計は、モダリティの欠如の下で頑健な学習のための構造的基盤として機能しながら、完全な情報整合性を保っている。
結果として生じるトークンは、モダリティアベイラビリティーのパターンに適応する、未認識のエキスパートバックボーンによって処理される。
モダリティの共有成分のみを再構成する目的を制約することにより、VCRは非推論不可能なモダリティ固有の詳細の幻覚を効果的に緩和する。
複数のヘルスモニタリングタスク全体で、VCRは、強力な教師付きベースラインや自己管理ベースラインと比較して、フル、シングルミス、マルチミッションのモダリティ設定におけるパフォーマンスと堅牢性を一貫して改善します。
関連論文リスト
- Resilient Vision-Tabular Multimodal Learning under Modality Missingness [1.696842238811138]
マルチモーダルディープラーニングは医療応用において大きな可能性を秘めている。
既存のアプローチの多くは、完全にモダリティの可用性を暗黙的に仮定している。
共同視覚・タブラリ学習のためのマルチモーダルトランスフォーマーフレームワークを提案する。
論文 参考訳(メタデータ) (2026-05-12T12:14:13Z) - Robust Multimodal Recommendation via Graph Retrieval-Enhanced Modality Completion [71.20734649881258]
実世界のマルチモーダルデータセットは、センサーの故障、アノテーションの不足、プライバシーの制約によって、しばしばモダリティの不完全性に悩まされる。
効果的な解決策の1つはモダリティ補完であり、下流タスクのためのモダリティ完全グラフを提供するために欠落した特徴を再構成する。
本稿では,これらの制限を克服するグラフ検索拡張モード補完フレームワークであるGRE-MCを提案する。
論文 参考訳(メタデータ) (2026-05-01T13:50:52Z) - Conditional Imputation for Within-Modality Missingness in Multi-Modal Federated Learning [8.35064965629059]
MMFL(Multimodal Federated Learning)は、プライバシー保護のための協調トレーニングを提供する。
実世界の臨床応用は、しばしば、センサーの断続性や不規則なサンプリングによって生じるモダリティの欠如に悩まされる。
本研究では,条件付き拡散モデルを用いて,この欠陥に明示的に対処するフレームワークであるCondIを提案する。
論文 参考訳(メタデータ) (2026-04-25T02:35:08Z) - Causal Bootstrapped Alignment for Unsupervised Video-Based Visible-Infrared Person Re-Identification [52.784239635604735]
VVI-ReIDは、静止画像以外にも時間情報が付加的な手がかりを提供する、全日監視のための重要な技術である。
既存のアプローチは、高価なクロスモダリティアノテーションによる完全な教師付き学習に大きく依存しており、スケーラビリティが制限されています。
そこで,本研究では,ビデオの先行を明示的に活用するCausal Bootstrapped Alignmentフレームワークを提案する。
論文 参考訳(メタデータ) (2026-04-17T02:15:59Z) - Missing-Aware Multimodal Fusion for Unified Microservice Incident Management [22.703696384749595]
ARMORは、モダリティの欠如を前提とした、自己管理型のフレームワークである。
自己監督型自己回帰とマスク誘導型再構成を用いて、異常検出、障害トリアージ、根本原因の局在を共同で最適化する。
完全なデータ条件下での最先端性能を実現し、厳密なモダリティ損失でも堅牢な診断精度を維持する。
論文 参考訳(メタデータ) (2026-03-26T15:14:57Z) - Neural Uncertainty Principle: A Unified View of Adversarial Fragility and LLM Hallucination [60.197429875410286]
大規模言語モデルにおける視覚と幻覚の対立的脆弱性は、伝統的に別の問題と見なされている。
損失誘起状態下でのニューラル不確実性原理(NUP)の定式化により, ほぼバウンド状態においては, さらなる圧縮は感度分散の増大を伴うことが判明した。
視覚では、高度に結合したコンポーネントをマスキングすることで、コストのかかる敵の訓練なしに堅牢性を向上させる。
言語では、任意の応答トークンを生成する前に、同じプレフィルステージプローブが幻覚リスクを検出する。
論文 参考訳(メタデータ) (2026-03-20T02:07:10Z) - A Contrastive Variational AutoEncoder for NSCLC Survival Prediction with Missing Modalities [41.8469011437549]
非小細胞肺癌 (NSCLC) 患者の生存予測は, 個々の予後が異なるため困難である。
最先端モデルは、患者レベルの表現を作成するために利用可能なデータや、欠落したモダリティを推測するために生成モデルを使用する。
本稿では,MCVAE(Multimodal Contrastive Variational AutoEncoder)を提案する。
論文 参考訳(メタデータ) (2026-02-19T14:29:34Z) - ReDFeat: Recoupling Detection and Description for Multimodal Feature
Learning [51.07496081296863]
我々は、相互重み付け戦略による多モーダル特徴学習の検出と記述の独立した制約を再定義する。
本研究では,大きな受容場を有し,学習可能な非最大抑制層を備える検出器を提案する。
我々は,特徴マッチングと画像登録タスクにおける特徴量を評価するために,クロス可視,赤外線,近赤外,合成開口レーダ画像ペアを含むベンチマークを構築した。
論文 参考訳(メタデータ) (2022-05-16T04:24:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。