論文の概要: Knowledge-Embedded Latent Projection for Robust Representation Learning
- arxiv url: http://arxiv.org/abs/2602.16709v1
- Date: Wed, 18 Feb 2026 18:58:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-19 15:58:30.698576
- Title: Knowledge-Embedded Latent Projection for Robust Representation Learning
- Title(参考訳): ロバスト表現学習のための知識埋め込み潜在射影
- Authors: Weijing Tang, Ming Yuan, Zongqi Xia, Tianxi Cai,
- Abstract要約: 本稿では,表現学習の正規化に意味的側面情報を活用する知識埋め込み潜在射影モデルを提案する。
具体的には、ヒルベルト空間におけるカーネルマッピングによる意味埋め込みの滑らかな関数として列埋め込みをモデル化する。
本稿では,カーネルの主成分埋め込みを介し,セマンティックガイドによる部分空間構築を組み合わせた,計算効率のよい2段階埋め込み推定手法を提案する。
- 参考スコア(独自算出の注目度): 5.79422287722755
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Latent space models are widely used for analyzing high-dimensional discrete data matrices, such as patient-feature matrices in electronic health records (EHRs), by capturing complex dependence structures through low-dimensional embeddings. However, estimation becomes challenging in the imbalanced regime, where one matrix dimension is much larger than the other. In EHR applications, cohort sizes are often limited by disease prevalence or data availability, whereas the feature space remains extremely large due to the breadth of medical coding system. Motivated by the increasing availability of external semantic embeddings, such as pre-trained embeddings of clinical concepts in EHRs, we propose a knowledge-embedded latent projection model that leverages semantic side information to regularize representation learning. Specifically, we model column embeddings as smooth functions of semantic embeddings via a mapping in a reproducing kernel Hilbert space. We develop a computationally efficient two-step estimation procedure that combines semantically guided subspace construction via kernel principal component analysis with scalable projected gradient descent. We establish estimation error bounds that characterize the trade-off between statistical error and approximation error induced by the kernel projection. Furthermore, we provide local convergence guarantees for our non-convex optimization procedure. Extensive simulation studies and a real-world EHR application demonstrate the effectiveness of the proposed method.
- Abstract(参考訳): 遅延空間モデルは、電子健康記録(EHR)における患者特徴行列のような高次元の離散データ行列を、低次元の埋め込みを通して複雑な依存構造を捉えて解析するために広く用いられている。
しかし、一方の行列次元が他方よりもはるかに大きい不均衡な状態では、推定が困難になる。
EHRアプリケーションでは、コホートサイズは病気の頻度やデータ可用性によって制限されることが多いが、医療符号化システムの幅広さのため、特徴空間は極めて大きなままである。
EHRにおける臨床概念の事前学習による埋め込みなど,外部セマンティック埋め込みの可用性の向上を動機として,セマンティックサイド情報を活用して表現学習を標準化する知識埋め込み潜在プロジェクションモデルを提案する。
具体的には、再生カーネルヒルベルト空間の写像を用いて、列埋め込みを意味埋め込みの滑らかな関数としてモデル化する。
本稿では,カーネルの主成分分析と拡張性のある射影勾配勾配を用いた意味的ガイド付き部分空間構築を組み合わせた,計算効率のよい2段階推定手法を提案する。
本稿では,カーネルプロジェクションによって誘導される統計的誤差と近似誤差のトレードオフを特徴付ける推定誤差境界を確立する。
さらに、非凸最適化手順に対して局所収束保証を提供する。
大規模なシミュレーション研究と実世界のEHR応用により,提案手法の有効性が実証された。
関連論文リスト
- SIGMA: Scalable Spectral Insights for LLM Collapse [51.863164847253366]
SIGMA(Spectral Inequalities for Gram Matrix Analysis)は,モデル崩壊のための統一的なフレームワークである。
行列のスペクトル上の決定論的境界を導出するベンチマークを利用することで、SIGMAは表現空間の収縮を追跡するために数学的に基底化された計量を提供する。
我々は、SIGMAが状態への遷移を効果的に捉え、崩壊のメカニズムに関する理論的知見の両方を提供することを示した。
論文 参考訳(メタデータ) (2026-01-06T19:47:11Z) - Efficient High-Resolution Visual Representation Learning with State Space Model for Human Pose Estimation [60.80423207808076]
高解像度の視覚表現を維持しながら長距離依存関係をキャプチャすることは、人間のポーズ推定のような密集した予測タスクに不可欠である。
マルチスケールの畳み込み操作で視覚状態空間モデルを拡張する動的ビジュアル状態空間(DVSS)ブロックを提案する。
HRVMambaは効率的な高分解能表現学習のための新しいモデルである。
論文 参考訳(メタデータ) (2024-10-04T06:19:29Z) - Synergistic eigenanalysis of covariance and Hessian matrices for enhanced binary classification [72.77513633290056]
本稿では, 学習モデルを用いて評価したヘッセン行列をトレーニングセットで評価した共分散行列の固有解析と, 深層学習モデルで評価したヘッセン行列を組み合わせた新しい手法を提案する。
本手法は複雑なパターンと関係を抽出し,分類性能を向上する。
論文 参考訳(メタデータ) (2024-02-14T16:10:42Z) - Inference of Dependency Knowledge Graph for Electronic Health Records [15.711857066677956]
動的対数線形トピックモデルに基づくスパース知識グラフの導出フレームワークを提案する。
このモデルでは、経験的ポイントワイド相互情報行列上で特異値分解を行うことにより、KG埋め込みを推定する。
次に、KG低ランク推定器のエントリーワイド正規度を確立し、制御されたI型誤差によるスパースグラフエッジの回復を可能にする。
論文 参考訳(メタデータ) (2023-12-25T04:45:36Z) - Understanding Augmentation-based Self-Supervised Representation Learning
via RKHS Approximation and Regression [53.15502562048627]
最近の研究は、自己教師付き学習とグラフラプラシアン作用素のトップ固有空間の近似との関係を構築している。
この研究は、増強に基づく事前訓練の統計的分析に発展する。
論文 参考訳(メタデータ) (2023-06-01T15:18:55Z) - Statistical Inference for Linear Functionals of Online SGD in High-dimensional Linear Regression [7.884611719110979]
勾配降下 (SGD) は、データ科学者のツールボックスにおいて重要な方法として登場した。
我々は,オンラインSGDの線形汎関数に対する高次元中心極限定理(CLT)を確立し,非等方的ガウス入力を用いた過度な最小二乗回帰を行う。
我々は,CLTに現れる分散項を推定するオンライン手法を開発し,開発したオンライン推定器の高確率バウンダリを確立する。
論文 参考訳(メタデータ) (2023-02-20T02:38:36Z) - Validation Diagnostics for SBI algorithms based on Normalizing Flows [55.41644538483948]
本研究は,NFに基づく多次元条件(後)密度推定器の検証診断を容易にすることを提案する。
また、局所的な一貫性の結果に基づいた理論的保証も提供する。
この作業は、より良い特定モデルの設計を支援したり、新しいSBIアルゴリズムの開発を促進するのに役立つだろう。
論文 参考訳(メタデータ) (2022-11-17T15:48:06Z) - Deep Efficient Continuous Manifold Learning for Time Series Modeling [11.876985348588477]
対称正定値行列はコンピュータビジョン、信号処理、医療画像解析において研究されている。
本稿では,リーマン多様体とコレスキー空間の間の微分同相写像を利用する枠組みを提案する。
時系列データの動的モデリングのために,多様体常微分方程式とゲートリカレントニューラルネットワークを体系的に統合した連続多様体学習法を提案する。
論文 参考訳(メタデータ) (2021-12-03T01:38:38Z) - Statistical control for spatio-temporal MEG/EEG source imaging with
desparsified multi-task Lasso [102.84915019938413]
脳磁図(MEG)や脳電図(EEG)のような非侵襲的手法は、非侵襲的手法を約束する。
ソースローカライゼーション(ソースイメージング)の問題は、しかしながら、高次元の統計的推測問題を引き起こす。
この問題に対処するために,分離されたマルチタスクラッソ(ecd-MTLasso)のアンサンブルを提案する。
論文 参考訳(メタデータ) (2020-09-29T21:17:16Z) - High-dimensional Bayesian Optimization of Personalized Cardiac Model
Parameters via an Embedded Generative Model [7.286540513944084]
ベイズ最適化の目的関数に生成的変分オートエンコーダ(VAE)を組み込む新しい概念を提案する。
生成コードに関するVAE符号化された知識は、探索空間の探索を導くために使用される。
本発明の方法は、心臓電気生理学的モデルにおける組織興奮性の推定に応用される。
論文 参考訳(メタデータ) (2020-05-15T22:14:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。