論文の概要: Probabilistic Digital Twins of Users: Latent Representation Learning with Statistically Validated Semantics
- arxiv url: http://arxiv.org/abs/2512.18056v1
- Date: Fri, 19 Dec 2025 20:49:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-23 18:54:32.16846
- Title: Probabilistic Digital Twins of Users: Latent Representation Learning with Statistically Validated Semantics
- Title(参考訳): ユーザの確率論的デジタル双対:統計的に検証されたセマンティックスを用いた潜在表現学習
- Authors: Daniel David,
- Abstract要約: ユーザのアイデンティティと行動を理解することは、パーソナライゼーションやレコメンデーション、意思決定支援といったアプリケーションの中心である。
本稿では,各ユーザが観測された行動データを生成する潜在状態としてモデル化される確率論的ディジタルツインフレームワークを提案する。
ユーザアイデンティティの安定した側面をキャプチャするために設計されたユーザ応答データセットに適用された可変オートエンコーダ(VAE)を用いて、このフレームワークをインスタンス化する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Understanding user identity and behavior is central to applications such as personalization, recommendation, and decision support. Most existing approaches rely on deterministic embeddings or black-box predictive models, offering limited uncertainty quantification and little insight into what latent representations encode. We propose a probabilistic digital twin framework in which each user is modeled as a latent stochastic state that generates observed behavioral data. The digital twin is learned via amortized variational inference, enabling scalable posterior estimation while retaining a fully probabilistic interpretation. We instantiate this framework using a variational autoencoder (VAE) applied to a user-response dataset designed to capture stable aspects of user identity. Beyond standard reconstruction-based evaluation, we introduce a statistically grounded interpretation pipeline that links latent dimensions to observable behavioral patterns. By analyzing users at the extremes of each latent dimension and validating differences using nonparametric hypothesis tests and effect sizes, we demonstrate that specific dimensions correspond to interpretable traits such as opinion strength and decisiveness. Empirically, we find that user structure is predominantly continuous rather than discretely clustered, with weak but meaningful structure emerging along a small number of dominant latent axes. These results suggest that probabilistic digital twins can provide interpretable, uncertainty-aware representations that go beyond deterministic user embeddings.
- Abstract(参考訳): ユーザのアイデンティティと行動を理解することは、パーソナライゼーションやレコメンデーション、意思決定支援といったアプリケーションの中心である。
既存のほとんどのアプローチは決定論的埋め込みやブラックボックス予測モデルに依存しており、不確実な定量化が限られており、潜在表現が何を符号化するかについての洞察がほとんどない。
本稿では,各ユーザが観測された行動データを生成する潜在確率状態としてモデル化される確率論的ディジタルツインフレームワークを提案する。
ディジタルツインは、償却変分推論によって学習され、完全に確率論的解釈を維持しながら、スケーラブルな後続推定を可能にする。
このフレームワークを,ユーザアイデンティティの安定した側面を捉えるために設計されたユーザ応答データセットに適用した可変オートエンコーダ(VAE)を用いてインスタンス化する。
標準的な再構成に基づく評価の他に、潜在次元と観測可能な行動パターンを結びつける統計的に基底化された解釈パイプラインを導入する。
非パラメトリックな仮説テストと効果サイズを用いて、各潜伏次元の極端におけるユーザを分析し、差異を検証することにより、特定の次元が意見の強さや決定性などの解釈可能な特性に対応していることを示す。
経験的に、ユーザ構造は離散的なクラスタ化ではなく、主に連続的であり、少数の支配的な潜在軸に沿って弱いが有意義な構造が現れる。
これらの結果は,確率論的ディジタル双生児が,決定論的ユーザ埋め込みを超えて,解釈可能な不確実性を考慮した表現を提供できることを示唆している。
関連論文リスト
- Individualised Counterfactual Examples Using Conformal Prediction Intervals [12.895240620484572]
機械学習の分類モデルに典型的な高次元の特徴空間は、決定に多くの反実例を許容する。
我々は,個人の知識を明示的にモデル化し,共形予測間隔の幅によって個人が行う予測の不確実性を評価する。
ハイパーキューブ上に合成データセットを配置し、決定境界を完全に視覚化する。
第2に、この合成データセットにおいて、1つのCPICFが、元のクエリの周囲の個々の知識に与える影響を探索する。
論文 参考訳(メタデータ) (2025-05-28T13:13:52Z) - The diameter of a stochastic matrix: A new measure for sensitivity analysis in Bayesian networks [1.2699007098398807]
我々は、慣れ親しんだ全変動距離に基づくロバストネス法は、不特定性に対するロバストネスに、よりシンプルで価値のある境界をもたらすと論じる。
このような境界を導出するために、直径と呼ばれる条件付き確率表への依存の新たな尺度を導入する。
論文 参考訳(メタデータ) (2024-07-05T17:22:12Z) - I Bet You Did Not Mean That: Testing Semantic Importance via Betting [8.909843275476264]
我々は、条件付き独立性を用いて不透明モデルの予測に対する意味論的概念のグローバル(すなわち人口以上)とローカル(すなわちサンプル)の統計的重要性を定式化する。
我々は、シーケンシャルなカーネル化独立テストという最近の考え方を用いて、概念間の重要度を誘導し、我々のフレームワークの有効性と柔軟性を示す。
論文 参考訳(メタデータ) (2024-05-29T14:51:41Z) - Bayesian Hierarchical Models for Counterfactual Estimation [12.159830463756341]
本稿では,多種多様なカウンターファクトの集合を推定する確率的パラダイムを提案する。
摂動を事前分布関数によるランダム変数として扱う。
収束特性の優れた勾配ベースサンプリング器は、後方サンプルを効率的に計算する。
論文 参考訳(メタデータ) (2023-01-21T00:21:11Z) - Bayesian Networks for the robust and unbiased prediction of depression
and its symptoms utilizing speech and multimodal data [65.28160163774274]
我々は,抑うつ,抑うつ症状,および,胸腺で収集された音声,表情,認知ゲームデータから得られる特徴の関連性を把握するためにベイズ的枠組みを適用した。
論文 参考訳(メタデータ) (2022-11-09T14:48:13Z) - Exploring the Trade-off between Plausibility, Change Intensity and
Adversarial Power in Counterfactual Explanations using Multi-objective
Optimization [73.89239820192894]
自動対物生成は、生成した対物インスタンスのいくつかの側面を考慮すべきである。
本稿では, 対実例生成のための新しい枠組みを提案する。
論文 参考訳(メタデータ) (2022-05-20T15:02:53Z) - Uncertainty Modeling for Out-of-Distribution Generalization [56.957731893992495]
特徴統計を適切に操作することで、ディープラーニングモデルの一般化能力を向上させることができると論じる。
一般的な手法では、特徴統計を学習した特徴から測定された決定論的値とみなすことが多い。
我々は、学習中に合成された特徴統計を用いて、領域シフトの不確かさをモデル化することにより、ネットワークの一般化能力を向上させる。
論文 参考訳(メタデータ) (2022-02-08T16:09:12Z) - NUQ: Nonparametric Uncertainty Quantification for Deterministic Neural
Networks [151.03112356092575]
本研究では,Nadaraya-Watson の条件付きラベル分布の非パラメトリック推定に基づく分類器の予測の不確かさの測定方法を示す。
種々の実世界の画像データセットにおける不確実性推定タスクにおいて,本手法の強い性能を示す。
論文 参考訳(メタデータ) (2022-02-07T12:30:45Z) - Where and What? Examining Interpretable Disentangled Representations [96.32813624341833]
解釈可能なバリエーションの獲得は、長い間、絡み合い学習の目標の1つだった。
独立性の仮定と異なり、解釈性は教師なしの設定での絡み合いを促進するために使われることは滅多にない。
本論文では, 解釈対象と解釈対象の2つの質問について検討し, 離散表現の解釈可能性を検討する。
論文 参考訳(メタデータ) (2021-04-07T11:22:02Z) - Learning Disentangled Representations with Latent Variation
Predictability [102.4163768995288]
本稿では,潜在不整合表現の変動予測可能性について述べる。
逆生成プロセス内では、潜時変動と対応する画像対の相互情報を最大化することにより、変動予測可能性を高める。
本研究では,潜在表現の絡み合いを測るために,基礎的構造的生成因子に依存しない評価指標を開発する。
論文 参考訳(メタデータ) (2020-07-25T08:54:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。