論文の概要: Diverse Dictionary Learning
- arxiv url: http://arxiv.org/abs/2604.17568v1
- Date: Sun, 19 Apr 2026 18:18:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.586982
- Title: Diverse Dictionary Learning
- Title(参考訳): ディバース辞書学習
- Authors: Yujia Zheng, Zijian Li, Shunxing Fan, Andrew Gordon Wilson, Kun Zhang,
- Abstract要約: 観測データ$X = g(Z)$のみを与えられた場合、潜伏変数$Z$と生成プロセス$g$は未知であり、追加の仮定なしで$Z$を回収することは誤りである。
我々は、任意の観測に関連付けられた潜伏変数の交叉、補間、対称的な相違と、観測される潜伏変数の依存関係構造が、いまだ適切な不確定性まで同定可能であることを示す。
- 参考スコア(独自算出の注目度): 47.381311762862985
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Given only observational data $X = g(Z)$, where both the latent variables $Z$ and the generating process $g$ are unknown, recovering $Z$ is ill-posed without additional assumptions. Existing methods often assume linearity or rely on auxiliary supervision and functional constraints. However, such assumptions are rarely verifiable in practice, and most theoretical guarantees break down under even mild violations, leaving uncertainty about how to reliably understand the hidden world. To make identifiability actionable in the real-world scenarios, we take a complementary view: in the general settings where full identifiability is unattainable, what can still be recovered with guarantees, and what biases could be universally adopted? We introduce the problem of diverse dictionary learning to formalize this view. Specifically, we show that intersections, complements, and symmetric differences of latent variables linked to arbitrary observations, along with the latent-to-observed dependency structure, are still identifiable up to appropriate indeterminacies even without strong assumptions. These set-theoretic results can be composed using set algebra to construct structured and essential views of the hidden world, such as genus-differentia definitions. When sufficient structural diversity is present, they further imply full identifiability of all latent variables. Notably, all identifiability benefits follow from a simple inductive bias during estimation that can be readily integrated into most models. We validate the theory and demonstrate the benefits of the bias on both synthetic and real-world data.
- Abstract(参考訳): 観測データ$X = g(Z)$のみを与えられた場合、潜伏変数$Z$と生成プロセス$g$は未知であり、追加の仮定なしで$Z$を回収することは誤りである。
既存の手法は、しばしば線形性を前提とするか、補助的な監督と機能的制約に依存している。
しかし、そのような仮定は実際に検証されることはめったになく、ほとんどの理論的保証は、たとえ軽微な違反でも破られ、隠れた世界を確実に理解する方法に関する不確実性を残している。
現実のシナリオで識別可能性を有効にするために、私たちは補完的な見解を取る:完全な識別可能性が達成不可能な一般的な設定では、保証によって何がまだ回復可能で、どんなバイアスが普遍的に採用できるのか?
この見解を定式化するために,多種多様な辞書学習の問題を導入する。
具体的には、任意の観測に関連付けられた潜伏変数の交叉、補間、対称的な相違が、強い仮定なしでも適切な不確定性まで同定可能であることを示す。
これらの集合論的な結果は、属微分の定義のような隠された世界の構造的および本質的なビューを構築するために集合代数を用いて構成することができる。
十分な構造的多様性が存在する場合、それらはさらに全ての潜伏変数の完全な識別可能性を示す。
特に、すべての識別可能性の利点は、ほとんどのモデルに容易に統合できる単純な帰納的バイアスから導かれる。
我々は、この理論を検証し、合成データと実世界のデータの両方に対するバイアスの利点を実証する。
関連論文リスト
- Characterizing Online and Private Learnability under Distributional Constraints via Generalized Smoothness [63.833913892018536]
本研究では、固定されたファミリー$U$からデータ生成分布を適応的に選択できる分布敵の下でのシーケンシャルな意思決定について検討する。
一般化滑らか性(Generalized smoothness)という概念の観点で学習可能性を認めるファミリー$U$のほぼ完全な特徴付けを提供する。
一般化された滑らかさは,分布制約下での個人学習性も特徴付けることを示す。
論文 参考訳(メタデータ) (2026-02-24T06:15:59Z) - Partial Feedback Online Learning [88.27143767009376]
我々は、偏見フィードバックオンライン学習と呼ばれる新しい学習プロトコルについて研究する。
各インスタンスは許容できるラベルのセットを許可するが、学習者は1ラウンドごとに許容できるラベルを1つだけ観察する。
論文 参考訳(メタデータ) (2026-01-29T09:39:11Z) - Detecting and Identifying Selection Structure in Sequential Data [53.24493902162797]
我々は,音楽のシーケンスなどの実践的な状況において,潜在目的に基づくデータポイントの選択的包摂が一般的である,と論じる。
選択構造はパラメトリックな仮定や介入実験なしで識別可能であることを示す。
また、他の種類の依存関係と同様に、選択構造を検知し、識別するための証明可能な正当性アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-06-29T20:56:34Z) - Learning Discrete Latent Variable Structures with Tensor Rank Conditions [30.292492090200984]
観測されていない離散データは、多くの科学分野においてユビキタスであり、これらの潜伏変数の因果構造を学習する方法は、データパターンを明らかにするために不可欠である。
ほとんどの研究は線形潜在変数モデルに焦点を当てたり、非線型関係や複素潜在構造を含む離散データにおけるケースに対処できない潜在構造に厳密な制約を課す。
観測変数集合 $mathbfX_p$ に対するテンソル階数条件を探索し、その階数が特定の条件集合の最小サポートによって決定されることを示す。
異なる観測変数のランクを探索することで、潜伏変数を特定できる。
論文 参考訳(メタデータ) (2024-06-11T07:25:17Z) - A Robustness Analysis of Blind Source Separation [91.3755431537592]
ブラインドソース分離(BSS)は、変換$f$が可逆であるが未知であるという条件の下で、その混合である$X=f(S)$から観測されていない信号を復元することを目的としている。
このような違反を分析し、その影響を$X$から$S$のブラインドリカバリに与える影響を定量化するための一般的なフレームワークを提案する。
定義された構造的仮定からの偏差に対する一般的なBSS溶出は、明示的な連続性保証という形で、利益的に分析可能であることを示す。
論文 参考訳(メタデータ) (2023-03-17T16:30:51Z) - Weakly Supervised Representation Learning with Sparse Perturbations [82.39171485023276]
潜伏変数のスパース摂動によって生じる観測の監督が弱い場合、未知の連続潜伏分布の下で識別が達成可能であることを示す。
本稿では,この理論に基づく自然な推定手法を提案し,それを低次元の合成および画像に基づく実験で説明する。
論文 参考訳(メタデータ) (2022-06-02T15:30:07Z) - Diverse, Global and Amortised Counterfactual Explanations for
Uncertainty Estimates [31.241489953967694]
このような集合の多様性を研究し、多くの CLUE が冗長であることを示す。
そこで我々は,不確実な入力の特定のグループに対する償却写像を学習する,GLobal AMortized CLUE (GLAM-CLUE) を提案する。
実験の結果,$delta$-CLUE,$nabla$-CLUE,およびGLAM-CLUEはすべて,CLUEの欠点に対処し,不確実性推定を実践者に有益に説明できることを示した。
論文 参考訳(メタデータ) (2021-12-05T18:27:21Z) - Nonlinear Invariant Risk Minimization: A Causal Approach [5.63479133344366]
非線形環境下での分布外一般化を可能にする学習パラダイムを提案する。
我々は、非常に単純な変換までデータ表現の識別性を示す。
合成データと実世界のデータセットの両方に関する広範な実験は、我々のアプローチが様々なベースラインメソッドを大きく上回っていることを示している。
論文 参考訳(メタデータ) (2021-02-24T15:38:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。