論文の概要: On the Semi-supervised Expectation Maximization
- arxiv url: http://arxiv.org/abs/2211.00537v1
- Date: Tue, 1 Nov 2022 15:42:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-02 13:26:21.317765
- Title: On the Semi-supervised Expectation Maximization
- Title(参考訳): 半教師付き期待最大化について
- Authors: Erixhen Sula and Lizhong Zheng
- Abstract要約: ラベル付きおよびラベルなしサンプルからモデルを学習するための半教師付きケースに焦点を当てる。
本分析は, 指数族混合モデルにおいて, ラベル付き試料が収束率をいかに向上させるかを明らかにした。
- 参考スコア(独自算出の注目度): 5.481082183778667
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The Expectation Maximization (EM) algorithm is widely used as an iterative
modification to maximum likelihood estimation when the data is incomplete. We
focus on a semi-supervised case to learn the model from labeled and unlabeled
samples. Existing work in the semi-supervised case has focused mainly on
performance rather than convergence guarantee, however we focus on the
contribution of the labeled samples to the convergence rate. The analysis
clearly demonstrates how the labeled samples improve the convergence rate for
the exponential family mixture model. In this case, we assume that the
population EM (EM with unlimited data) is initialized within the neighborhood
of global convergence for the population EM that consists solely of samples
that have not been labeled. The analysis for the labeled samples provides a
comprehensive description of the convergence rate for the Gaussian mixture
model. In addition, we extend the findings for labeled samples and offer an
alternative proof for the population EM's convergence rate with unlabeled
samples for the symmetric mixture of two Gaussians.
- Abstract(参考訳): 予測最大化(EM)アルゴリズムは、データが不完全である場合の最大推定を反復修正するために広く用いられている。
ラベル付きおよびラベルなしサンプルからモデルを学習するための半教師付きケースに焦点を当てる。
半教師付きケースにおける既存の作業は,収束保証よりも性能に重点を置いてきたが,ラベル付きサンプルの収束率への寄与に注目した。
本分析は, 指数族混合モデルにおいて, ラベル付き試料が収束率をいかに向上させるかを明らかにした。
この場合、ラベル付けされていないサンプルのみからなる人口EMに対して、人口EM(無制限データ付きEM)がグローバル収束の近傍で初期化されていると仮定する。
ラベル付きサンプルの解析は、ガウス混合モデルの収束率の包括的記述を提供する。
さらに, 2つのガウスの対称混合に対して, ラベル付き試料の発見を拡張し, 未ラベル試料を用いた集団EMの収束率の代替的証明を行う。
関連論文リスト
- Efficiently learning and sampling multimodal distributions with data-based initialization [20.575122468674536]
静止測度から少数のサンプルを与えられたマルコフ連鎖を用いて多重モーダル分布をサンプリングする問題を考察する。
マルコフ連鎖が$k$dのスペクトルギャップを持つ場合、静止分布からのサンプルは、静止測度からテレビ距離において$varepsilon$-closeの条件法則を持つサンプルを効率よく生成する。
論文 参考訳(メタデータ) (2024-11-14T01:37:02Z) - Theory on Score-Mismatched Diffusion Models and Zero-Shot Conditional Samplers [49.97755400231656]
本報告では,明示的な次元の一般スコアミスマッチ拡散サンプリング器を用いた最初の性能保証について述べる。
その結果, スコアミスマッチは, 目標分布とサンプリング分布の分布バイアスとなり, 目標分布とトレーニング分布の累積ミスマッチに比例することがわかった。
この結果は、測定ノイズに関係なく、任意の条件モデルに対するゼロショット条件付きサンプリングに直接適用することができる。
論文 参考訳(メタデータ) (2024-10-17T16:42:12Z) - On diffusion-based generative models and their error bounds: The log-concave case with full convergence estimates [5.13323375365494]
我々は,強い対数対数データの下での拡散に基づく生成モデルの収束挙動を理論的に保証する。
スコア推定に使用される関数のクラスは、スコア関数上のリプシッツネスの仮定を避けるために、リプシッツ連続関数からなる。
この手法はサンプリングアルゴリズムにおいて最もよく知られた収束率をもたらす。
論文 参考訳(メタデータ) (2023-11-22T18:40:45Z) - On semi-supervised estimation using exponential tilt mixture models [12.347498345854715]
バイナリ応答と予測器のラベル付きデータセットと、予測器のみのラベル付きデータセットによる半教師付き設定を考えてみましょう。
半教師付き推定のために,指数傾斜混合(ETM)モデルを用いた統計的アプローチのさらなる解析と理解を開発する。
論文 参考訳(メタデータ) (2023-11-14T19:53:26Z) - Out-Of-Domain Unlabeled Data Improves Generalization [0.7589678255312519]
本稿では,ラベルなしデータを半教師付き分類問題に組み込む新しい枠組みを提案する。
ラベルのないサンプルは一般化ギャップを狭めるために利用できることを示す。
我々は、さまざまな合成および実世界のデータセットで実施された実験を通じて、我々の主張を検証する。
論文 参考訳(メタデータ) (2023-09-29T02:00:03Z) - Detecting Adversarial Data by Probing Multiple Perturbations Using
Expected Perturbation Score [62.54911162109439]
逆方向検出は、自然分布と逆方向分布の差に基づいて、与えられたサンプルが逆方向であるかどうかを判定することを目的としている。
本研究では,様々な摂動後の標本の予測スコアであるEPS(pre expected perturbation score)を提案する。
EPSに基づく最大平均誤差(MMD)を,試験試料と自然試料との差を測定する指標として開発する。
論文 参考訳(メタデータ) (2023-05-25T13:14:58Z) - Convergence for score-based generative modeling with polynomial
complexity [9.953088581242845]
我々は、Scoreベースの生成モデルの背後にあるコアメカニックに対する最初の収束保証を証明した。
以前の作品と比較すると、時間的に指数関数的に増加するエラーや、次元の呪いに苦しむエラーは発生しない。
予測器・相関器はどちらの部分のみを使用するよりも収束性が高いことを示す。
論文 参考訳(メタデータ) (2022-06-13T14:57:35Z) - A Robust and Flexible EM Algorithm for Mixtures of Elliptical
Distributions with Missing Data [71.9573352891936]
本稿では、ノイズや非ガウス的なデータに対するデータ計算の欠如に対処する。
楕円分布と潜在的な欠落データを扱う特性を混合した新しいEMアルゴリズムについて検討した。
合成データの実験的結果は,提案アルゴリズムが外れ値に対して頑健であり,非ガウスデータで使用可能であることを示す。
論文 参考訳(メタデータ) (2022-01-28T10:01:37Z) - Saliency Grafting: Innocuous Attribution-Guided Mixup with Calibrated
Label Mixing [104.630875328668]
ミックスアップスキームは、強化されたトレーニングサンプルを作成するために、サンプルのペアを混ぜることを提案する。
両世界のベストを捉えた、斬新だがシンプルなミックスアップ版を提示する。
論文 参考訳(メタデータ) (2021-12-16T11:27:48Z) - Spectral clustering under degree heterogeneity: a case for the random
walk Laplacian [83.79286663107845]
本稿では,ランダムウォークラプラシアンを用いたグラフスペクトル埋め込みが,ノード次数に対して完全に補正されたベクトル表現を生成することを示す。
次数補正ブロックモデルの特別な場合、埋め込みはK個の異なる点に集中し、コミュニティを表す。
論文 参考訳(メタデータ) (2021-05-03T16:36:27Z) - Generative Modeling with Denoising Auto-Encoders and Langevin Sampling [88.83704353627554]
DAEとDSMの両方がスムーズな人口密度のスコアを推定することを示した。
次に、この結果をarXiv:1907.05600のホモトピー法に適用し、その経験的成功を理論的に正当化する。
論文 参考訳(メタデータ) (2020-01-31T23:50:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。