論文の概要: Semi-supervised Learning with the EM Algorithm: A Comparative Study
between Unstructured and Structured Prediction
- arxiv url: http://arxiv.org/abs/2008.12442v1
- Date: Fri, 28 Aug 2020 02:20:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-24 01:30:52.593322
- Title: Semi-supervised Learning with the EM Algorithm: A Comparative Study
between Unstructured and Structured Prediction
- Title(参考訳): EMアルゴリズムを用いた半教師付き学習:非構造予測と構造予測の比較研究
- Authors: Wenchong He and Zhe Jiang
- Abstract要約: 半教師付き学習はラベル付きサンプルとラベルなしサンプルの両方から予測モデルを学ぶことを目的としている。
EMに基づく半教師付き学習に関する既存の文献は、主に非構造化予測に焦点を当てている。
本稿では,EMに基づく半教師あり学習における非構造的手法と構造的手法を比較した。
- 参考スコア(独自算出の注目度): 8.944068453789752
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Semi-supervised learning aims to learn prediction models from both labeled
and unlabeled samples. There has been extensive research in this area. Among
existing work, generative mixture models with Expectation-Maximization (EM) is
a popular method due to clear statistical properties. However, existing
literature on EM-based semi-supervised learning largely focuses on unstructured
prediction, assuming that samples are independent and identically distributed.
Studies on EM-based semi-supervised approach in structured prediction is
limited. This paper aims to fill the gap through a comparative study between
unstructured and structured methods in EM-based semi-supervised learning.
Specifically, we compare their theoretical properties and find that both
methods can be considered as a generalization of self-training with soft class
assignment of unlabeled samples, but the structured method additionally
considers structural constraint in soft class assignment. We conducted a case
study on real-world flood mapping datasets to compare the two methods. Results
show that structured EM is more robust to class confusion caused by noise and
obstacles in features in the context of the flood mapping application.
- Abstract(参考訳): 半教師付き学習はラベル付きサンプルとラベルなしサンプルの両方から予測モデルを学ぶことを目的としている。
この地域では広範な研究が行われている。
既存の研究の中で、予測最大化(EM)を用いた生成混合モデルは、明確な統計的性質のために一般的な方法である。
しかし、EMに基づく半教師付き学習に関する既存の文献は、サンプルが独立で同一に分布していると仮定して、非構造化予測に主に焦点をあてている。
構造予測におけるem-based semi-supervised approachの研究は限られている。
本稿では,emベース半教師付き学習における非構造化法と構造化法の比較研究を通じて,このギャップを埋めることを目的とする。
具体的には, それらの理論特性を比較検討した結果, いずれの手法も非ラベル標本のソフトクラス割当てと自己学習の一般化と見なすことができるが, ソフトクラス割当てでは構造制約も考慮している。
実世界の洪水マッピングデータセットのケーススタディを行い,その2つの手法を比較した。
その結果,フラッディングマッピングアプリケーションのコンテキストにおけるノイズや機能障害によるクラス混乱に対して,構造化emはより頑健であることが判明した。
関連論文リスト
- Querying Easily Flip-flopped Samples for Deep Active Learning [63.62397322172216]
アクティブラーニング(英: Active Learning)は、ラベルのないデータを戦略的に選択してクエリすることで、モデルの性能を向上させることを目的とした機械学習パラダイムである。
効果的な選択戦略の1つはモデルの予測の不確実性に基づくもので、サンプルがどの程度情報的であるかの尺度として解釈できる。
本稿では,予測されたラベルの不一致の最小確率として,最小不一致距離(LDM)を提案する。
論文 参考訳(メタデータ) (2024-01-18T08:12:23Z) - Prototype-based Aleatoric Uncertainty Quantification for Cross-modal
Retrieval [139.21955930418815]
クロスモーダル検索手法は、共通表現空間を共同学習することにより、視覚と言語モダリティの類似性関係を構築する。
しかし、この予測は、低品質なデータ、例えば、腐敗した画像、速いペースの動画、詳細でないテキストによって引き起こされるアレタリック不確実性のために、しばしば信頼性が低い。
本稿では, 原型に基づくAleatoric Uncertainity Quantification (PAU) フレームワークを提案する。
論文 参考訳(メタデータ) (2023-09-29T09:41:19Z) - Deep Metric Learning Assisted by Intra-variance in A Semi-supervised
View of Learning [0.0]
ディープ・メトリック・ラーニングは、異なるクラスのサンプルが互いに遠く離れているのに対して、同じクラスのサンプルが互いに近い埋め込み空間を構築することを目的としている。
本稿では,従来の教師付き深度学習のためのクラス内分散学習スキームの半教師付きビューを提供する自己教師付き生成支援ランキングフレームワークを設計する。
論文 参考訳(メタデータ) (2023-04-21T13:30:32Z) - Kernel Biclustering algorithm in Hilbert Spaces [8.303238963864885]
我々は,エネルギー距離と平均誤差の最大値という概念を用いて,抽象空間における新しいモデルフリー・ビクラスタリングアルゴリズムを開発した。
提案手法は,既存の文献よりも一般的で複雑なクラスタ形状を学習することができる。
提案手法は,カーネルの適切な選択を前提として,その最適シナリオにおける最先端手法と類似している。
論文 参考訳(メタデータ) (2022-08-07T08:41:46Z) - Semi-supervised Predictive Clustering Trees for (Hierarchical) Multi-label Classification [2.706328351174805]
本稿では,予測クラスタリング木の半教師付き学習に基づく階層型マルチラベル分類手法を提案する。
また,この手法をアンサンブル学習に拡張し,ランダムな森林アプローチに基づく手法を提案する。
論文 参考訳(メタデータ) (2022-07-19T12:49:00Z) - Leveraging Ensembles and Self-Supervised Learning for Fully-Unsupervised
Person Re-Identification and Text Authorship Attribution [77.85461690214551]
完全ラベル付きデータからの学習は、Person Re-IdentificationやText Authorship Attributionなどのマルチメディアフォレスト問題において困難である。
近年の自己教師型学習法は,基礎となるクラスに意味的差異が有る場合に,完全ラベル付きデータを扱う際に有効であることが示されている。
本研究では,異なるクラスからのサンプルが顕著に多様性を持っていない場合でも,ラベルのないデータから学習できるようにすることにより,個人再認識とテキストオーサシップの属性に対処する戦略を提案する。
論文 参考訳(メタデータ) (2022-02-07T13:08:11Z) - Optimal Ensemble Construction for Multi-Study Prediction with
Applications to COVID-19 Excess Mortality Estimation [7.02598981483736]
マルチスタディ・アンサンブルは、研究固有のモデルに適合し、アンサンブル重みを別々に推定する2段階戦略を用いる。
このアプローチは、モデル適合段階でのアンサンブル特性を無視し、効率を損なう可能性がある。
パンデミックの開始前にはほとんどデータが入手できない場合、他の国のデータを活用することで、予測精度が大幅に向上することを示した。
論文 参考訳(メタデータ) (2021-09-19T16:52:41Z) - Counterfactual Maximum Likelihood Estimation for Training Deep Networks [83.44219640437657]
深層学習モデルは、予測的手がかりとして学習すべきでない急激な相関を学習する傾向がある。
本研究では,観測可能な共同設立者による相関関係の緩和を目的とした因果関係に基づくトレーニングフレームワークを提案する。
自然言語推論(NLI)と画像キャプションという2つの実世界の課題について実験を行った。
論文 参考訳(メタデータ) (2021-06-07T17:47:16Z) - A comprehensive comparative evaluation and analysis of Distributional
Semantic Models [61.41800660636555]
我々は、静的DSMによって生成されたり、BERTによって生成された文脈化されたベクトルを平均化して得られるような、型分布ベクトルの包括的評価を行う。
その結果、予測ベースモデルの優越性は現実よりも明らかであり、ユビキタスではないことが明らかとなった。
我々は認知神経科学からRepresentational similarity Analysis(RSA)の方法論を借りて、分布モデルによって生成された意味空間を検査する。
論文 参考訳(メタデータ) (2021-05-20T15:18:06Z) - Robust Unsupervised Learning via L-Statistic Minimization [38.49191945141759]
教師なし学習に焦点をあて、この問題に対する一般的なアプローチを提示する。
重要な仮定は、摂動分布は、許容モデルの特定のクラスに対するより大きな損失によって特徴付けられることである。
教師なし学習におけるいくつかのポピュラーモデルに対する提案基準に関して,一様収束境界を証明した。
論文 参考訳(メタデータ) (2020-12-14T10:36:06Z) - Revisiting LSTM Networks for Semi-Supervised Text Classification via
Mixed Objective Function [106.69643619725652]
我々は,単純なBiLSTMモデルであっても,クロスエントロピー損失でトレーニングした場合に,競争的な結果が得られるようなトレーニング戦略を開発する。
いくつかのベンチマークデータセット上で,テキスト分類タスクの最先端結果について報告する。
論文 参考訳(メタデータ) (2020-09-08T21:55:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。