論文の概要: Learning from missing data with the Latent Block Model
- arxiv url: http://arxiv.org/abs/2010.12222v1
- Date: Fri, 23 Oct 2020 08:11:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-03 22:18:15.604920
- Title: Learning from missing data with the Latent Block Model
- Title(参考訳): 潜在ブロックモデルを用いた欠落データからの学習
- Authors: Gabriel Frisch (Heudiasyc), Jean-Benoist L\'eger (Heudiasyc), Yves
Grandvalet (Heudiasyc)
- Abstract要約: 本研究では、ランダムなデータに欠かせないデータを活用することを目的としたLatent Block Modelに基づくクラスタリングモデルを提案する。
予測最大化アルゴリズムを導出して推論を行い、モデル選択基準を示す。
- 参考スコア(独自算出の注目度): 0.5735035463793007
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Missing data can be informative. Ignoring this information can lead to
misleading conclusions when the data model does not allow information to be
extracted from the missing data. We propose a co-clustering model, based on the
Latent Block Model, that aims to take advantage of this nonignorable
nonresponses, also known as Missing Not At Random data (MNAR). A variational
expectation-maximization algorithm is derived to perform inference and a model
selection criterion is presented. We assess the proposed approach on a
simulation study, before using our model on the voting records from the lower
house of the French Parliament, where our analysis brings out relevant groups
of MPs and texts, together with a sensible interpretation of the behavior of
non-voters.
- Abstract(参考訳): データの欠落は有益である。
この情報を無視すると、データモデルが欠落したデータから情報を抽出できない場合、誤った結論につながる可能性がある。
我々は,無作為データ(mnar)における欠落(missing not at random data)として知られる,非無視的な非応答の活用を目的とした,潜在ブロックモデルに基づく共クラスタモデルを提案する。
変分期待最大化アルゴリズムを導出して推論を行い、モデル選択基準を提示する。
提案手法をシミュレーション実験で評価し,フランス議会の議決記録をモデルとし,非投票者の行動の賢明な解釈とともに,関連する議員グループとテキストを提示する手法について検討した。
関連論文リスト
- Data-driven Bayesian State Estimation with Compressed Measurement of Model-free Process using Semi-supervised Learning [57.04370580292727]
研究テーマは、圧縮測定によるデータ駆動ベイズ状態推定である。
状態の基本的な力学モデルは未知であると仮定される。
既存の2つの教師なし学習ベースのデータ駆動手法は、BSCMの問題に対処できない。
論文 参考訳(メタデータ) (2024-07-10T05:03:48Z) - Diffusion posterior sampling for simulation-based inference in tall data settings [53.17563688225137]
シミュレーションベース推論(SBI)は、入力パラメータを所定の観測に関連付ける後部分布を近似することができる。
本研究では、モデルのパラメータをより正確に推測するために、複数の観測値が利用できる、背の高いデータ拡張について考察する。
提案手法を,最近提案した各種数値実験の競合手法と比較し,数値安定性と計算コストの観点から,その優位性を実証した。
論文 参考訳(メタデータ) (2024-04-11T09:23:36Z) - Querying Easily Flip-flopped Samples for Deep Active Learning [63.62397322172216]
アクティブラーニング(英: Active Learning)は、ラベルのないデータを戦略的に選択してクエリすることで、モデルの性能を向上させることを目的とした機械学習パラダイムである。
効果的な選択戦略の1つはモデルの予測の不確実性に基づくもので、サンプルがどの程度情報的であるかの尺度として解釈できる。
本稿では,予測されたラベルの不一致の最小確率として,最小不一致距離(LDM)を提案する。
論文 参考訳(メタデータ) (2024-01-18T08:12:23Z) - Identification and Estimation for Nonignorable Missing Data: A Data
Fusion Approach [16.57879794516524]
MNAR(MNAR)では、データの欠落した設定において、興味のあるパラメータを特定し、推定するタスクについて検討する。
本稿では、MNARデータセットの情報を、ランダムな無作為(MAR)に基づく補助データセットの情報によって拡張する、別のアプローチをとる。
同定されたパラメータに対する逆確率重み付き(IPW)推定器を導出し,シミュレーション研究およびデータアプリケーションを用いて推定手法の性能を評価する。
論文 参考訳(メタデータ) (2023-11-15T14:57:20Z) - Assessing Privacy Risks in Language Models: A Case Study on
Summarization Tasks [65.21536453075275]
我々は要約作業に焦点をあて、会員推測(MI)攻撃について調査する。
テキストの類似性や文書修正に対するモデルの抵抗をMI信号として活用する。
我々は、MI攻撃から保護するための要約モデルの訓練と、プライバシとユーティリティの本質的にのトレードオフについて議論する。
論文 参考訳(メタデータ) (2023-10-20T05:44:39Z) - ALUM: Adversarial Data Uncertainty Modeling from Latent Model
Uncertainty Compensation [25.67258563807856]
本稿では,モデル不確実性とデータ不確実性を扱うALUMという新しい手法を提案する。
提案するALUMはモデルに依存しないため,オーバーヘッドの少ない既存のディープモデルに容易に実装できる。
論文 参考訳(メタデータ) (2023-03-29T17:24:12Z) - Learning from aggregated data with a maximum entropy model [73.63512438583375]
我々は,観測されていない特徴分布を最大エントロピー仮説で近似することにより,ロジスティック回帰と類似した新しいモデルが,集約データからのみ学習されることを示す。
我々は、この方法で学習したモデルが、完全な非凝集データでトレーニングされたロジスティックモデルに匹敵するパフォーマンスを達成することができるという、いくつかの公開データセットに関する実証的な証拠を提示する。
論文 参考訳(メタデータ) (2022-10-05T09:17:27Z) - Model-based Clustering with Missing Not At Random Data [0.8777702580252754]
我々は,MNARデータを含む,非常に一般的なタイプの欠落データを扱うために設計されたモデルベースのクラスタリングアルゴリズムを提案する。
いくつかのMNARモデルについて議論し、不足の原因は、欠落変数自体の値とクラスメンバーシップの両方に依存する。
MNARzと呼ばれる特定のMNARモデルに注目する。
論文 参考訳(メタデータ) (2021-12-20T09:52:12Z) - MINIMALIST: Mutual INformatIon Maximization for Amortized Likelihood
Inference from Sampled Trajectories [61.3299263929289]
シミュレーションベースの推論は、その可能性が実際に計算できない場合でもモデルのパラメータを学習することができる。
あるクラスのメソッドは、異なるパラメータでシミュレートされたデータを使用して、確率とエビデンス比の償却推定器を推定する。
モデルパラメータとシミュレーションデータ間の相互情報の観点から,本手法が定式化可能であることを示す。
論文 参考訳(メタデータ) (2021-06-03T12:59:16Z) - Deep Generative Pattern-Set Mixture Models for Nonignorable Missingness [0.0]
無視できないデータと無視できないデータの両方をモデル化する可変オートエンコーダアーキテクチャを提案する。
モデルでは,観測されたデータと欠落マスクに基づいて,欠落したデータを欠落パターンにクラスタ化することを明示的に学習する。
当社のセットアップでは,無知かつ無知な欠如の特性をトレードオフすることで,両タイプのデータに適用することが可能である。
論文 参考訳(メタデータ) (2021-03-05T08:21:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。