Fugu-MT 論文翻訳(概要): Learning from missing data with the Latent Block Model

論文の概要: Learning from missing data with the Latent Block Model

arxiv url: http://arxiv.org/abs/2010.12222v1
Date: Fri, 23 Oct 2020 08:11:43 GMT
ステータス: 翻訳完了
システム内更新日: 2022-10-03 22:18:15.604920
Title: Learning from missing data with the Latent Block Model
Title（参考訳）: 潜在ブロックモデルを用いた欠落データからの学習
Authors: Gabriel Frisch (Heudiasyc), Jean-Benoist L\'eger (Heudiasyc), Yves Grandvalet (Heudiasyc)
Abstract要約: 本研究では、ランダムなデータに欠かせないデータを活用することを目的としたLatent Block Modelに基づくクラスタリングモデルを提案する。予測最大化アルゴリズムを導出して推論を行い、モデル選択基準を示す。
参考スコア（独自算出の注目度）: 0.5735035463793007
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Missing data can be informative. Ignoring this information can lead to misleading conclusions when the data model does not allow information to be extracted from the missing data. We propose a co-clustering model, based on the Latent Block Model, that aims to take advantage of this nonignorable nonresponses, also known as Missing Not At Random data (MNAR). A variational expectation-maximization algorithm is derived to perform inference and a model selection criterion is presented. We assess the proposed approach on a simulation study, before using our model on the voting records from the lower house of the French Parliament, where our analysis brings out relevant groups of MPs and texts, together with a sensible interpretation of the behavior of non-voters.
Abstract（参考訳）: データの欠落は有益である。この情報を無視すると、データモデルが欠落したデータから情報を抽出できない場合、誤った結論につながる可能性がある。我々は,無作為データ(mnar)における欠落(missing not at random data)として知られる,非無視的な非応答の活用を目的とした,潜在ブロックモデルに基づく共クラスタモデルを提案する。変分期待最大化アルゴリズムを導出して推論を行い、モデル選択基準を提示する。提案手法をシミュレーション実験で評価し,フランス議会の議決記録をモデルとし,非投票者の行動の賢明な解釈とともに,関連する議員グループとテキストを提示する手法について検討した。

関連論文リスト

From Data to Behavior: Predicting Unintended Model Behaviors Before Training [78.37660873165284]
トレーニング前に意図しないモデルの振る舞いを予測する新しいタスクであるData2Behaviorを紹介する。また,その平均表現を通して候補データを要約する軽量な手法として,MDF(Manipulating Data Features)を提案する。 Qwen3-14B、Qwen2.5-32B-Instruct、Gemma-3-12b-itの実験では、MDFは意図しない振る舞いを予測でき、事前訓練済みの脆弱性に関する洞察を与える。
論文参考訳（メタデータ） (2026-02-04T16:37:17Z)
A Comprehensive Taxonomy of Negation for NLP and Neural Retrievers [61.086220009192424]
我々は、哲学的、言語的、論理的定義から派生した否定の分類を導入した。ニューラルネットワーク検索モデルの性能評価に使用できるベンチマークデータセットを2つ生成する。本稿では,既存のデータセットの検索モデルの性能を解析するために,論理に基づく分類機構を提案する。
論文参考訳（メタデータ） (2025-07-30T02:44:20Z)
Recursive Equations For Imputation Of Missing Not At Random Data With Sparse Pattern Support [8.863778901027061]
データ分析パイプラインで欠落した値を処理するための一般的なアプローチは、ソフトウェアパッケージによる複数の命令である。我々は、欠落したデータのグラフィカルモデルにおける全データ法則の新たな特徴付けを開発する。 MISPRは、データがMARの場合、MICEに匹敵する結果を得るが、MNARの場合、より優れ、バイアスの少ない結果が得られる。
論文参考訳（メタデータ） (2025-07-21T23:18:36Z)
Diffusion posterior sampling for simulation-based inference in tall data settings [53.17563688225137]
シミュレーションベース推論(SBI)は、入力パラメータを所定の観測に関連付ける後部分布を近似することができる。本研究では、モデルのパラメータをより正確に推測するために、複数の観測値が利用できる、背の高いデータ拡張について考察する。提案手法を,最近提案した各種数値実験の競合手法と比較し,数値安定性と計算コストの観点から,その優位性を実証した。
論文参考訳（メタデータ） (2024-04-11T09:23:36Z)
Querying Easily Flip-flopped Samples for Deep Active Learning [63.62397322172216]
アクティブラーニング(英: Active Learning)は、ラベルのないデータを戦略的に選択してクエリすることで、モデルの性能を向上させることを目的とした機械学習パラダイムである。効果的な選択戦略の1つはモデルの予測の不確実性に基づくもので、サンプルがどの程度情報的であるかの尺度として解釈できる。本稿では,予測されたラベルの不一致の最小確率として,最小不一致距離(LDM)を提案する。
論文参考訳（メタデータ） (2024-01-18T08:12:23Z)
Identification and Estimation for Nonignorable Missing Data: A Data Fusion Approach [16.57879794516524]
MNAR(MNAR)では、データの欠落した設定において、興味のあるパラメータを特定し、推定するタスクについて検討する。本稿では、MNARデータセットの情報を、ランダムな無作為(MAR)に基づく補助データセットの情報によって拡張する、別のアプローチをとる。同定されたパラメータに対する逆確率重み付き(IPW)推定器を導出し,シミュレーション研究およびデータアプリケーションを用いて推定手法の性能を評価する。
論文参考訳（メタデータ） (2023-11-15T14:57:20Z)
Assessing Privacy Risks in Language Models: A Case Study on Summarization Tasks [65.21536453075275]
我々は要約作業に焦点をあて、会員推測(MI)攻撃について調査する。テキストの類似性や文書修正に対するモデルの抵抗をMI信号として活用する。我々は、MI攻撃から保護するための要約モデルの訓練と、プライバシとユーティリティの本質的にのトレードオフについて議論する。
論文参考訳（メタデータ） (2023-10-20T05:44:39Z)
ALUM: Adversarial Data Uncertainty Modeling from Latent Model Uncertainty Compensation [25.67258563807856]
本稿では,モデル不確実性とデータ不確実性を扱うALUMという新しい手法を提案する。提案するALUMはモデルに依存しないため,オーバーヘッドの少ない既存のディープモデルに容易に実装できる。
論文参考訳（メタデータ） (2023-03-29T17:24:12Z)
Membership Inference Attacks against Synthetic Data through Overfitting Detection [84.02632160692995]
我々は、攻撃者が基礎となるデータ分布についてある程度の知識を持っていると仮定する現実的なMIA設定について論じる。生成モデルの局所的なオーバーフィッティングをターゲットとして,メンバシップを推論することを目的とした密度ベースMIAモデルであるDOMIASを提案する。
論文参考訳（メタデータ） (2023-02-24T11:27:39Z)
Learning from aggregated data with a maximum entropy model [73.63512438583375]
我々は,観測されていない特徴分布を最大エントロピー仮説で近似することにより,ロジスティック回帰と類似した新しいモデルが,集約データからのみ学習されることを示す。我々は、この方法で学習したモデルが、完全な非凝集データでトレーニングされたロジスティックモデルに匹敵するパフォーマンスを達成することができるという、いくつかの公開データセットに関する実証的な証拠を提示する。
論文参考訳（メタデータ） (2022-10-05T09:17:27Z)
Model-based Clustering with Missing Not At Random Data [0.8777702580252754]
我々は,MNARデータを含む,非常に一般的なタイプの欠落データを扱うために設計されたモデルベースのクラスタリングアルゴリズムを提案する。いくつかのMNARモデルについて議論し、不足の原因は、欠落変数自体の値とクラスメンバーシップの両方に依存する。 MNARzと呼ばれる特定のMNARモデルに注目する。
論文参考訳（メタデータ） (2021-12-20T09:52:12Z)
MINIMALIST: Mutual INformatIon Maximization for Amortized Likelihood Inference from Sampled Trajectories [61.3299263929289]
シミュレーションベースの推論は、その可能性が実際に計算できない場合でもモデルのパラメータを学習することができる。あるクラスのメソッドは、異なるパラメータでシミュレートされたデータを使用して、確率とエビデンス比の償却推定器を推定する。モデルパラメータとシミュレーションデータ間の相互情報の観点から,本手法が定式化可能であることを示す。
論文参考訳（メタデータ） (2021-06-03T12:59:16Z)
Deep Generative Pattern-Set Mixture Models for Nonignorable Missingness [0.0]
無視できないデータと無視できないデータの両方をモデル化する可変オートエンコーダアーキテクチャを提案する。モデルでは,観測されたデータと欠落マスクに基づいて,欠落したデータを欠落パターンにクラスタ化することを明示的に学習する。当社のセットアップでは,無知かつ無知な欠如の特性をトレードオフすることで,両タイプのデータに適用することが可能である。
論文参考訳（メタデータ） (2021-03-05T08:21:35Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。