論文の概要: Semi-Supervised Learning under General Causal Models
- arxiv url: http://arxiv.org/abs/2510.22567v1
- Date: Sun, 26 Oct 2025 07:46:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 19:54:32.536838
- Title: Semi-Supervised Learning under General Causal Models
- Title(参考訳): 一般因果モデルに基づく半教師付き学習
- Authors: Archer Moore, Heejung Shim, Jingge Zhu, Mingming Gong,
- Abstract要約: 半教師付き学習(SSL)は、ラベル付きデータと非ラベル付きデータの両方を使用して機械学習モデルをトレーニングすることを目的としている。
本稿では、変数が柔軟な因果関係を持つ一般的な因果関係モデルで動作するフレームワークを提案する。
学習した因果生成モデルは、より正確な予測モデルをトレーニングするための合成ラベル付きデータを生成することができる。
- 参考スコア(独自算出の注目度): 51.90307793476367
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Semi-supervised learning (SSL) aims to train a machine learning model using both labelled and unlabelled data. While the unlabelled data have been used in various ways to improve the prediction accuracy, the reason why unlabelled data could help is not fully understood. One interesting and promising direction is to understand SSL from a causal perspective. In light of the independent causal mechanisms principle, the unlabelled data can be helpful when the label causes the features but not vice versa. However, the causal relations between the features and labels can be complex in real world applications. In this paper, we propose a SSL framework that works with general causal models in which the variables have flexible causal relations. More specifically, we explore the causal graph structures and design corresponding causal generative models which can be learned with the help of unlabelled data. The learned causal generative model can generate synthetic labelled data for training a more accurate predictive model. We verify the effectiveness of our proposed method by empirical studies on both simulated and real data.
- Abstract(参考訳): 半教師付き学習(SSL)は、ラベル付きデータと非ラベル付きデータの両方を使用して機械学習モデルをトレーニングすることを目的としている。
乱れのないデータは予測精度を向上させるために様々な方法で使用されているが、乱れのないデータが役に立つ理由は、完全には理解されていない。
興味深い、そして有望な方向性の1つは、SSLを因果的な観点から理解することである。
独立因果機構の原理に照らして、ラベルが特徴を生じさせるとき、ラベルのないデータは役に立つが、その逆ではない。
しかし、機能とラベルの因果関係は、現実世界のアプリケーションでは複雑である。
本稿では,変数が柔軟な因果関係を持つ一般的な因果関係モデルで動作するSSLフレームワークを提案する。
具体的には,因果グラフの構造とそれに対応する因果生成モデルの設計について検討する。
学習した因果生成モデルは、より正確な予測モデルをトレーニングするための合成ラベル付きデータを生成することができる。
提案手法の有効性をシミュレーションデータと実データの両方で実証的に検証した。
関連論文リスト
- Machine Learning from Explanations [17.28638946021444]
より小さなデータセット上で信頼性の高い分類モデルをトレーニングするための革新的なアプローチを導入する。
提案手法は,モデル予測精度の向上と,説明に合うように注意を精査する2段階の学習サイクルを中心に展開する。
トレーニングサイクルがより正確で信頼性の高いモデルへの収束を早めることを示す。
論文 参考訳(メタデータ) (2025-07-07T09:09:52Z) - A Probabilistic Model for Non-Contrastive Learning [6.178817969919849]
自己教師付き学習(SSL)は、データ拡張を通じて意味的類似性を符号化することで、ラベルのないデータから意味のある表現を見つけることを目的としている。
一般的なSSL損失関数が統計モデルに関連があるかどうかはまだ分かっていない。
興味ある特性を示すSSLの潜在変数統計モデルを考える:データ拡張の情報性に応じて、モデルのMLEはPCAに還元するか、単純な非競合的損失にアプローチする。
論文 参考訳(メタデータ) (2025-01-22T17:25:47Z) - Causal Discovery on Dependent Binary Data [6.464898093190062]
本稿では,関係するバイナリデータに基づく因果グラフ学習のためのデコレーションに基づくアプローチを提案する。
我々は,潜在ユーティリティ変数のサンプルの生成とデコレーションを行うEMライクな反復アルゴリズムを開発した。
提案手法は因果グラフ学習の精度を大幅に向上させることを示す。
論文 参考訳(メタデータ) (2024-12-28T21:55:42Z) - Mechanism learning: Reverse causal inference in the presence of multiple unknown confounding through front-door causal bootstrapping [0.8901073744693314]
機械学習(ML)予測モデルの最大の制限は、変数間の因果関係ではなく、関連性を取り戻すことである。
本稿では,前向きの因果ブートストラップを用いて観測データを分解する機構学習を提案する。
提案手法は,完全合成,半合成,実世界のデータセットを用いて,信頼性,不偏性,因果的ML予測器を検出できることを実証する。
論文 参考訳(メタデータ) (2024-10-26T03:34:55Z) - Discovering and Reasoning of Causality in the Hidden World with Large Language Models [109.62442253177376]
我々はCausal representatiOn AssistanT(COAT)と呼ばれる新しいフレームワークを開発し、因果発見に有用な測定変数を提案する。
大規模言語モデル (LLM) と因果関係を直接推論する代わりに、COAT は中間因果発見結果から LLM へのフィードバックを構築し、提案した変数を洗練させる。
論文 参考訳(メタデータ) (2024-02-06T12:18:54Z) - Stubborn Lexical Bias in Data and Models [50.79738900885665]
我々は、データに基づいてトレーニングされたモデルに、データのスプリアスパターンが現れるかどうかを調べるために、新しい統計手法を用いる。
トレーニングデータに*reweight*に最適化アプローチを適用し、数千のスプリアス相関を低減します。
驚くべきことに、この方法ではトレーニングデータの語彙バイアスを低減できますが、トレーニングされたモデルで対応するバイアスの強い証拠がまだ見つかっていません。
論文 参考訳(メタデータ) (2023-06-03T20:12:27Z) - Learned Label Aggregation for Weak Supervision [8.819582879892762]
本稿では,ラベル付きデータを容易に生成するために,弱い監視信号を集約するデータプログラミング手法を提案する。
生成したラベルの質は、すべてのLFからノイズの多いラベルを集約し、基底真実のラベルを推測するラベル集約モデルに依存する。
合成されたデータを用いてモデルをトレーニングし、モデルに効果的なアーキテクチャを設計できることを示す。
論文 参考訳(メタデータ) (2022-07-27T14:36:35Z) - Federated Causal Discovery [74.37739054932733]
本稿では,DAG-Shared Federated Causal Discovery (DS-FCD) という勾配学習フレームワークを開発する。
ローカルデータに直接触れることなく因果グラフを学習し、データの不均一性を自然に扱うことができる。
合成および実世界の両方のデータセットに対する大規模な実験により,提案手法の有効性が検証された。
論文 参考訳(メタデータ) (2021-12-07T08:04:12Z) - Self-Tuning for Data-Efficient Deep Learning [75.34320911480008]
セルフチューニングは、データ効率のよいディープラーニングを可能にする新しいアプローチである。
ラベル付きおよびラベルなしデータの探索と事前訓練されたモデルの転送を統一する。
SSLとTLの5つのタスクをシャープなマージンで上回ります。
論文 参考訳(メタデータ) (2021-02-25T14:56:19Z) - Learning Causal Models Online [103.87959747047158]
予測モデルは、予測を行うためにデータの急激な相関に依存することができる。
強い一般化を達成するための一つの解決策は、モデルに因果構造を組み込むことである。
本稿では,突発的特徴を継続的に検出・除去するオンラインアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-06-12T20:49:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。