論文の概要: Learning Invariant Representations with Missing Data
- arxiv url: http://arxiv.org/abs/2112.00881v1
- Date: Wed, 1 Dec 2021 23:14:34 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-04 07:50:39.731489
- Title: Learning Invariant Representations with Missing Data
- Title(参考訳): 欠落データを用いた不変表現の学習
- Authors: Mark Goldstein, J\"orn-Henrik Jacobsen, Olina Chau, Adriel Saporta,
Aahlad Puli, Rajesh Ranganath, Andrew C. Miller
- Abstract要約: 相関誘導型テクトニュアンス変数を含む特定の依存性を満たすモデルでは、テスト性能が保証される。
欠損したニュアンスの下での非分散目的のためのアクロルトムド推定器を導出する。
シミュレーションと臨床データについて、これらの推定を最適化すると、全データを利用する推定器と同様のテスト性能が得られる。
- 参考スコア(独自算出の注目度): 18.307438471163774
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Spurious correlations allow flexible models to predict well during training
but poorly on related test populations. Recent work has shown that models that
satisfy particular independencies involving correlation-inducing
\textit{nuisance} variables have guarantees on their test performance.
Enforcing such independencies requires nuisances to be observed during
training. However, nuisances, such as demographics or image background labels,
are often missing. Enforcing independence on just the observed data does not
imply independence on the entire population. Here we derive \acrshort{mmd}
estimators used for invariance objectives under missing nuisances. On
simulations and clinical data, optimizing through these estimates achieves test
performance similar to using estimators that make use of the full data.
- Abstract(参考訳): 鮮やかな相関により、フレキシブルなモデルはトレーニング中にうまく予測できるが、関連するテスト人口では不十分である。
最近の研究によると、相関誘導型 \textit{nuisance} 変数を含む特定の依存性を満たすモデルは、テスト性能を保証している。
このような無依存を強制するには、訓練中に迷惑を観察する必要がある。
しかし、人口統計や画像の背景ラベルのようなニュアンスはしばしば欠落している。
観測されたデータのみに独立を強制することは、人口全体の独立を意味するものではない。
ここでは、未知のニュアンスの下での不変目的に使用される<acrshort{mmd} 推定器を導出する。
シミュレーションおよび臨床データにおいて、これらの推定値の最適化は、全データを利用する推定器の使用と同様のテスト性能を達成する。
関連論文リスト
- Measuring and Improving Attentiveness to Partial Inputs with Counterfactuals [91.59906995214209]
我々は,新しい評価手法であるCAT(Facterfactual Attentiveness Test)を提案する。
CATは、入力の一部を別の例から別の例に置き換えることで、予測を変更する注意深いモデルを期待することで、反事実を使用する。
実験データの精度が向上する一方, GPT3 は実演回数の増加により注意力の低下がみられた。
論文 参考訳(メタデータ) (2023-11-16T06:27:35Z) - Stubborn Lexical Bias in Data and Models [50.79738900885665]
我々は、データに基づいてトレーニングされたモデルに、データのスプリアスパターンが現れるかどうかを調べるために、新しい統計手法を用いる。
トレーニングデータに*reweight*に最適化アプローチを適用し、数千のスプリアス相関を低減します。
驚くべきことに、この方法ではトレーニングデータの語彙バイアスを低減できますが、トレーニングされたモデルで対応するバイアスの強い証拠がまだ見つかっていません。
論文 参考訳(メタデータ) (2023-06-03T20:12:27Z) - Improving Adaptive Conformal Prediction Using Self-Supervised Learning [72.2614468437919]
我々は、既存の予測モデルの上に自己教師付きプレテキストタスクを持つ補助モデルを訓練し、自己教師付きエラーを付加的な特徴として用いて、非整合性スコアを推定する。
合成データと実データの両方を用いて、効率(幅)、欠陥、共形予測間隔の超過といった付加情報の利点を実証的に実証する。
論文 参考訳(メタデータ) (2023-02-23T18:57:14Z) - Sharing pattern submodels for prediction with missing values [12.981974894538668]
機械学習の多くのアプリケーションでは欠落値は避けられず、トレーニング中もテスト時にも課題が提示される。
パターンサブモデル(パターンサブモデル)と呼ばれる別の手法を提案する。これは、テスト時に欠落した値に対して、予測を堅牢にし、パターンサブモデルの予測力を維持または改善させる。
論文 参考訳(メタデータ) (2022-06-22T15:09:40Z) - Uncertainty Estimation for Language Reward Models [5.33024001730262]
言語モデルは、テキストコーパスの教師なしトレーニングからさまざまな能力を学ぶことができる。
人間がラベル付きデータを提供するよりも選択肢を選択する方が簡単であり、事前の作業はそのような選好比較から報酬モデルをトレーニングすることで最先端のパフォーマンスを達成した。
能動的学習とリスク-逆強化学習を用いてサンプル効率とロバスト性を向上させる不確実性推定によるこれらの問題に対処することを模索する。
論文 参考訳(メタデータ) (2022-03-14T20:13:21Z) - Statistical Estimation from Dependent Data [37.73584699735133]
本稿では,異なる観測領域にまたがるバイナリラベルが特徴ベクトル上で独立に条件付けられていないような一般的な統計的推定問題について考察する。
我々はこれらの依存関係をMarkov Random Fieldsの言語でモデル化する。
このモデルに対してアルゴリズムと統計的に効率的な推定率を提供する。
論文 参考訳(メタデータ) (2021-07-20T21:18:06Z) - On Disentangled Representations Learned From Correlated Data [59.41587388303554]
相関データに対する最も顕著な絡み合うアプローチの挙動を解析することにより、現実のシナリオにギャップを埋める。
本研究では,データセットの体系的相関が学習され,潜在表現に反映されていることを示す。
また、トレーニング中の弱い監督や、少数のラベルで事前訓練されたモデルを修正することで、これらの潜伏相関を解消する方法を実証する。
論文 参考訳(メタデータ) (2020-06-14T12:47:34Z) - Performance metrics for intervention-triggering prediction models do not
reflect an expected reduction in outcomes from using the model [71.9860741092209]
臨床研究者はしばしばリスク予測モデルの中から選択し評価する。
振り返りデータから算出される標準メトリクスは、特定の仮定の下でのみモデルユーティリティに関係します。
予測が時間を通して繰り返し配信される場合、標準メトリクスとユーティリティの関係はさらに複雑になる。
論文 参考訳(メタデータ) (2020-06-02T16:26:49Z) - TraDE: Transformers for Density Estimation [101.20137732920718]
TraDEは自己回帰密度推定のための自己アテンションに基づくアーキテクチャである。
本稿では, 生成したサンプルを用いた回帰, 分布外検出, トレーニングデータにおける雑音に対する頑健性などのタスクについて述べる。
論文 参考訳(メタデータ) (2020-04-06T07:32:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。