論文の概要: Weakly-supervised Multi-output Regression via Correlated Gaussian
Processes
- arxiv url: http://arxiv.org/abs/2002.08412v2
- Date: Mon, 23 May 2022 20:56:29 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-30 13:16:34.579075
- Title: Weakly-supervised Multi-output Regression via Correlated Gaussian
Processes
- Title(参考訳): 相関ガウス過程による弱制御多出力回帰
- Authors: Seokhyun Chung, Raed Al Kontar, Zhenke Wu
- Abstract要約: 依存ガウス過程に基づく弱教師付きマルチアウトプットモデルを提案する。
このモデルでは,ラベルの欠如によるマルチアウトプット設定が優れていることを示す。
最終的には、公正な推論とシーケンシャルな意思決定において、アプローチの可能な使用を強調します。
- 参考スコア(独自算出の注目度): 3.1511847280063696
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-output regression seeks to borrow strength and leverage commonalities
across different but related outputs in order to enhance learning and
prediction accuracy. A fundamental assumption is that the output/group
membership labels for all observations are known. This assumption is often
violated in real applications. For instance, in healthcare datasets, sensitive
attributes such as ethnicity are often missing or unreported. To this end, we
introduce a weakly-supervised multi-output model based on dependent Gaussian
processes. Our approach is able to leverage data without complete group labels
or possibly only prior belief on group memberships to enhance accuracy across
all outputs. Through intensive simulations and case studies on an Insulin,
Testosterone and Bodyfat dataset, we show that our model excels in multi-output
settings with missing labels, while being competitive in traditional fully
labeled settings. We end by highlighting the possible use of our approach in
fair inference and sequential decision-making.
- Abstract(参考訳): 多出力回帰は、学習と予測精度を高めるために、強度を借り、異なるが関連する出力の共通点を活用する。
基本的な仮定は、すべての観察のための出力/グループメンバシップラベルが知られていることである。
この仮定は実アプリケーションではしばしば破られる。
例えば、医療データセットでは、民族性のような繊細な属性はしばしば欠落または報告されない。
この目的のために、依存ガウス過程に基づく弱教師付き多出力モデルを導入する。
私たちのアプローチは、完全なグループラベルやグループメンバーシップに対する事前の信念なしにデータを活用し、すべてのアウトプットの正確性を高めることができます。
Insulin,Testosterone,Bodyfatの各データセットの集中的なシミュレーションとケーススタディにより,従来の完全ラベル付き設定と競合しながら,ラベルの欠如によるマルチアウトプット設定が優れていることを示す。
最終的には、公正な推論とシーケンシャルな意思決定において、アプローチの可能な使用を強調します。
関連論文リスト
- Leveraging Ensemble Diversity for Robust Self-Training in the Presence
of Sample Selection Bias [6.404037549556394]
半教師付き学習において、自己学習はよく知られたアプローチである。モデルが自信を持ってラベル付きデータに擬似ラベルを反復的に割り当て、ラベル付き例として扱う。
ニューラルネットワークの場合、ソフトマックス予測確率はしばしば信頼度尺度として使用されるが、誤った予測であっても過度に信頼されていることが知られている。
本稿では,線形分類器のアンサンブルの予測多様性に基づいて,$mathcalT$-similarityと呼ばれる新しい信頼度尺度を提案する。
論文 参考訳(メタデータ) (2023-10-23T11:30:06Z) - Leveraging Instance Features for Label Aggregation in Programmatic Weak
Supervision [75.1860418333995]
Programmatic Weak Supervision (PWS) は、トレーニングラベルを効率的に合成するための広く普及したパラダイムとして登場した。
PWSのコアコンポーネントはラベルモデルであり、複数のノイズ管理ソースの出力をラベル関数として集約することで、真のラベルを推論する。
既存の統計ラベルモデルは一般的にLFの出力のみに依存し、基礎となる生成過程をモデル化する際のインスタンスの特徴を無視している。
論文 参考訳(メタデータ) (2022-10-06T07:28:53Z) - Learned Label Aggregation for Weak Supervision [8.819582879892762]
本稿では,ラベル付きデータを容易に生成するために,弱い監視信号を集約するデータプログラミング手法を提案する。
生成したラベルの質は、すべてのLFからノイズの多いラベルを集約し、基底真実のラベルを推測するラベル集約モデルに依存する。
合成されたデータを用いてモデルをトレーニングし、モデルに効果的なアーキテクチャを設計できることを示す。
論文 参考訳(メタデータ) (2022-07-27T14:36:35Z) - Improving Contrastive Learning on Imbalanced Seed Data via Open-World
Sampling [96.8742582581744]
我々は、Model-Aware K-center (MAK)と呼ばれるオープンワールドなラベルなしデータサンプリングフレームワークを提案する。
MAKは、尾性、近接性、多様性の3つの単純な原則に従う。
我々はMAKが学習した機能の全体的な表現品質とクラスバランス性の両方を継続的に改善できることを実証した。
論文 参考訳(メタデータ) (2021-11-01T15:09:41Z) - Examining and Combating Spurious Features under Distribution Shift [94.31956965507085]
我々は、最小限の統計量という情報理論の概念を用いて、ロバストで刺激的な表現を定義し、分析する。
入力分布のバイアスしか持たない場合でも、モデルはトレーニングデータから急激な特徴を拾い上げることができることを証明しています。
分析から着想を得た結果,グループDROは,グループ同士の相関関係を直接考慮しない場合に失敗する可能性が示唆された。
論文 参考訳(メタデータ) (2021-06-14T05:39:09Z) - Disentangling Sampling and Labeling Bias for Learning in Large-Output
Spaces [64.23172847182109]
異なる負のサンプリングスキームが支配的ラベルと稀なラベルで暗黙的にトレードオフパフォーマンスを示す。
すべてのラベルのサブセットで作業することで生じるサンプリングバイアスと、ラベルの不均衡に起因するデータ固有のラベルバイアスの両方に明示的に対処する統一された手段を提供する。
論文 参考訳(メタデータ) (2021-05-12T15:40:13Z) - Out-distribution aware Self-training in an Open World Setting [62.19882458285749]
オープンワールド環境ではラベルのないデータを活用して予測性能をさらに向上します。
注意深いサンプル選択戦略を含む,自己学習を意識したアウト・ディストリビューションを導入する。
当社の分類器は、設計外分布を意識しており、タスク関連の入力と無関係な入力を区別できます。
論文 参考訳(メタデータ) (2020-12-21T12:25:04Z) - AvgOut: A Simple Output-Probability Measure to Eliminate Dull Responses [97.50616524350123]
機能エンジニアリングなしで、どの発話やトークンが退屈であるかを動的に認識する対話モデルを構築します。
最初のモデルMinAvgOutは、各バッチの出力分布を通して、ダイバーシティスコアを直接最大化する。
第2のモデルであるラベルファインチューニング(LFT)は、多様性スコアによって連続的にスケールされたラベルをソースシーケンスにプリペイドし、多様性レベルを制御する。
3つ目のモデルであるRLは強化学習を採用し、多様性スコアを報奨信号として扱う。
論文 参考訳(メタデータ) (2020-01-15T18:32:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。