論文の概要: Weakly-supervised Multi-output Regression via Correlated Gaussian
Processes
- arxiv url: http://arxiv.org/abs/2002.08412v2
- Date: Mon, 23 May 2022 20:56:29 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-30 13:16:34.579075
- Title: Weakly-supervised Multi-output Regression via Correlated Gaussian
Processes
- Title(参考訳): 相関ガウス過程による弱制御多出力回帰
- Authors: Seokhyun Chung, Raed Al Kontar, Zhenke Wu
- Abstract要約: 依存ガウス過程に基づく弱教師付きマルチアウトプットモデルを提案する。
このモデルでは,ラベルの欠如によるマルチアウトプット設定が優れていることを示す。
最終的には、公正な推論とシーケンシャルな意思決定において、アプローチの可能な使用を強調します。
- 参考スコア(独自算出の注目度): 3.1511847280063696
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-output regression seeks to borrow strength and leverage commonalities
across different but related outputs in order to enhance learning and
prediction accuracy. A fundamental assumption is that the output/group
membership labels for all observations are known. This assumption is often
violated in real applications. For instance, in healthcare datasets, sensitive
attributes such as ethnicity are often missing or unreported. To this end, we
introduce a weakly-supervised multi-output model based on dependent Gaussian
processes. Our approach is able to leverage data without complete group labels
or possibly only prior belief on group memberships to enhance accuracy across
all outputs. Through intensive simulations and case studies on an Insulin,
Testosterone and Bodyfat dataset, we show that our model excels in multi-output
settings with missing labels, while being competitive in traditional fully
labeled settings. We end by highlighting the possible use of our approach in
fair inference and sequential decision-making.
- Abstract(参考訳): 多出力回帰は、学習と予測精度を高めるために、強度を借り、異なるが関連する出力の共通点を活用する。
基本的な仮定は、すべての観察のための出力/グループメンバシップラベルが知られていることである。
この仮定は実アプリケーションではしばしば破られる。
例えば、医療データセットでは、民族性のような繊細な属性はしばしば欠落または報告されない。
この目的のために、依存ガウス過程に基づく弱教師付き多出力モデルを導入する。
私たちのアプローチは、完全なグループラベルやグループメンバーシップに対する事前の信念なしにデータを活用し、すべてのアウトプットの正確性を高めることができます。
Insulin,Testosterone,Bodyfatの各データセットの集中的なシミュレーションとケーススタディにより,従来の完全ラベル付き設定と競合しながら,ラベルの欠如によるマルチアウトプット設定が優れていることを示す。
最終的には、公正な推論とシーケンシャルな意思決定において、アプローチの可能な使用を強調します。
関連論文リスト
- Bayesian Joint Additive Factor Models for Multiview Learning [7.254731344123118]
マルチオミクスデータが収集され、臨床結果と相関する精度医学の文脈でモチベーション応用が生じる。
本稿では,共有およびビュー固有のコンポーネントを考慮に入れた,構造化された付加的設計を伴うJAFAR(Joint Additive Factor regression model)を提案する。
免疫,メタボローム,プロテオームデータから得られた時間とラベルの発症の予測は,最先端の競合相手に対するパフォーマンス向上を示す。
論文 参考訳(メタデータ) (2024-06-02T15:35:45Z) - Generalized Regression with Conditional GANs [2.4171019220503402]
本稿では,学習データセットにおける特徴ラベルペアと,対応する入力と組み合わせて出力を区別できない予測関数を学習することを提案する。
回帰に対するこのアプローチは、私たちが適合するデータの分布に対する仮定を減らし、表現能力が向上することを示す。
論文 参考訳(メタデータ) (2024-04-21T01:27:47Z) - Probabilistic Test-Time Generalization by Variational Neighbor-Labeling [62.158807685159736]
本稿では、ドメインの一般化を試み、モデルが未確認のターゲットドメインにデプロイされる前に、ソースドメインにのみトレーニングされる。
ソーストレーニングされたモデルをテスト時にターゲットドメインに一般化するための、ターゲットサンプルの擬似ラベル化の確率。
より堅牢な擬似ラベルを生成するために、近隣のターゲットサンプルの情報を含む変分隣接ラベル。
論文 参考訳(メタデータ) (2023-07-08T18:58:08Z) - Leveraging Instance Features for Label Aggregation in Programmatic Weak
Supervision [75.1860418333995]
Programmatic Weak Supervision (PWS) は、トレーニングラベルを効率的に合成するための広く普及したパラダイムとして登場した。
PWSのコアコンポーネントはラベルモデルであり、複数のノイズ管理ソースの出力をラベル関数として集約することで、真のラベルを推論する。
既存の統計ラベルモデルは一般的にLFの出力のみに依存し、基礎となる生成過程をモデル化する際のインスタンスの特徴を無視している。
論文 参考訳(メタデータ) (2022-10-06T07:28:53Z) - Learned Label Aggregation for Weak Supervision [8.819582879892762]
本稿では,ラベル付きデータを容易に生成するために,弱い監視信号を集約するデータプログラミング手法を提案する。
生成したラベルの質は、すべてのLFからノイズの多いラベルを集約し、基底真実のラベルを推測するラベル集約モデルに依存する。
合成されたデータを用いてモデルをトレーニングし、モデルに効果的なアーキテクチャを設計できることを示す。
論文 参考訳(メタデータ) (2022-07-27T14:36:35Z) - Improving Contrastive Learning on Imbalanced Seed Data via Open-World
Sampling [96.8742582581744]
我々は、Model-Aware K-center (MAK)と呼ばれるオープンワールドなラベルなしデータサンプリングフレームワークを提案する。
MAKは、尾性、近接性、多様性の3つの単純な原則に従う。
我々はMAKが学習した機能の全体的な表現品質とクラスバランス性の両方を継続的に改善できることを実証した。
論文 参考訳(メタデータ) (2021-11-01T15:09:41Z) - Examining and Combating Spurious Features under Distribution Shift [94.31956965507085]
我々は、最小限の統計量という情報理論の概念を用いて、ロバストで刺激的な表現を定義し、分析する。
入力分布のバイアスしか持たない場合でも、モデルはトレーニングデータから急激な特徴を拾い上げることができることを証明しています。
分析から着想を得た結果,グループDROは,グループ同士の相関関係を直接考慮しない場合に失敗する可能性が示唆された。
論文 参考訳(メタデータ) (2021-06-14T05:39:09Z) - Disentangling Sampling and Labeling Bias for Learning in Large-Output
Spaces [64.23172847182109]
異なる負のサンプリングスキームが支配的ラベルと稀なラベルで暗黙的にトレードオフパフォーマンスを示す。
すべてのラベルのサブセットで作業することで生じるサンプリングバイアスと、ラベルの不均衡に起因するデータ固有のラベルバイアスの両方に明示的に対処する統一された手段を提供する。
論文 参考訳(メタデータ) (2021-05-12T15:40:13Z) - Out-distribution aware Self-training in an Open World Setting [62.19882458285749]
オープンワールド環境ではラベルのないデータを活用して予測性能をさらに向上します。
注意深いサンプル選択戦略を含む,自己学習を意識したアウト・ディストリビューションを導入する。
当社の分類器は、設計外分布を意識しており、タスク関連の入力と無関係な入力を区別できます。
論文 参考訳(メタデータ) (2020-12-21T12:25:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。