論文の概要: Aggregated Multi-output Gaussian Processes with Knowledge Transfer
Across Domains
- arxiv url: http://arxiv.org/abs/2206.12141v1
- Date: Fri, 24 Jun 2022 08:07:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-27 13:02:17.514783
- Title: Aggregated Multi-output Gaussian Processes with Knowledge Transfer
Across Domains
- Title(参考訳): ドメイン間の知識伝達を伴う集約多出力ガウス過程
- Authors: Yusuke Tanaka, Toshiyuki Tanaka, Tomoharu Iwata, Takeshi Kurashima,
Maya Okawa, Yasunori Akagi, Hiroyuki Toda
- Abstract要約: 本稿では,各粒度の集合データセットを用いて属性の関数を推論する多出力ガウス過程(MoGP)モデルを提案する。
実験により,提案手法は実世界のデータセットの粗粒度データを精錬する作業において優れていた。
- 参考スコア(独自算出の注目度): 39.25639417233822
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Aggregate data often appear in various fields such as socio-economics and
public security. The aggregate data are associated not with points but with
supports (e.g., spatial regions in a city). Since the supports may have various
granularities depending on attributes (e.g., poverty rate and crime rate),
modeling such data is not straightforward. This article offers a multi-output
Gaussian process (MoGP) model that infers functions for attributes using
multiple aggregate datasets of respective granularities. In the proposed model,
the function for each attribute is assumed to be a dependent GP modeled as a
linear mixing of independent latent GPs. We design an observation model with an
aggregation process for each attribute; the process is an integral of the GP
over the corresponding support. We also introduce a prior distribution of the
mixing weights, which allows a knowledge transfer across domains (e.g., cities)
by sharing the prior. This is advantageous in such a situation where the
spatially aggregated dataset in a city is too coarse to interpolate; the
proposed model can still make accurate predictions of attributes by utilizing
aggregate datasets in other cities. The inference of the proposed model is
based on variational Bayes, which enables one to learn the model parameters
using the aggregate datasets from multiple domains. The experiments demonstrate
that the proposed model outperforms in the task of refining coarse-grained
aggregate data on real-world datasets: Time series of air pollutants in Beijing
and various kinds of spatial datasets from New York City and Chicago.
- Abstract(参考訳): 集約データは社会経済学や治安など様々な分野にしばしば現れる。
集約データは、ポイントではなく、サポート(例えば、都市の空間領域)に関連付けられている。
支援者は属性(例えば貧困率や犯罪率)によって様々な粒度を持つ可能性があるため、そのようなデータのモデリングは簡単ではない。
本稿では,各粒度の集合データセットを用いて属性の関数を推論する多出力ガウス過程(MoGP)モデルを提案する。
提案モデルでは,各属性の関数は独立潜在GPの線形混合としてモデル化された依存GPであると仮定する。
我々は,各属性に対する集約プロセスを備えた観測モデルを設計し,そのプロセスは対応するサポートに対するGPの積分である。
また,混合重みの事前分布を導入し,事前の共有により,各領域(都市など)にまたがる知識伝達を可能にする。
これは、都市内の空間的に集約されたデータセットが粗いので補間できない状況において有利であり、提案モデルでは、他の都市の集合データセットを利用することで、属性の正確な予測を行うことができる。
提案モデルの推論は変分ベイズに基づいており、複数のドメインから集約データセットを使用してモデルパラメータを学習することができる。
実験の結果,提案手法は,北京の大気汚染物質の時系列と,ニューヨークやシカゴの様々な空間データセットにおいて,実世界のデータセットの粗粒度データを精錬する作業に勝ることが判明した。
関連論文リスト
- An improved tabular data generator with VAE-GMM integration [9.4491536689161]
本稿では,現在のアプローチの限界に対処する新しい変分オートエンコーダ(VAE)モデルを提案する。
本手法は,TVAEモデルにインスパイアされたベイジアン・ガウス混合モデル(BGM)をVAEアーキテクチャに組み込む。
我々は,2つの医療関連データセットを含む混合データ型を持つ実世界の3つのデータセットに対して,我々のモデルを徹底的に検証する。
論文 参考訳(メタデータ) (2024-04-12T12:31:06Z) - Fusion of Gaussian Processes Predictions with Monte Carlo Sampling [61.31380086717422]
科学と工学において、私たちはしばしば興味のある変数の正確な予測のために設計されたモデルで作業します。
これらのモデルが現実の近似であることを認識し、複数のモデルを同じデータに適用し、結果を統合することが望ましい。
論文 参考訳(メタデータ) (2024-03-03T04:21:21Z) - T1: Scaling Diffusion Probabilistic Fields to High-Resolution on Unified
Visual Modalities [69.16656086708291]
拡散確率場(DPF)は、距離空間上で定義された連続関数の分布をモデル化する。
本稿では,局所構造学習に着目したビューワイズサンプリングアルゴリズムによる新しいモデルを提案する。
モデルは、複数のモダリティを統一しながら、高解像度のデータを生成するためにスケールすることができる。
論文 参考訳(メタデータ) (2023-05-24T03:32:03Z) - Data-IQ: Characterizing subgroups with heterogeneous outcomes in tabular
data [81.43750358586072]
本稿では,サンプルをサブグループに体系的に階層化するフレームワークであるData-IQを提案する。
実世界の4つの医療データセットに対するData-IQの利点を実験的に実証した。
論文 参考訳(メタデータ) (2022-10-24T08:57:55Z) - Learning from aggregated data with a maximum entropy model [73.63512438583375]
我々は,観測されていない特徴分布を最大エントロピー仮説で近似することにより,ロジスティック回帰と類似した新しいモデルが,集約データからのみ学習されることを示す。
我々は、この方法で学習したモデルが、完全な非凝集データでトレーニングされたロジスティックモデルに匹敵するパフォーマンスを達成することができるという、いくつかの公開データセットに関する実証的な証拠を提示する。
論文 参考訳(メタデータ) (2022-10-05T09:17:27Z) - CHALLENGER: Training with Attribution Maps [63.736435657236505]
ニューラルネットワークのトレーニングに属性マップを利用すると、モデルの正規化が向上し、性能が向上することを示す。
特に、我々の汎用的なドメインに依存しないアプローチは、ビジョン、自然言語処理、時系列タスクにおける最先端の結果をもたらすことを示す。
論文 参考訳(メタデータ) (2022-05-30T13:34:46Z) - Multimodal Data Fusion in High-Dimensional Heterogeneous Datasets via
Generative Models [16.436293069942312]
我々は、教師なしの方法で高次元異種データから確率的生成モデルを学習することに興味がある。
本稿では,指数関数的な分布系を通じて異なるデータ型を結合する一般的なフレームワークを提案する。
提案アルゴリズムは、実数値(ガウス)とカテゴリー(マルチノミカル)の特徴を持つ、よく遭遇する異種データセットについて詳細に述べる。
論文 参考訳(メタデータ) (2021-08-27T18:10:31Z) - Cluster-Specific Predictions with Multi-Task Gaussian Processes [4.368185344922342]
マルチタスク学習、クラスタリング、予測を扱うために、ガウス過程(GP)を含むモデルを導入する。
このモデルは、マルチタスクGPと一般的な平均プロセスの混合としてインスタンス化される。
MagmaClustと呼ばれるアルゴリズムは、Rパッケージとして公開されている。
論文 参考訳(メタデータ) (2020-11-16T11:08:59Z) - Learn to Expect the Unexpected: Probably Approximately Correct Domain
Generalization [38.345670899258515]
ドメインの一般化は、トレーニングデータとテストデータが異なるデータドメインから来るときの機械学習の問題である。
データ分布にメタ分布が存在する領域をまたいで一般化する単純な理論モデルを提案する。
論文 参考訳(メタデータ) (2020-02-13T17:37:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。