Fugu-MT 論文翻訳(概要): Interpretable Multi-Source Data Fusion Through Latent Variable Gaussian Process

論文の概要: Interpretable Multi-Source Data Fusion Through Latent Variable Gaussian Process

arxiv url: http://arxiv.org/abs/2402.04146v1
Date: Tue, 6 Feb 2024 16:54:59 GMT
ステータス: 翻訳完了
システム内更新日: 2024-02-07 13:52:26.721637
Title: Interpretable Multi-Source Data Fusion Through Latent Variable Gaussian Process
Title（参考訳）: 潜在変数ガウス過程による解釈可能なマルチソースデータ融合
Authors: Sandipp Krishnan Ravi, Yigitcan Comlek, Wei Chen, Arjun Pathak, Vipul Gupta, Rajnikant Umretiya, Andrew Hoffman, Ghanshyam Pilania, Piyush Pandita, Sayan Ghosh, Nathaniel Mckeever, Liping Wang
Abstract要約: 提案手法は、2つの数学的(表現パラボラ問題、2D Ackley関数)と2つの材料科学(FeCrAlおよびSmCoFe合金の設計)のケーススタディを用いて実証および解析を行った。単一のソースとソースを意識しないMLモデルと比較して,提案するマルチソースデータ融合フレームワークは,スパースデータ問題,ソースに対する解釈可能性,異なるソース間の相関や関係を利用してモデリング能力を向上させることができる。
参考スコア（独自算出の注目度）: 8.391185633015896
License: http://creativecommons.org/licenses/by/4.0/
Abstract: With the advent of artificial intelligence (AI) and machine learning (ML), various domains of science and engineering communites has leveraged data-driven surrogates to model complex systems from numerous sources of information (data). The proliferation has led to significant reduction in cost and time involved in development of superior systems designed to perform specific functionalities. A high proposition of such surrogates are built extensively fusing multiple sources of data, may it be published papers, patents, open repositories, or other resources. However, not much attention has been paid to the differences in quality and comprehensiveness of the known and unknown underlying physical parameters of the information sources that could have downstream implications during system optimization. Towards resolving this issue, a multi-source data fusion framework based on Latent Variable Gaussian Process (LVGP) is proposed. The individual data sources are tagged as a characteristic categorical variable that are mapped into a physically interpretable latent space, allowing the development of source-aware data fusion modeling. Additionally, a dissimilarity metric based on the latent variables of LVGP is introduced to study and understand the differences in the sources of data. The proposed approach is demonstrated on and analyzed through two mathematical (representative parabola problem, 2D Ackley function) and two materials science (design of FeCrAl and SmCoFe alloys) case studies. From the case studies, it is observed that compared to using single-source and source unaware ML models, the proposed multi-source data fusion framework can provide better predictions for sparse-data problems, interpretability regarding the sources, and enhanced modeling capabilities by taking advantage of the correlations and relationships among different sources.
Abstract（参考訳）: 人工知能(AI)と機械学習(ML)の出現により、科学と工学の様々な分野が、データ駆動サロゲートを利用して、多くの情報ソース(データ)から複雑なシステムをモデル化してきた。この増殖は、特定の機能を実行するように設計された優れたシステムの開発にかかわるコストと時間の大幅な削減につながった。このようなサロゲートの高い命題は、論文、特許、オープンレポジトリ、その他のリソースなど、複数のデータソースを広範囲に融合して構築されている。しかし、システム最適化中に下流に影響を及ぼす可能性のある情報ソースの既知のおよび未知の物理パラメータの品質と包括性の違いにはあまり注意が払われていない。この問題を解決するために,LVGP(Latent Variable Gaussian Process)に基づくマルチソースデータ融合フレームワークを提案する。個々のデータソースは、物理的に解釈可能な潜在空間にマッピングされる特徴的なカテゴリ変数としてタグ付けされ、ソース認識データ融合モデリングの開発を可能にする。さらに、LVGPの潜伏変数に基づく相似性尺度を導入し、データソースの違いを研究し、理解する。提案手法は、2つの数学的(表現パラボラ問題、2D Ackley関数)と2つの材料科学(FeCrAlおよびSmCoFe合金の設計)のケーススタディを用いて実証および解析を行った。ケーススタディから,シングルソースおよびソースを意識しないMLモデルと比較して,提案したマルチソースデータ融合フレームワークは,スパースデータ問題に対するより良い予測,ソースに対する解釈可能性,異なるソース間の相関や関係を利用してモデリング能力を向上させることができる。

関連論文リスト

Federated Online Learning for Heterogeneous Multisource Streaming Data [0.0]
フェデレートラーニングは、プライバシの懸念の下で分散マルチソースデータ分析に不可欠なパラダイムとして登場した。本稿では,分散マルチソースストリーミングデータ解析のためのFOL手法を提案する。
論文参考訳（メタデータ） (2025-08-08T19:08:53Z)
Diversity as a Reward: Fine-Tuning LLMs on a Mixture of Domain-Undetermined Data [54.3895971080712]
多様なデータセットを使用した細調整された大規模言語モデル(LLM)は、さまざまな領域にわたる全体的なパフォーマンス向上に不可欠である。本稿では,LLMに2つのアイデンティティを与える新しい手法を提案する。多様性報酬に基づいてデータを認知的に探索し,選択する出力モデルと,選択したデータに調整する入力モデルである。
論文参考訳（メタデータ） (2025-02-05T17:21:01Z)
Heterogenous Multi-Source Data Fusion Through Input Mapping and Latent Variable Gaussian Process [8.32027826756131]
提案するフレームワークは,3つの工学的ケーススタディに基づいて実証および解析を行った。単一のソースモデルに対して予測精度が向上し、変換されるがソースモデルは認識されない。
論文参考訳（メタデータ） (2024-07-15T22:27:04Z)
Distribution-Aware Data Expansion with Diffusion Models [55.979857976023695]
本研究では,分散型拡散モデルに基づくトレーニングフリーなデータ拡張フレームワークであるDistDiffを提案する。 DistDiffは、オリジナルデータのみにトレーニングされたモデルと比較して、さまざまなデータセットの精度を一貫して向上させる。
論文参考訳（メタデータ） (2024-03-11T14:07:53Z)
UnitedHuman: Harnessing Multi-Source Data for High-Resolution Human Generation [59.77275587857252]
総合的な人間のデータセットは、必然的に、局所的な部分についての不十分で低解像度な情報を持っている。本稿では,高解像度な人為的生成モデルを共同で学習するために,様々な解像度画像を用いたマルチソースデータセットを提案する。
論文参考訳（メタデータ） (2023-09-25T17:58:46Z)
Source-Free Collaborative Domain Adaptation via Multi-Perspective Feature Enrichment for Functional MRI Analysis [55.03872260158717]
安静時MRI機能(rs-fMRI)は、神経疾患の分析を助けるために多地点で研究されている。ソース領域とターゲット領域の間のfMRIの不均一性を低減するための多くの手法が提案されている。しかし、マルチサイト研究における懸念やデータストレージの負担のため、ソースデータの取得は困難である。我々は、fMRI解析のためのソースフリー協調ドメイン適応フレームワークを設計し、事前訓練されたソースモデルとラベルなしターゲットデータのみにアクセスできるようにする。
論文参考訳（メタデータ） (2023-08-24T01:30:18Z)
An Adaptive Kernel Approach to Federated Learning of Heterogeneous Causal Effects [10.248235276871256]
本稿では,複数の分散データソースから因果関係を学習するための新たな因果関係推論フレームワークを提案する。本稿では,データソース間の類似性を学習する適応転送アルゴリズムを提案する。提案手法は,異なる分布を持つ分散化されたデータソースのベースラインよりも優れていることを示す。
論文参考訳（メタデータ） (2023-01-01T04:57:48Z)
Robust Direct Learning for Causal Data Fusion [14.462235940634969]
我々は、他のニュアンス関数から処理効果を分離するマルチソースデータを統合するためのフレームワークを提供する。また,半パラメトリック効率理論の理論的洞察に基づく因果情報認識重み付け関数を提案する。
論文参考訳（メタデータ） (2022-11-01T03:33:22Z)
Data Fusion with Latent Map Gaussian Processes [0.0]
多要素モデリングとキャリブレーションは、エンジニアリング設計においてユビキタスに発生するデータ融合タスクである。本稿では,遅延マップガウス過程(LMGP)に基づく新しい手法を提案する。
論文参考訳（メタデータ） (2021-12-04T00:54:19Z)
Deep Transfer Learning for Multi-source Entity Linkage via Domain Adaptation [63.24594955429465]
マルチソースエンティティリンクは、データのクリーニングやユーザ縫合といった、高インパクトなアプリケーションにおいて重要である。 AdaMELは、多ソースエンティティリンクを実行するための一般的なハイレベルな知識を学ぶディープトランスファー学習フレームワークである。本フレームワークは,教師付き学習に基づく平均的手法よりも8.21%向上した最先端の学習結果を実現する。
論文参考訳（メタデータ） (2021-10-27T15:20:41Z)
Information Theory Measures via Multidimensional Gaussianization [7.788961560607993]
情報理論は、データやシステムの不確実性、依存、関連性を測定するための優れたフレームワークである。現実世界の応用にはいくつかの望ましい性質がある。しかし,多次元データから情報を取得することは,次元性の呪いによる難題である。
論文参考訳（メタデータ） (2020-10-08T07:22:16Z)
Modeling Shared Responses in Neuroimaging Studies through MultiView ICA [94.31804763196116]
被験者の大規模なコホートを含むグループ研究は、脳機能組織に関する一般的な結論を引き出す上で重要である。グループ研究のための新しい多視点独立成分分析モデルを提案し、各被験者のデータを共有独立音源と雑音の線形結合としてモデル化する。まず、fMRIデータを用いて、被験者間の共通音源の同定における感度の向上を示す。
論文参考訳（メタデータ） (2020-06-11T17:29:53Z)
Bayesian Sparse Factor Analysis with Kernelized Observations [67.60224656603823]
多視点問題は潜在変数モデルに直面することができる。高次元問題と非線形問題は伝統的にカーネルメソッドによって扱われる。両アプローチを単一モデルにマージすることを提案する。
論文参考訳（メタデータ） (2020-06-01T14:25:38Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。