論文の概要: Finding groups of cross-correlated features in bi-view data
- arxiv url: http://arxiv.org/abs/2009.05079v3
- Date: Thu, 18 Aug 2022 20:46:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-20 03:10:21.216669
- Title: Finding groups of cross-correlated features in bi-view data
- Title(参考訳): バイビューデータにおける相互関連特徴群の探索
- Authors: Miheer Dewaskar, John Palowitch, Mark He, Michael I. Love, Andrew B.
Nobel
- Abstract要約: バイビューデータの安定なバイモジュールを特定するための反復的なテストベース手法を提案し,検討する。
本稿では,GTExプロジェクトの最新データを用いたeQTL解析問題に対する拡張的な適用法を提案する。
- 参考スコア(独自算出の注目度): 2.988889316000551
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Data sets in which measurements of two (or more) types are obtained from a
common set of samples arise in many scientific applications. A common problem
in the exploratory analysis of such data is to identify groups of features of
different data types that are strongly associated. A bimodule is a pair (A, B)
of feature sets from two data types such that the aggregate cross-correlation
between the features in A and those in B is large. A bimodule (A, B) is stable
if A coincides with the set of features that have significant aggregate
correlation with the features in B, and vice-versa. In this paper we propose
and investigate an iterative testing-based procedure (BSP) to identify stable
bimodules in bi-view data. We carry out a thorough simulation study to assess
the performance of BSP, and present an extended application to the problem of
expression quantitative trait loci (eQTL) analysis using recent data from the
GTEx project. In addition, we apply BSP to climatology data to identify regions
in North America where annual temperature variation affects precipitation.
- Abstract(参考訳): 2つの(またはそれ以上の)タイプの測定が共通のサンプルセットから得られるデータセットは、多くの科学的応用に現れる。
このようなデータの探索分析における一般的な問題は、強い関連を持つ異なるデータ型の特徴のグループを特定することである。
双加群 (bimodule) は、2つのデータ型から得られる特徴集合の対 (A, B) であり、A と B の特徴の間の集合の相互相関は大きい。
双加群 (A, B) が安定であれば、A が B の特徴と有意な集合相関を持つ特徴の集合と一致する。
本稿では,バイビューデータの安定なバイモジュールを特定するための反復的テストベースプロシージャ(BSP)を提案する。
我々は,BSPの性能を評価するための徹底的なシミュレーション研究を行い,GTExプロジェクトの最新データを用いて,表現量量的特性ローチ(eQTL)解析問題への拡張的応用を提案する。
さらに,年間気温変動が降水に影響を与える北米の地域を特定するために,気候データにBSPを適用した。
関連論文リスト
- Rethinking Mitosis Detection: Towards Diverse Data and Feature
Representation [30.882319057927052]
ミトコンドリア検出のための新しい一般化可能なフレームワーク(MitDet)を提案する。
提案手法は,いくつかの一般的なミトーシス検出データセットにおいて,SOTAのアプローチよりも優れた性能を示す。
論文 参考訳(メタデータ) (2023-07-12T03:33:11Z) - Imbalanced Aircraft Data Anomaly Detection [103.01418862972564]
航空シナリオ下でのセンサーからの時間データの異常検出は実用的だが難しい課題である。
本稿では,グラフィカル・テンポラル・データ分析フレームワークを提案する。
シリーズ・トゥ・イメージ (S2I) と呼ばれる3つのモジュール、ユークリッド距離 (CRD) を用いたクラスタ・ベース・リサンプリング・アプローチ、変数・ベース・ロス (VBL) から構成される。
論文 参考訳(メタデータ) (2023-05-17T09:37:07Z) - Bayesian Causal Inference in Doubly Gaussian DAG-probit Models [0.0]
ガウスDAG-プロビットモデルの概念を2つの群と2つのガウスDAG-プロビットモデルで導入する。
提案手法を総合シミュレーション実験により検証し、2つの実データに適用した。
論文 参考訳(メタデータ) (2023-04-12T16:57:47Z) - Revisiting the Evaluation of Image Synthesis with GANs [55.72247435112475]
本研究では, 合成性能の評価に関する実証的研究を行い, 生成モデルの代表としてGAN(Generative Adversarial Network)を用いた。
特に、表現空間におけるデータポイントの表現方法、選択したサンプルを用いた公平距離の計算方法、各集合から使用可能なインスタンス数など、さまざまな要素の詳細な分析を行う。
論文 参考訳(メタデータ) (2023-04-04T17:54:32Z) - Data-IQ: Characterizing subgroups with heterogeneous outcomes in tabular
data [81.43750358586072]
本稿では,サンプルをサブグループに体系的に階層化するフレームワークであるData-IQを提案する。
実世界の4つの医療データセットに対するData-IQの利点を実験的に実証した。
論文 参考訳(メタデータ) (2022-10-24T08:57:55Z) - A Graphical Model for Fusing Diverse Microbiome Data [2.385985842958366]
本稿では,このような数値データを共同でモデル化するフレキシブルな多項ガウス生成モデルを提案する。
本稿では、潜在変数とモデルのパラメータを推定するための、計算にスケーラブルな変動予測-最大化(EM)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-08-21T17:54:39Z) - On the data requirements of probing [20.965328323152608]
本稿では,データセットの探索に必要なデータサンプル数を推定する新しい手法を提案する。
我々のフレームワークは、ニューラルネットワークNLPモデルの診断のために、探索データセットを体系的に構築するのに役立つ。
論文 参考訳(メタデータ) (2022-02-25T16:27:06Z) - BCDAG: An R package for Bayesian structure and Causal learning of
Gaussian DAGs [77.34726150561087]
観測データから因果関係の発見と因果関係を推定するためのRパッケージを提案する。
我々の実装は、観測回数とともに効率的にスケールし、DAGが十分にスパースであるたびに、データセット内の変数の数を削減します。
次に、実際のデータセットとシミュレーションデータセットの両方で、主な機能とアルゴリズムを説明します。
論文 参考訳(メタデータ) (2022-01-28T09:30:32Z) - Transformer-based Multi-Aspect Modeling for Multi-Aspect Multi-Sentiment
Analysis [56.893393134328996]
本稿では,複数の側面間の潜在的な関係を抽出し,文中のすべての側面の感情を同時に検出できるトランスフォーマーベースのマルチアスペクトモデリング手法を提案する。
本手法はBERTやRoBERTaといった強力なベースラインと比較して顕著な改善を実現している。
論文 参考訳(メタデータ) (2020-11-01T11:06:31Z) - Two-Sample Testing on Ranked Preference Data and the Role of Modeling
Assumptions [57.77347280992548]
本稿では,ペアワイズ比較データとランキングデータのための2サンプル試験を設計する。
私たちのテストでは、基本的に分布に関する仮定は必要ありません。
実世界のペアワイズ比較データに2サンプルテストを適用することで、人によって提供される評価とランキングは、実際は異なる分散である、と結論付ける。
論文 参考訳(メタデータ) (2020-06-21T20:51:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。