論文の概要: Finding Groups of Cross-Correlated Features in Bi-View Data
- arxiv url: http://arxiv.org/abs/2009.05079v4
- Date: Mon, 13 May 2024 23:39:28 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-15 20:27:15.178931
- Title: Finding Groups of Cross-Correlated Features in Bi-View Data
- Title(参考訳): バイビューデータにおけるクロスコレクティブな特徴群の探索
- Authors: Miheer Dewaskar, John Palowitch, Mark He, Michael I. Love, Andrew B. Nobel,
- Abstract要約: 本稿では, 安定な双加群を同定する反復テストに基づく双加群探索手法を提案する。
本稿では,GTExコンソーシアムのデータを用いて,BSPを量的特性ローチ(eQTL)解析の問題に適用する。
- 参考スコア(独自算出の注目度): 3.6665136466289376
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Datasets in which measurements of two (or more) types are obtained from a common set of samples arise in many scientific applications. A common problem in the exploratory analysis of such data is to identify groups of features of different data types that are strongly associated. A bimodule is a pair (A,B) of feature sets from two data types such that the aggregate cross-correlation between the features in A and those in B is large. A bimodule (A,B) is stable if A coincides with the set of features that have significant aggregate correlation with the features in B, and vice-versa. This paper proposes an iterative-testing based bimodule search procedure (BSP) to identify stable bimodules. Compared to existing methods for detecting cross-correlated features, BSP was the best at recovering true bimodules with sufficient signal, while limiting the false discoveries. In addition, we applied BSP to the problem of expression quantitative trait loci (eQTL) analysis using data from the GTEx consortium. BSP identified several thousand SNP-gene bimodules. While many of the individual SNP-gene pairs appearing in the discovered bimodules were identified by standard eQTL methods, the discovered bimodules revealed genomic subnetworks that appeared to be biologically meaningful and worthy of further scientific investigation.
- Abstract(参考訳): 2つの(またはそれ以上の)タイプの測定が共通のサンプルセットから得られるデータセットは、多くの科学的応用に現れる。
このようなデータの探索分析における一般的な問題は、強く関連付けられた異なるデータ型の特徴のグループを特定することである。
双加群 (bimodule) は、2つのデータ型から得られる特徴集合の対 (A,B) であり、A と B の特徴の間の集合の相互相関は大きい。
双加群 (A, B) が安定であれば、A が B の特徴と有意な集合相関を持つ特徴の集合と一致する。
本稿では, 安定な双加群を特定するために, 反復テストに基づく双加群探索法(BSP)を提案する。
クロスコラージュな特徴を検出する既存の方法と比較して、BSPは偽の発見を制限しつつ、十分な信号で真の双加群を回復する最良の方法であった。
さらに,BSPをGTExコンソーシアムのデータを用いた量的特性ローチ(eQTL)解析問題に適用した。
BSPは数千のSNP遺伝子バイモジュールを同定した。
検出されたSNP遺伝子対の多くは標準のeQTL法で同定されたが、発見されたバイモジュールは生物学的に有意義で、さらなる科学的研究に値するように見えるゲノムサブネットを明らかにした。
関連論文リスト
- Computational-Statistical Gaps in Gaussian Single-Index Models [77.1473134227844]
単次元モデル(Single-Index Models)は、植木構造における高次元回帰問題である。
我々は,統計的クエリ (SQ) と低遅延多項式 (LDP) フレームワークの両方において,計算効率のよいアルゴリズムが必ずしも$Omega(dkstar/2)$サンプルを必要とすることを示した。
論文 参考訳(メタデータ) (2024-03-08T18:50:19Z) - Fundamental limits of community detection from multi-view data:
multi-layer, dynamic and partially labeled block models [7.778975741303385]
現代のネットワーク分析におけるマルチビューデータのコミュニティ検出について検討する。
我々は,データと潜在パラメータ間の相互情報を特徴付ける。
コミュニティ検出のための近似メッセージパッシングに基づく反復アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-01-16T07:13:32Z) - Rethinking Mitosis Detection: Towards Diverse Data and Feature
Representation [30.882319057927052]
ミトコンドリア検出のための新しい一般化可能なフレームワーク(MitDet)を提案する。
提案手法は,いくつかの一般的なミトーシス検出データセットにおいて,SOTAのアプローチよりも優れた性能を示す。
論文 参考訳(メタデータ) (2023-07-12T03:33:11Z) - Composite Feature Selection using Deep Ensembles [130.72015919510605]
本研究では,事前定義されたグループ化を伴わない予測的特徴群発見の問題について検討する。
本稿では,特徴選択モデルのアンサンブルを用いて予測グループを探索する,新しいディープラーニングアーキテクチャを提案する。
発見群と基底真理の類似性を測定するための新しい尺度を提案する。
論文 参考訳(メタデータ) (2022-11-01T17:49:40Z) - BCDAG: An R package for Bayesian structure and Causal learning of
Gaussian DAGs [77.34726150561087]
観測データから因果関係の発見と因果関係を推定するためのRパッケージを提案する。
我々の実装は、観測回数とともに効率的にスケールし、DAGが十分にスパースであるたびに、データセット内の変数の数を削減します。
次に、実際のデータセットとシミュレーションデータセットの両方で、主な機能とアルゴリズムを説明します。
論文 参考訳(メタデータ) (2022-01-28T09:30:32Z) - Boolean Reasoning-Based Biclustering for Shifting Pattern Extraction [0.20305676256390928]
Biclusteringは、さまざまな種類の関心のあるパターンの品質を測定する機能によって駆動されるため、データ内のパターンを検索するための強力なアプローチです。
シフトパターンはデータの変動が一定であるので、特に興味深い。
この研究は、ブール推論によるシフトパターンの誘導は、すべての包含-最大デルタシフトパターンを見つける能力によるものであることを示す。
論文 参考訳(メタデータ) (2021-04-26T11:40:17Z) - A hierarchical Bayesian model to find brain-behaviour associations in
incomplete data sets [0.0]
グループファクター分析(GFA)は、ベイジアン推論とモダリティ特有の関連をモデル化する階層モデルである。
ヒトコネクトームプロジェクト(HCP)からの脳の接続性および非画像対策からなる合成および実データにGFAを適用しました。
GFAは、基礎となる共有および特定の要因を明らかにし、完全な不完全なデータセットで観測されていないデータモダリティを正しく予測した。
論文 参考訳(メタデータ) (2021-03-11T18:14:11Z) - Group Testing with a Graph Infection Spread Model [61.48558770435175]
感染は個人間のつながりを通じて広がり、その結果、確率的クラスター形成構造と、個人に対する非i.d.感染状態が生じる。
そこで本研究では,既知の確率的感染拡散モデルを利用する2段階のサンプルグループテストアルゴリズムを提案する。
その結果, 感染率が高い場合でも, 集団検査により必要な検査数を大幅に削減できることが示唆された。
論文 参考訳(メタデータ) (2021-01-14T18:51:32Z) - Transformer-based Multi-Aspect Modeling for Multi-Aspect Multi-Sentiment
Analysis [56.893393134328996]
本稿では,複数の側面間の潜在的な関係を抽出し,文中のすべての側面の感情を同時に検出できるトランスフォーマーベースのマルチアスペクトモデリング手法を提案する。
本手法はBERTやRoBERTaといった強力なベースラインと比較して顕著な改善を実現している。
論文 参考訳(メタデータ) (2020-11-01T11:06:31Z) - A Novel Granular-Based Bi-Clustering Method of Deep Mining the
Co-Expressed Genes [76.84066556597342]
ビクラスタリング法は、サンプル(遺伝子)のサブセットが試験条件下で協調的に制御されるバイクラスタをマイニングするために用いられる。
残念ながら、従来の二クラスタ法はそのような二クラスタを発見するのに完全には効果がない。
本稿では,グラニュラーコンピューティングの理論を取り入れた新しい2クラスタリング手法を提案する。
論文 参考訳(メタデータ) (2020-05-12T02:04:40Z) - Directionally Dependent Multi-View Clustering Using Copula Model [3.5097082077065]
ゲノム研究では、DNAの発現、DNAメチル化、RNAの発現に何らかの方向依存がある。
既存のマルチビュークラスタリングメソッドのほとんどは、独立した構造か、ペアワイズ(非方向性)の依存性を前提としています。
本論文では,コプラを用いたマルチビュークラスタリングモデルを提案する。
論文 参考訳(メタデータ) (2020-03-17T02:04:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。