論文の概要: JigSaw: A tool for discovering explanatory high-order interactions from
random forests
- arxiv url: http://arxiv.org/abs/2005.04342v1
- Date: Sat, 9 May 2020 01:53:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-05 06:43:03.583114
- Title: JigSaw: A tool for discovering explanatory high-order interactions from
random forests
- Title(参考訳): JigSaw: ランダム森林からの説明的高次相互作用を発見するツール
- Authors: Demetrius DiMucci
- Abstract要約: JigSawは、森林の予測を説明するパターンの発見を支援するために開発された。
心臓病に関する臨床測定のパターンを特定するために最初に使用された。
その後、血液中の代謝物を用いて乳がんに関連するパターンを見つけるために使用された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine learning is revolutionizing biology by facilitating the prediction of
outcomes from complex patterns found in massive data sets. Large biological
data sets, like those generated by transcriptome or microbiome studies,measure
many relevant components that interact in vivo with one another in modular
ways.Identifying the high-order interactions that machine learning models use
to make predictions would facilitate the development of hypotheses linking
combinations of measured components to outcome. By using the structure of
random forests, a new algorithmic approach, termed JigSaw,was developed to aid
in the discovery of patterns that could explain predictions made by the forest.
By examining the patterns of individual decision trees JigSaw identifies
high-order interactions between measured features that are strongly associated
with a particular outcome and identifies the relevant decision thresholds.
JigSaw's effectiveness was tested in simulation studies where it was able to
recover multiple ground truth patterns;even in the presence of significant
noise. It was then used to find patterns associated with outcomes in two real
world data sets.It was first used to identify patterns clinical measurements
associated with heart disease. It was then used to find patterns associated
with breast cancer using metabolites measured in the blood. In heart disease,
JigSaw identified several three-way interactions that combine to explain most
of the heart disease records (66%) with high precision (93%). In breast cancer,
three two-way interactions were recovered that can be combined to explain
almost all records (92%) with good precision (79%). JigSaw is an efficient
method for exploring high-dimensional feature spaces for rules that explain
statistical associations with a given outcome and can inspire the generation of
testable hypotheses.
- Abstract(参考訳): 機械学習は、大量のデータセットに見られる複雑なパターンの結果を予測することによって、生物学に革命をもたらす。
トランスクリプトームやマイクロバイオームの研究によって生成されたような大きな生物学的データセットは、モジュール的な方法で生体内で相互作用する多くの関連コンポーネントを測定する。機械学習モデルが予測のために使用する高次相互作用を特定することは、測定されたコンポーネントの組み合わせと結果を結びつける仮説の開発を促進する。
ランダム森林の構造を用いることで、ジグソーと呼ばれる新しいアルゴリズムアプローチが、森林の予測を説明するパターンの発見を支援するために開発された。
個々の決定木のパターンを調べることで、JigSawは特定の結果に強く関連している測定された特徴間の高次相互作用を特定し、関連する決定しきい値を特定する。
jigsawの有効性は、重要なノイズが存在する場合でも、複数の基底真理パターンを復元できるシミュレーション研究でテストされた。
その後、2つの実世界のデータセットで結果に関連するパターンを見つけるために使われ、最初に心臓病に関連する臨床測定のパターンを特定するために使用された。
その後、血液中の代謝物を用いて乳がんに関連するパターンを見つけるために用いられた。
心臓病では、ジグソーは心臓病の記録のほとんど(66%)と高い精度(93%)とを組み合わせて3方向の相互作用を発見した。
乳癌では, ほぼすべての記録 (92%) を良好な精度 (79%) で説明できる3つの双方向相互作用が回復した。
JigSawは、与えられた結果と統計的関連を説明し、検証可能な仮説を生み出すための規則のための高次元特徴空間を探索する効率的な方法である。
関連論文リスト
- Interpreting artificial neural networks to detect genome-wide association signals for complex traits [0.0]
複雑な疾患の遺伝的アーキテクチャを調べることは、遺伝的および環境要因の高度にポリジェニックでインタラクティブな景観のために困難である。
我々は、シミュレーションと実際のジェノタイプ/フェノタイプデータセットの両方を用いて、複雑な特性を予測するために、人工ニューラルネットワークを訓練した。
論文 参考訳(メタデータ) (2024-07-26T15:20:42Z) - Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - Understanding Breast Cancer Survival: Using Causality and Language
Models on Multi-omics Data [23.850817918011863]
乳がんと診断された患者の生存にゲノムの摂動がどう影響するかを調べるために因果探索アルゴリズムを利用した。
本研究は, 因果発見アルゴリズムを用いた患者の生命予後に関する重要な要因を明らかにするものである。
結果は、バイオメディカル文献に基づいて訓練された言語モデルによって検証される。
論文 参考訳(メタデータ) (2023-05-28T17:07:46Z) - Drug Synergistic Combinations Predictions via Large-Scale Pre-Training
and Graph Structure Learning [82.93806087715507]
薬物併用療法は、より有効で安全性の低い疾患治療のための確立された戦略である。
ディープラーニングモデルは、シナジスティックな組み合わせを発見する効率的な方法として登場した。
我々のフレームワークは、他のディープラーニングベースの手法と比較して最先端の結果を達成する。
論文 参考訳(メタデータ) (2023-01-14T15:07:43Z) - Unsupervised ensemble-based phenotyping helps enhance the
discoverability of genes related to heart morphology [57.25098075813054]
我々はUn Phenotype Ensemblesという名の遺伝子発見のための新しいフレームワークを提案する。
教師なしの方法で学習された表現型のセットをプールすることで、冗長だが非常に表現性の高い表現を構築する。
これらの表現型は、(GWAS)を介して分析され、高い自信と安定した関連のみを保持する。
論文 参考訳(メタデータ) (2023-01-07T18:36:44Z) - Federated Learning Enables Big Data for Rare Cancer Boundary Detection [98.5549882883963]
6大陸にわたる71の医療機関のデータを含む,これまでで最大のフェデレーテッドML研究の結果を報告する。
グリオ芽腫の稀な疾患に対する腫瘍境界自動検出装置を作製した。
当科では, 外科的に標的とした腫瘍の悪性度を高めるために, 33%の改善率を示し, 腫瘍全体に対する23%の改善率を示した。
論文 参考訳(メタデータ) (2022-04-22T17:27:00Z) - Robust Hierarchical Patterns for identifying MDD patients: A Multisite
Study [3.4561220135252264]
大うつ病(MDD)のバイオマーカーとしての階層的スパース接続パターン(h SCP)について検討する。
我々は、静止状態fMRIデータから抽出した機能的接続行列からMDD患者を予測するためのh SCPに基づく新しいモデルを提案する。
本研究の結果は,多様性が予測性能に与える影響を示し,多様性を低減し,コンポーネントの予測・一般化能力を向上させることができる。
論文 参考訳(メタデータ) (2022-02-22T19:40:32Z) - Deep neural networks approach to microbial colony detection -- a
comparative analysis [52.77024349608834]
本稿では,AGARデータセットを用いた3つの深層学習手法の性能について検討する。
得られた結果は将来の実験のベンチマークとして機能するかもしれない。
論文 参考訳(メタデータ) (2021-08-23T12:06:00Z) - Risk factor identification for incident heart failure using neural
network distillation and variable selection [24.366241122862473]
リスク関連同定のための確立されたディープラーニングモデルによって学習された隠れたパターンを解く2つの方法を提案する。
788,880例(8.3%の心不全)のコホートが検討された。
モデル蒸留では, 心不全に関連する598例と379例を, 人口レベルでそれぞれ同定した。
これらの重要な集団レベルの知見に加えて, 臨床における心不全の出現を考慮し, 個人レベルでの解釈へのアプローチを開発した。
論文 参考訳(メタデータ) (2021-02-17T10:20:38Z) - Data-Driven Logistic Regression Ensembles With Applications in Genomics [0.0]
本稿では,正規化とアンサンブルのアイデアを組み合わせた高次元二項分類問題に対する新しいアプローチを提案する。
がん,多発性硬化症,乾皮症などの共通疾患を含むいくつかの医学的データセットを用いて,バイオマーカーの予測精度と同定の点で,本手法の優れた性能を実証した。
論文 参考訳(メタデータ) (2021-02-17T05:57:26Z) - Modeling Shared Responses in Neuroimaging Studies through MultiView ICA [94.31804763196116]
被験者の大規模なコホートを含むグループ研究は、脳機能組織に関する一般的な結論を引き出す上で重要である。
グループ研究のための新しい多視点独立成分分析モデルを提案し、各被験者のデータを共有独立音源と雑音の線形結合としてモデル化する。
まず、fMRIデータを用いて、被験者間の共通音源の同定における感度の向上を示す。
論文 参考訳(メタデータ) (2020-06-11T17:29:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。