論文の概要: AGATHA: Automatic Graph-mining And Transformer based Hypothesis
generation Approach
- arxiv url: http://arxiv.org/abs/2002.05635v1
- Date: Thu, 13 Feb 2020 17:06:47 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-01 09:51:41.509303
- Title: AGATHA: Automatic Graph-mining And Transformer based Hypothesis
generation Approach
- Title(参考訳): agatha:自動グラフマイニングとトランスフォーマーに基づく仮説生成アプローチ
- Authors: Justin Sybrandt, Ilya Tyagin, Michael Shtutman, Ilya Safro
- Abstract要約: 本稿では,発見過程の早い段階でデータ駆動的な洞察を導入する仮説生成システムを提案する。
AGATHAは、エンティティセット間で有効な用語ペアを優先し、新たな研究方向性を推奨します。
本システムは,確立したベンチマークにおいて,クラス内での最高の性能を実現する。
- 参考スコア(独自算出の注目度): 1.7954335118363964
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Medical research is risky and expensive. Drug discovery, as an example,
requires that researchers efficiently winnow thousands of potential targets to
a small candidate set for more thorough evaluation. However, research groups
spend significant time and money to perform the experiments necessary to
determine this candidate set long before seeing intermediate results.
Hypothesis generation systems address this challenge by mining the wealth of
publicly available scientific information to predict plausible research
directions. We present AGATHA, a deep-learning hypothesis generation system
that can introduce data-driven insights earlier in the discovery process.
Through a learned ranking criteria, this system quickly prioritizes plausible
term-pairs among entity sets, allowing us to recommend new research directions.
We massively validate our system with a temporal holdout wherein we predict
connections first introduced after 2015 using data published beforehand. We
additionally explore biomedical sub-domains, and demonstrate AGATHA's
predictive capacity across the twenty most popular relationship types. This
system achieves best-in-class performance on an established benchmark, and
demonstrates high recommendation scores across subdomains. Reproducibility: All
code, experimental data, and pre-trained models are available online:
sybrandt.com/2020/agatha
- Abstract(参考訳): 医学研究は危険で高価である。
例えば、薬の発見は、研究者がより詳細な評価のために小さな候補に数千の潜在的なターゲットを効率的に得ることを要求する。
しかし、研究グループは中間結果を見るよりもずっと前にこの候補を決定するのに必要な実験を行うのにかなりの時間と費用を費やしている。
仮説生成システムは、入手可能な研究方向を予測するために、公開可能な科学情報の富をマイニングすることで、この問題に対処する。
agathaは,発見プロセスの早い段階でデータ駆動型洞察を導入可能な,ディープラーニング仮説生成システムである。
学習されたランキング基準により、エンティティセット間の妥当な用語ペアを迅速に優先順位付けし、新しい研究方向を推薦する。
我々は,2015年以降に前もって公表されたデータを用いて接続を最初に予測する時間的ホールドアウトを用いて,システムを大規模に検証した。
さらに,生体医学的なサブドメインを探索し,アガサの最も人気のある関係タイプ20種における予測能力を示す。
本システムは,確立したベンチマークで最高のクラス性能を示し,サブドメイン間で高いレコメンデーションスコアを示す。
再現性: sybrandt.com/2020/agatha のすべてのコード、実験データ、事前訓練済みモデルがオンラインで利用可能である。
関連論文リスト
- Rapid Biomedical Research Classification: The Pandemic PACT Advanced Categorisation Engine [10.692728349388297]
Pandemic PACTプロジェクトは、アウトブレイクの可能性のある幅広い病気の研究資金と臨床証拠を追跡し、分析することを目的としている。
本稿では,Pandemic PACT Advanced Categorisation Engine(PPACE)と関連するデータセットを紹介する。
論文 参考訳(メタデータ) (2024-07-14T05:22:53Z) - Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - Data-driven Discovery with Large Generative Models [47.324203863823335]
このポジションペーパーは、機械学習(ML)コミュニティに、大規模生成モデル(LGM)の能力を活用するよう促す。
我々は、LGMが理想的なデータ駆動探索システムのために、どのようにいくつかのデシラタを満たすかを実証する。
我々は,フィードバック機構によるアクティブなユーザモデレーションとともに,フェールプロテクションツールの統合を提唱する。
論文 参考訳(メタデータ) (2024-02-21T08:26:43Z) - Dyport: Dynamic Importance-based Hypothesis Generation Benchmarking
Technique [2.0077755400451855]
本稿では,バイオメディカル仮説生成システムを評価するためのベンチマークフレームワークDyportを提案する。
我々は、キュレートされたデータベースからの知識を動的グラフに統合し、発見の重要性を定量化する手法を伴っている。
フレキシブルなベンチマークシステムは,仮説生成の品質検証に広く適用するために設計されている。
論文 参考訳(メタデータ) (2023-12-06T06:07:50Z) - GFlowNets for AI-Driven Scientific Discovery [74.27219800878304]
我々はGFlowNetsと呼ばれる新しい確率論的機械学習フレームワークを提案する。
GFlowNetsは、実験科学ループのモデリング、仮説生成、実験的な設計段階に適用できる。
我々は、GFlowNetsがAIによる科学的発見の貴重なツールになり得ると論じている。
論文 参考訳(メタデータ) (2023-02-01T17:29:43Z) - Drug Synergistic Combinations Predictions via Large-Scale Pre-Training
and Graph Structure Learning [82.93806087715507]
薬物併用療法は、より有効で安全性の低い疾患治療のための確立された戦略である。
ディープラーニングモデルは、シナジスティックな組み合わせを発見する効率的な方法として登場した。
我々のフレームワークは、他のディープラーニングベースの手法と比較して最先端の結果を達成する。
論文 参考訳(メタデータ) (2023-01-14T15:07:43Z) - Parametric Classification for Generalized Category Discovery: A Baseline
Study [70.73212959385387]
Generalized Category Discovery (GCD)は、ラベル付きサンプルから学習した知識を用いて、ラベルなしデータセットで新しいカテゴリを発見することを目的としている。
パラメトリック分類器の故障を調査し,高品質な監視が可能であった場合の過去の設計選択の有効性を検証し,信頼性の低い疑似ラベルを重要課題として同定する。
エントロピー正規化の利点を生かし、複数のGCDベンチマークにおける最先端性能を実現し、未知のクラス数に対して強いロバスト性を示す、単純で効果的なパラメトリック分類法を提案する。
論文 参考訳(メタデータ) (2022-11-21T18:47:11Z) - Benchmarking Predictive Risk Models for Emergency Departments with Large
Public Electronic Health Records [7.928862476020428]
大規模な公開 EHR に基づく広く受け入れられている ED ベンチマークは存在しない。
我々は、パブリックEDベンチマークスイートを提案し、2011年から2019年までの50万回のED訪問を含むベンチマークデータセットを得た。
私たちのコードはオープンソースなので、MIMIC-IV-EDにアクセス可能な人は、データ処理の同じステップを辿り、ベンチマークを構築し、実験を再現できます。
論文 参考訳(メタデータ) (2021-11-22T06:51:11Z) - Accelerating COVID-19 research with graph mining and transformer-based
learning [2.493740042317776]
新型コロナウイルス研究のための汎用仮説自動生成システムAGATHA-CとAGATHA-GPを紹介します。
どちらのシステムも、高速な計算時間でドメイン(一部のドメインでは0.97%のROC AUC)間で高品質の予測を実現します。
これらのシステムは、新型コロナウイルスとオキシトシンホルモンの関係など、現在進行中の研究成果を発見できることを示す。
論文 参考訳(メタデータ) (2021-02-10T15:11:36Z) - Opportunities and Challenges of Deep Learning Methods for
Electrocardiogram Data: A Systematic Review [62.490310870300746]
心電図(Electrocardiogram、ECG)は、医学および医療において最も一般的に用いられる診断ツールの1つである。
深層学習法は心電図信号を用いた予測医療タスクにおいて有望な結果を得た。
本稿では、モデリングとアプリケーションの観点から、ECGデータに対するディープラーニング手法の体系的なレビューを行う。
論文 参考訳(メタデータ) (2019-12-28T02:44:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。