論文の概要: BioBLP: A Modular Framework for Learning on Multimodal Biomedical
Knowledge Graphs
- arxiv url: http://arxiv.org/abs/2306.03606v1
- Date: Tue, 6 Jun 2023 11:49:38 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-07 15:46:16.102770
- Title: BioBLP: A Modular Framework for Learning on Multimodal Biomedical
Knowledge Graphs
- Title(参考訳): BioBLP: マルチモーダルなバイオメディカル知識グラフを学習するためのモジュールフレームワーク
- Authors: Daniel Daza, Dimitrios Alivanistos, Payal Mitra, Thom Pijnenburg,
Michael Cochez, Paul Groth
- Abstract要約: 知識グラフへの埋め込みを学習するためのモジュラーフレームワークを提案する。
異なるモダリティの属性データをエンコードできると同時に、属性が欠けているエンティティもサポートする。
約200万トリプルのバイオメディカルKGを用いてモデルを訓練する。
- 参考スコア(独自算出の注目度): 3.780924717521521
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Knowledge graphs (KGs) are an important tool for representing complex
relationships between entities in the biomedical domain. Several methods have
been proposed for learning embeddings that can be used to predict new links in
such graphs. Some methods ignore valuable attribute data associated with
entities in biomedical KGs, such as protein sequences, or molecular graphs.
Other works incorporate such data, but assume that entities can be represented
with the same data modality. This is not always the case for biomedical KGs,
where entities exhibit heterogeneous modalities that are central to their
representation in the subject domain.
We propose a modular framework for learning embeddings in KGs with entity
attributes, that allows encoding attribute data of different modalities while
also supporting entities with missing attributes. We additionally propose an
efficient pretraining strategy for reducing the required training runtime. We
train models using a biomedical KG containing approximately 2 million triples,
and evaluate the performance of the resulting entity embeddings on the tasks of
link prediction, and drug-protein interaction prediction, comparing against
methods that do not take attribute data into account. In the standard link
prediction evaluation, the proposed method results in competitive, yet lower
performance than baselines that do not use attribute data. When evaluated in
the task of drug-protein interaction prediction, the method compares favorably
with the baselines. We find settings involving low degree entities, which make
up for a substantial amount of the set of entities in the KG, where our method
outperforms the baselines. Our proposed pretraining strategy yields
significantly higher performance while reducing the required training runtime.
Our implementation is available at https://github.com/elsevier-AI-Lab/BioBLP .
- Abstract(参考訳): 知識グラフ(KG)は、生物医学領域におけるエンティティ間の複雑な関係を表現する重要なツールである。
このようなグラフにおける新しいリンクを予測できる埋め込み学習法が提案されている。
いくつかの方法は、タンパク質配列や分子グラフなどの生物医学的なKGの実体に関連する貴重な属性データを無視する。
他の研究はそのようなデータを含むが、エンティティは同じデータモダリティで表現できると仮定する。
生物医学的なKGでは、実体は対象領域におけるその表現の中心となる異質なモダリティを示す。
本研究では,異なる属性の属性データをエンコードすると同時に,属性の欠如したエンティティもサポートする,エンティティ属性付きkgs組込み学習のためのモジュールフレームワークを提案する。
さらに,必要なトレーニング実行時間を削減するための効率的な事前トレーニング戦略を提案する。
我々は,約200万トリプルの生物医学的KGを用いてモデルを訓練し,リンク予測や薬物とタンパク質の相互作用予測のタスクに対する実体埋め込みの性能を評価し,属性データを考慮しない手法と比較した。
標準リンク予測評価では,提案手法は属性データを使用しないベースラインに比べて,競争力は低いが,性能は低い。
薬物-タンパク質相互作用予測のタスクで評価すると,本手法は基準値と良好に比較される。
我々は、KG内のエンティティのセットのかなりの部分を占める低次エンティティを含む設定を見つけ、そこでは、メソッドがベースラインより優れています。
提案するプリトレーニング戦略は,要求されるトレーニングランタイムを削減しつつ,パフォーマンスを著しく向上させる。
私たちの実装はhttps://github.com/elsevier-AI-Lab/BioBLPで利用可能です。
関連論文リスト
- Extracting Protein-Protein Interactions (PPIs) from Biomedical
Literature using Attention-based Relational Context Information [5.456047952635665]
本研究は,二元的相互作用型ラベルを付加したベット型相互作用定義を用いた多元的PPIコーパスを提案する。
変換器を用いた深層学習手法は,関係表現のための関係文脈情報を利用して関係分類性能を向上させる。
このモデルの性能は, 広く研究されている4つのバイオメディカル関係抽出データセットで評価される。
論文 参考訳(メタデータ) (2024-03-08T01:43:21Z) - Pseudo Label-Guided Data Fusion and Output Consistency for
Semi-Supervised Medical Image Segmentation [9.93871075239635]
より少ないアノテーションで医用画像のセグメンテーションを行うための平均教師ネットワーク上に構築されたPLGDFフレームワークを提案する。
本稿では,ラベル付きデータとラベルなしデータを組み合わせてデータセットを効果的に拡張する,新しい擬似ラベル利用方式を提案する。
本フレームワークは,最先端の6つの半教師あり学習手法と比較して,優れた性能が得られる。
論文 参考訳(メタデータ) (2023-11-17T06:36:43Z) - BioREx: Improving Biomedical Relation Extraction by Leveraging
Heterogeneous Datasets [7.7587371896752595]
生物医学的関係抽出(RE)は、生物医学的自然言語処理(NLP)研究における中心的な課題である。
本稿では、個々のデータセットのデータの均一性を体系的に解決し、それらを大きなデータセットに組み合わせるための新しいフレームワークを提案する。
評価の結果,BioRExは個々のデータセットでトレーニングしたベンチマークシステムよりも大幅に高い性能を示すことがわかった。
論文 参考訳(メタデータ) (2023-06-19T22:48:18Z) - Learnable Weight Initialization for Volumetric Medical Image Segmentation [66.3030435676252]
本稿では,学習可能な重みに基づくハイブリッド医療画像セグメンテーション手法を提案する。
我々のアプローチはどんなハイブリッドモデルにも簡単に統合でき、外部のトレーニングデータを必要としない。
多臓器・肺がんセグメンテーションタスクの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-06-15T17:55:05Z) - Drug Synergistic Combinations Predictions via Large-Scale Pre-Training
and Graph Structure Learning [82.93806087715507]
薬物併用療法は、より有効で安全性の低い疾患治療のための確立された戦略である。
ディープラーニングモデルは、シナジスティックな組み合わせを発見する効率的な方法として登場した。
我々のフレームワークは、他のディープラーニングベースの手法と比較して最先端の結果を達成する。
論文 参考訳(メタデータ) (2023-01-14T15:07:43Z) - Tyger: Task-Type-Generic Active Learning for Molecular Property
Prediction [121.97742787439546]
分子の性質を正確に予測する方法は、AIによる薬物発見において重要な問題である。
アノテーションのコストを削減するため,注釈付けのための最も代表的で情報性の高いデータのみを選択するために,深層能動学習法が開発された。
本稿では,異なるタイプの学習タスクを統一的に処理できるタスク型汎用能動的学習フレームワーク(Tyger)を提案する。
論文 参考訳(メタデータ) (2022-05-23T12:56:12Z) - Slot Filling for Biomedical Information Extraction [0.5330240017302619]
バイオメディカルIEの課題に対してスロットフィリングアプローチを提案する。
我々は、トランフォーマベースのバイエンコーダDense Passage RetrievalをTransformerベースのリーダーモデルと結合する提案パラダイムに従う。
論文 参考訳(メタデータ) (2021-09-17T14:16:00Z) - EchoEA: Echo Information between Entities and Relations for Entity
Alignment [1.1470070927586016]
本稿では,エンティティ情報を関係に拡散し,エンティティにエコーバックする自己認識機構を活用した新しいフレームワーク Echo Entity Alignment (EchoEA) を提案する。
3つの実世界のクロスランガルデータセットの実験結果は、平均して96%で安定している。
論文 参考訳(メタデータ) (2021-07-07T07:34:21Z) - Scientific Language Models for Biomedical Knowledge Base Completion: An
Empirical Study [62.376800537374024]
我々は,KG の完成に向けた科学的 LM の研究を行い,生物医学的リンク予測を強化するために,その潜在知識を活用できるかどうかを探る。
LMモデルとKG埋め込みモデルを統合し,各入力例をいずれかのモデルに割り当てることを学ぶルータ法を用いて,性能を大幅に向上させる。
論文 参考訳(メタデータ) (2021-06-17T17:55:33Z) - SumGNN: Multi-typed Drug Interaction Prediction via Efficient Knowledge
Graph Summarization [64.56399911605286]
本稿では,サブグラフ抽出モジュールによって実現された知識要約グラフニューラルネットワークSumGNNを提案する。
SumGNNは5.54%まで最高のベースラインを上回り、データ関係の低いタイプでは特にパフォーマンスの向上が顕著である。
論文 参考訳(メタデータ) (2020-10-04T00:14:57Z) - A Trainable Optimal Transport Embedding for Feature Aggregation and its
Relationship to Attention [96.77554122595578]
固定サイズのパラメータ化表現を導入し、与えられた入力セットから、そのセットとトレーニング可能な参照の間の最適な輸送計画に従って要素を埋め込み、集約する。
我々のアプローチは大規模なデータセットにスケールし、参照のエンドツーエンドのトレーニングを可能にすると同時に、計算コストの少ない単純な教師なし学習メカニズムも提供する。
論文 参考訳(メタデータ) (2020-06-22T08:35:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。