論文の概要: Extracting Protein-Protein Interactions (PPIs) from Biomedical
Literature using Attention-based Relational Context Information
- arxiv url: http://arxiv.org/abs/2403.05602v1
- Date: Fri, 8 Mar 2024 01:43:21 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-13 13:12:58.616734
- Title: Extracting Protein-Protein Interactions (PPIs) from Biomedical
Literature using Attention-based Relational Context Information
- Title(参考訳): 注意に基づく関連情報を用いた生体医学文献からの蛋白質間相互作用(ppis)の抽出
- Authors: Gilchan Park, Sean McCorkle, Carlos Soto, Ian Blaby, Shinjae Yoo
- Abstract要約: 本研究は,二元的相互作用型ラベルを付加したベット型相互作用定義を用いた多元的PPIコーパスを提案する。
変換器を用いた深層学習手法は,関係表現のための関係文脈情報を利用して関係分類性能を向上させる。
このモデルの性能は, 広く研究されている4つのバイオメディカル関係抽出データセットで評価される。
- 参考スコア(独自算出の注目度): 5.456047952635665
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Because protein-protein interactions (PPIs) are crucial to understand living
systems, harvesting these data is essential to probe disease development and
discern gene/protein functions and biological processes. Some curated datasets
contain PPI data derived from the literature and other sources (e.g., IntAct,
BioGrid, DIP, and HPRD). However, they are far from exhaustive, and their
maintenance is a labor-intensive process. On the other hand, machine learning
methods to automate PPI knowledge extraction from the scientific literature
have been limited by a shortage of appropriate annotated data. This work
presents a unified, multi-source PPI corpora with vetted interaction
definitions augmented by binary interaction type labels and a Transformer-based
deep learning method that exploits entities' relational context information for
relation representation to improve relation classification performance. The
model's performance is evaluated on four widely studied biomedical relation
extraction datasets, as well as this work's target PPI datasets, to observe the
effectiveness of the representation to relation extraction tasks in various
data. Results show the model outperforms prior state-of-the-art models. The
code and data are available at:
https://github.com/BNLNLP/PPI-Relation-Extraction
- Abstract(参考訳): タンパク質とタンパク質の相互作用(PPI)は生体系を理解するために重要であるため、これらのデータの収集は疾患の発生を調査し、遺伝子/タンパク質の機能と生物学的過程を識別するために不可欠である。
キュレートされたデータセットの中には、文学やその他の情報源(例えば、IntAct、BioGrid、DIP、HPRD)に由来するPPIデータが含まれている。
しかし、彼らは疲れ果てず、メンテナンスは労働集約的なプロセスである。
一方,学術文献からのppi知識抽出を自動化する機械学習手法は,適切な注釈データの不足により制限されている。
本研究は,バイナリインタラクション型ラベルによって拡張されたvetedインタラクション定義を備えた多元ppiコーパスと,関係表現のためのエンティティのリレーショナルコンテキスト情報を活用して関係分類性能を向上させるトランスフォーマティブベースのディープラーニング手法を提案する。
本研究は,4つの生物医学的関係抽出データセットと本研究の対象PPIデータセットを用いて評価し,各種データにおける関係抽出タスクに対する表現の有効性について検討した。
結果は,そのモデルが先行する最先端モデルを上回ることを示している。
コードとデータは、https://github.com/bnlnlp/ppi-relation-extractionで入手できる。
関連論文リスト
- Graph Relation Distillation for Efficient Biomedical Instance
Segmentation [80.51124447333493]
本稿では,効率的なバイオメディカル・インスタンス・セグメンテーションのためのグラフ関係蒸留手法を提案する。
画像内レベルと画像間レベルの両方に展開する2つのグラフ蒸留方式を導入する。
多くのバイオメディカルデータセットの実験結果から,本手法の有効性が検証された。
論文 参考訳(メタデータ) (2024-01-12T04:41:23Z) - The SourceData-NLP dataset: integrating curation into scientific
publishing for training large language models [1.0423199374671421]
本稿では,出版過程における論文の定期的なキュレーションを通じて生成したSourceData-NLPデータセットについて述べる。
このデータセットは、分子生物学と細胞生物学の3,223の論文で18,689個の数字から算出された、620,000以上の注釈付き生物医学的な実体を含んでいる。
論文 参考訳(メタデータ) (2023-10-31T13:22:38Z) - BioREx: Improving Biomedical Relation Extraction by Leveraging
Heterogeneous Datasets [7.7587371896752595]
生物医学的関係抽出(RE)は、生物医学的自然言語処理(NLP)研究における中心的な課題である。
本稿では、個々のデータセットのデータの均一性を体系的に解決し、それらを大きなデータセットに組み合わせるための新しいフレームワークを提案する。
評価の結果,BioRExは個々のデータセットでトレーニングしたベンチマークシステムよりも大幅に高い性能を示すことがわかった。
論文 参考訳(メタデータ) (2023-06-19T22:48:18Z) - BioBLP: A Modular Framework for Learning on Multimodal Biomedical
Knowledge Graphs [3.780924717521521]
知識グラフへの埋め込みを学習するためのモジュラーフレームワークを提案する。
異なるモダリティの属性データをエンコードできると同時に、属性が欠けているエンティティもサポートする。
約200万トリプルのバイオメディカルKGを用いてモデルを訓練する。
論文 参考訳(メタデータ) (2023-06-06T11:49:38Z) - SemiGNN-PPI: Self-Ensembling Multi-Graph Neural Network for Efficient
and Generalizable Protein-Protein Interaction Prediction [16.203794286288815]
タンパク質とタンパク質の相互作用(PPI)は様々な生物学的プロセスにおいて重要であり、その研究は薬物開発や疾患の診断に重要な意味を持つ。
既存のディープラーニング手法は、複雑な実世界のシナリオ下での大幅なパフォーマンス劣化に悩まされる。
本稿では,PPIの効率と一般化性を両立させつつ,PPIを効果的に予測できる自己認識型マルチグラフニューラルネットワーク(SemiGNN-PPI)を提案する。
論文 参考訳(メタデータ) (2023-05-15T03:06:44Z) - Does Synthetic Data Generation of LLMs Help Clinical Text Mining? [51.205078179427645]
臨床テキストマイニングにおけるOpenAIのChatGPTの可能性を検討する。
本稿では,高品質な合成データを大量に生成する新たな学習パラダイムを提案する。
提案手法により,下流タスクの性能が大幅に向上した。
論文 参考訳(メタデータ) (2023-03-08T03:56:31Z) - Combining Feature and Instance Attribution to Detect Artifacts [62.63504976810927]
トレーニングデータアーティファクトの識別を容易にする手法を提案する。
提案手法は,トレーニングデータのアーティファクトの発見に有効であることを示す。
我々は,これらの手法が実際にNLP研究者にとって有用かどうかを評価するために,小規模なユーザスタディを実施している。
論文 参考訳(メタデータ) (2021-07-01T09:26:13Z) - Type-augmented Relation Prediction in Knowledge Graphs [65.88395564516115]
本稿では,タイプ情報とインスタンスレベルの情報の両方を関係予測に適用するタイプ拡張関係予測(TaRP)手法を提案する。
提案手法は,4つのベンチマークデータセット上での最先端手法よりも高い性能を実現する。
論文 参考訳(メタデータ) (2020-09-16T21:14:18Z) - Assigning function to protein-protein interactions: a weakly supervised
BioBERT based approach using PubMed abstracts [2.208694022993555]
タンパク質とタンパク質の相互作用(PPI)は正常細胞と疾患細胞のタンパク質の機能に重要である。
タンパク質相互作用データベースで取得されるPPIのごく一部に、機能アノテーションがある。
本稿では,PubMed の要約に記述された関係を抽出することで,PPIの関数型をラベル付けすることを目的とする。
論文 参考訳(メタデータ) (2020-08-20T01:42:28Z) - A Trainable Optimal Transport Embedding for Feature Aggregation and its
Relationship to Attention [96.77554122595578]
固定サイズのパラメータ化表現を導入し、与えられた入力セットから、そのセットとトレーニング可能な参照の間の最適な輸送計画に従って要素を埋め込み、集約する。
我々のアプローチは大規模なデータセットにスケールし、参照のエンドツーエンドのトレーニングを可能にすると同時に、計算コストの少ない単純な教師なし学習メカニズムも提供する。
論文 参考訳(メタデータ) (2020-06-22T08:35:58Z) - Mining Implicit Entity Preference from User-Item Interaction Data for
Knowledge Graph Completion via Adversarial Learning [82.46332224556257]
本稿では,知識グラフ補完タスクにおけるユーザインタラクションデータを活用することで,新たな逆学習手法を提案する。
我々のジェネレータはユーザインタラクションデータから分離されており、識別器の性能を向上させるのに役立ちます。
利用者の暗黙の実体的嗜好を発見するために,グラフニューラルネットワークに基づく精巧な協調学習アルゴリズムを設計する。
論文 参考訳(メタデータ) (2020-03-28T05:47:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。