論文の概要: Rapid Biomedical Research Classification: The Pandemic PACT Advanced Categorisation Engine
- arxiv url: http://arxiv.org/abs/2407.10086v2
- Date: Fri, 19 Jul 2024 14:28:26 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-22 21:49:14.900206
- Title: Rapid Biomedical Research Classification: The Pandemic PACT Advanced Categorisation Engine
- Title(参考訳): バイオメディカル研究の迅速分類:パンデミックPACT先端分類エンジン
- Authors: Omid Rohanian, Mohammadmahdi Nouriborji, Olena Seminog, Rodrigo Furst, Thomas Mendy, Shanthi Levanita, Zaharat Kadri-Alabi, Nusrat Jabin, Daniela Toale, Georgina Humphreys, Emilia Antonio, Adrian Bucher, Alice Norton, David A. Clifton,
- Abstract要約: Pandemic PACTプロジェクトは、アウトブレイクの可能性のある幅広い病気の研究資金と臨床証拠を追跡し、分析することを目的としている。
本稿では,Pandemic PACT Advanced Categorisation Engine(PPACE)と関連するデータセットを紹介する。
- 参考スコア(独自算出の注目度): 10.692728349388297
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper introduces the Pandemic PACT Advanced Categorisation Engine (PPACE) along with its associated dataset. PPACE is a fine-tuned model developed to automatically classify research abstracts from funded biomedical projects according to WHO-aligned research priorities. This task is crucial for monitoring research trends and identifying gaps in global health preparedness and response. Our approach builds on human-annotated projects, which are allocated one or more categories from a predefined list. A large language model is then used to generate `rationales' explaining the reasoning behind these annotations. This augmented data, comprising expert annotations and rationales, is subsequently used to fine-tune a smaller, more efficient model. Developed as part of the Pandemic PACT project, which aims to track and analyse research funding and clinical evidence for a wide range of diseases with outbreak potential, PPACE supports informed decision-making by research funders, policymakers, and independent researchers. We introduce and release both the trained model and the instruction-based dataset used for its training. Our evaluation shows that PPACE significantly outperforms its baselines. The release of PPACE and its associated dataset offers valuable resources for researchers in multilabel biomedical document classification and supports advancements in aligning biomedical research with key global health priorities.
- Abstract(参考訳): 本稿では,Pandemic PACT Advanced Categorisation Engine(PPACE)と関連するデータセットを紹介する。
PPACEは、WHOによる研究の優先順位に従って、資金提供されたバイオメディカルプロジェクトから研究抽象物を自動分類するために開発された微調整モデルである。
この課題は、研究動向を監視し、世界保健の準備と対応のギャップを特定するために不可欠である。
私たちのアプローチは、事前に定義されたリストから1つ以上のカテゴリが割り当てられた、人手によるプロジェクトに基づいています。
次に、大きな言語モデルを使用して、これらのアノテーションの背後にある理由を説明する 'rationales' を生成する。
専門家のアノテーションと合理性を含むこの拡張データは、その後、より小さく、より効率的なモデルを微調整するために使用される。
Pandemic PACTプロジェクトの一環として開発されたPPACEは、研究資金と、発生可能性のある幅広い疾患の臨床的証拠の追跡と分析を目的としており、研究資金提供者、政策立案者、独立研究者による情報意思決定を支援している。
トレーニングに使用するトレーニングモデルとインストラクションベースのデータセットの両方を導入・リリースする。
本評価は,PPACEがベースラインを著しく上回ることを示す。
PPACEとその関連するデータセットのリリースは、多ラベルのバイオメディカル文書分類の研究者に貴重なリソースを提供し、バイオメディカル研究と重要なグローバルヘルスの優先順位を合わせるための進歩をサポートする。
関連論文リスト
- A Survey of Models for Cognitive Diagnosis: New Developments and Future Directions [66.40362209055023]
本研究の目的は,認知診断の現在のモデルについて,機械学習を用いた新たな展開に注目した調査を行うことである。
モデル構造,パラメータ推定アルゴリズム,モデル評価方法,適用例を比較して,認知診断モデルの最近の傾向を概観する。
論文 参考訳(メタデータ) (2024-07-07T18:02:00Z) - myAURA: Personalized health library for epilepsy management via knowledge graph sparsification and visualization [4.25313339005458]
myAURAは、てんかん患者、介護者、そして研究者がケアや自己管理に関する決定を下すのを助けるために設計されたアプリケーションです。
MyAURAは、生体医学データベース、ソーシャルメディア、電子健康記録などのてんかんに関連する異種データ資源の連合に依存している。
論文 参考訳(メタデータ) (2024-05-08T17:24:24Z) - An Evaluation of Large Language Models in Bioinformatics Research [52.100233156012756]
本研究では,大規模言語モデル(LLM)の性能について,バイオインフォマティクスの幅広い課題について検討する。
これらのタスクには、潜在的なコーディング領域の同定、遺伝子とタンパク質の命名されたエンティティの抽出、抗微生物および抗がんペプチドの検出、分子最適化、教育生物情報学問題の解決が含まれる。
以上の結果から, GPT 変種のような LLM がこれらのタスクの多くをうまく処理できることが示唆された。
論文 参考訳(メタデータ) (2024-02-21T11:27:31Z) - Recent Advances in Predictive Modeling with Electronic Health Records [71.19967863320647]
EHRデータを予測モデリングに利用すると、その特徴からいくつかの課題が生じる。
深層学習は、医療を含む様々な応用においてその優位性を示している。
論文 参考訳(メタデータ) (2024-02-02T00:31:01Z) - A Review of Deep Learning Methods for Photoplethysmography Data [10.27280499967643]
Photoplethysmographyは、ポータビリティ、ユーザフレンドリな操作、非侵襲機能に長けているため、有望なデバイスである。
近年の深層学習の進歩は、個人の健康管理に関わるタスクにPSG信号を活用することで顕著な成果を上げている。
論文 参考訳(メタデータ) (2024-01-23T14:11:29Z) - Discovering Mental Health Research Topics with Topic Modeling [13.651763262606782]
本研究は,精神保健研究論文の大規模データセットを解析することにより,現場における一般的な傾向を把握し,ハイインパクトな研究トピックを特定することを目的とする。
本データセットは、精神保健に関する96,676件の研究論文からなり、その要約を用いて、異なるトピック間の関係を調べることができる。
分析を強化するため,精神保健研究に応用された機械学習モデルの包括的概要を提供するために,ワードクラウドも生成した。
論文 参考訳(メタデータ) (2023-08-25T05:25:05Z) - Geometric Deep Learning for Structure-Based Drug Design: A Survey [83.87489798671155]
構造に基づく薬物設計(SBDD)は、タンパク質の3次元幾何学を利用して、潜在的な薬物候補を特定する。
近年の幾何学的深層学習の進歩は、3次元幾何学的データを効果的に統合・処理し、この分野を前進させてきた。
論文 参考訳(メタデータ) (2023-06-20T14:21:58Z) - Literature-based Discovery for Landscape Planning [1.1939762265857434]
本研究は, ランドスケープと都市計画者のための新しい研究角度を導出するために, 医療用コーパスの仮説生成をいかに活用できるかを実証する。
AGATHAは、新興感染症(EID)と森林破壊の潜在的な概念的関係を明らかにするために用いられた。
この研究は、医学データベース仮説の生成を医学隣接仮説発見に適用するための部分的な概念実証としても機能する。
論文 参考訳(メタデータ) (2023-06-05T04:32:46Z) - EBOCA: Evidences for BiOmedical Concepts Association Ontology [55.41644538483948]
本論文は,生物医学領域の概念とそれらの関連性を記述するオントロジーであるEBOCAと,それらの関連性を支持するエビデンスを提案する。
DISNETのサブセットから得られるテストデータとテキストからの自動アソシエーション抽出が変換され、実際のシナリオで使用できる知識グラフが作成されるようになった。
論文 参考訳(メタデータ) (2022-08-01T18:47:03Z) - Machine Learning Applications for Therapeutic Tasks with Genomics Data [49.98249191161107]
ゲノム学の機械学習応用に関する文献を、治療開発のレンズでレビューします。
治療パイプライン全体にわたるゲノミクス応用における22の機械学習を同定する。
この分野における7つの重要な課題を、拡大と影響の機会として挙げる。
論文 参考訳(メタデータ) (2021-05-03T21:20:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。