論文の概要: Rapid Biomedical Research Classification: The Pandemic PACT Advanced Categorisation Engine
- arxiv url: http://arxiv.org/abs/2407.10086v1
- Date: Sun, 14 Jul 2024 05:22:53 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-16 19:38:33.731019
- Title: Rapid Biomedical Research Classification: The Pandemic PACT Advanced Categorisation Engine
- Title(参考訳): バイオメディカル研究の迅速分類:パンデミックPACT先端分類エンジン
- Authors: Omid Rohanian, Mohammadmahdi Nouriborji, Olena Seminog, Rodrigo Furst, Thomas Mendy, Shanthi Levanita, Zaharat Kadri-Alab, Nusrat Jabin, Daniela Toale, Georgina Humphreys, Emilia Antonio, Adrian Bucher, Alice Norton, David A. Clifton,
- Abstract要約: Pandemic PACTプロジェクトは、アウトブレイクの可能性のある幅広い病気の研究資金と臨床証拠を追跡し、分析することを目的としている。
本稿では,Pandemic PACT Advanced Categorisation Engine(PPACE)と関連するデータセットを紹介する。
- 参考スコア(独自算出の注目度): 10.692728349388297
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper introduces the Pandemic PACT Advanced Categorisation Engine (PPACE) along with its associated dataset. PPACE is a fine-tuned model developed to automatically classify research abstracts from funded biomedical projects according to WHO-aligned research priorities. This task is crucial for monitoring research trends and identifying gaps in global health preparedness and response. Our approach builds on human-annotated projects, which are allocated one or more categories from a predefined list. A large language model is then used to generate `rationales' explaining the reasoning behind these annotations. This augmented data, comprising expert annotations and rationales, is subsequently used to fine-tune a smaller, more efficient model. Developed as part of the Pandemic PACT project, which aims to track and analyse research funding and clinical evidence for a wide range of diseases with outbreak potential, PPACE supports informed decision-making by research funders, policymakers, and independent researchers. We introduce and release both the trained model and the instruction-based dataset used for its training. Our evaluation shows that PPACE significantly outperforms its baselines. The release of PPACE and its associated dataset offers valuable resources for researchers in multilabel biomedical document classification and supports advancements in aligning biomedical research with key global health priorities.
- Abstract(参考訳): 本稿では,Pandemic PACT Advanced Categorisation Engine(PPACE)と関連するデータセットを紹介する。
PPACEは、WHOによる研究の優先順位に従って、資金提供されたバイオメディカルプロジェクトから研究抽象物を自動分類するために開発された微調整モデルである。
この課題は、研究動向を監視し、世界保健の準備と対応のギャップを特定するために不可欠である。
私たちのアプローチは、事前に定義されたリストから1つ以上のカテゴリが割り当てられた、人手によるプロジェクトに基づいています。
次に、大きな言語モデルを使用して、これらのアノテーションの背後にある理由を説明する 'rationales' を生成する。
専門家のアノテーションと合理性を含むこの拡張データは、その後、より小さく、より効率的なモデルを微調整するために使用される。
Pandemic PACTプロジェクトの一環として開発されたPPACEは、研究資金と、発生可能性のある幅広い疾患の臨床的証拠の追跡と分析を目的としており、研究資金提供者、政策立案者、独立研究者による情報意思決定を支援している。
トレーニングに使用するトレーニングモデルとインストラクションベースのデータセットの両方を導入・リリースする。
本評価は,PPACEがベースラインを著しく上回ることを示す。
PPACEとその関連するデータセットのリリースは、多ラベルのバイオメディカル文書分類の研究者に貴重なリソースを提供し、バイオメディカル研究と重要なグローバルヘルスの優先順位を合わせるための進歩をサポートする。
関連論文リスト
- A Survey of Models for Cognitive Diagnosis: New Developments and Future Directions [66.40362209055023]
本研究の目的は,認知診断の現在のモデルについて,機械学習を用いた新たな展開に注目した調査を行うことである。
モデル構造,パラメータ推定アルゴリズム,モデル評価方法,適用例を比較して,認知診断モデルの最近の傾向を概観する。
論文 参考訳(メタデータ) (2024-07-07T18:02:00Z) - Generative AI for Synthetic Data Across Multiple Medical Modalities: A Systematic Review of Recent Developments and Challenges [2.1835659964186087]
本稿では,様々な医療データ型を合成するための生成モデルについて,体系的に検討する。
本研究は、幅広い医療データモダリティを包含し、様々な生成モデルについて検討する。
論文 参考訳(メタデータ) (2024-06-27T14:00:11Z) - An Evaluation of Large Language Models in Bioinformatics Research [52.100233156012756]
本研究では,大規模言語モデル(LLM)の性能について,バイオインフォマティクスの幅広い課題について検討する。
これらのタスクには、潜在的なコーディング領域の同定、遺伝子とタンパク質の命名されたエンティティの抽出、抗微生物および抗がんペプチドの検出、分子最適化、教育生物情報学問題の解決が含まれる。
以上の結果から, GPT 変種のような LLM がこれらのタスクの多くをうまく処理できることが示唆された。
論文 参考訳(メタデータ) (2024-02-21T11:27:31Z) - Recent Advances in Predictive Modeling with Electronic Health Records [73.31880579203012]
EHRデータを予測モデリングに利用すると、その特徴からいくつかの課題が生じる。
深層学習は、医療を含む様々な応用においてその優位性を示している。
論文 参考訳(メタデータ) (2024-02-02T00:31:01Z) - A Review of Deep Learning Methods for Photoplethysmography Data [10.27280499967643]
Photoplethysmographyは、ポータビリティ、ユーザフレンドリな操作、非侵襲機能に長けているため、有望なデバイスである。
近年の深層学習の進歩は、個人の健康管理に関わるタスクにPSG信号を活用することで顕著な成果を上げている。
論文 参考訳(メタデータ) (2024-01-23T14:11:29Z) - Discovering Mental Health Research Topics with Topic Modeling [13.651763262606782]
本研究は,精神保健研究論文の大規模データセットを解析することにより,現場における一般的な傾向を把握し,ハイインパクトな研究トピックを特定することを目的とする。
本データセットは、精神保健に関する96,676件の研究論文からなり、その要約を用いて、異なるトピック間の関係を調べることができる。
分析を強化するため,精神保健研究に応用された機械学習モデルの包括的概要を提供するために,ワードクラウドも生成した。
論文 参考訳(メタデータ) (2023-08-25T05:25:05Z) - Literature-based Discovery for Landscape Planning [1.1939762265857434]
本研究は, ランドスケープと都市計画者のための新しい研究角度を導出するために, 医療用コーパスの仮説生成をいかに活用できるかを実証する。
AGATHAは、新興感染症(EID)と森林破壊の潜在的な概念的関係を明らかにするために用いられた。
この研究は、医学データベース仮説の生成を医学隣接仮説発見に適用するための部分的な概念実証としても機能する。
論文 参考訳(メタデータ) (2023-06-05T04:32:46Z) - EBOCA: Evidences for BiOmedical Concepts Association Ontology [55.41644538483948]
本論文は,生物医学領域の概念とそれらの関連性を記述するオントロジーであるEBOCAと,それらの関連性を支持するエビデンスを提案する。
DISNETのサブセットから得られるテストデータとテキストからの自動アソシエーション抽出が変換され、実際のシナリオで使用できる知識グラフが作成されるようになった。
論文 参考訳(メタデータ) (2022-08-01T18:47:03Z) - Machine Learning Applications for Therapeutic Tasks with Genomics Data [49.98249191161107]
ゲノム学の機械学習応用に関する文献を、治療開発のレンズでレビューします。
治療パイプライン全体にわたるゲノミクス応用における22の機械学習を同定する。
この分野における7つの重要な課題を、拡大と影響の機会として挙げる。
論文 参考訳(メタデータ) (2021-05-03T21:20:20Z) - Challenges in biomarker discovery and biorepository for Gulf-war-disease
studies: a novel data platform solution [48.7576911714538]
ROSALINDという新しいデータプラットフォームを導入し、課題を克服し、健全で重要なコラボレーションを育み、科学的調査を進めます。
ROSALINDは、自己管理されたアクセシビリティ、リンク性、可積分性、中立性、信頼性を持つリソース有機体を指します。
過去12ヶ月のGWI研究におけるROSALINDの展開により、データ実験と分析のペースが加速し、多数のエラーソースが削除され、研究品質と生産性が向上しました。
論文 参考訳(メタデータ) (2021-02-04T20:38:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。