論文の概要: PrionNER: A Named Entity Recognition Dataset for Prion Disease Biomedical Literature
- arxiv url: http://arxiv.org/abs/2605.28375v1
- Date: Wed, 27 May 2026 12:15:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-28 17:38:56.036294
- Title: PrionNER: A Named Entity Recognition Dataset for Prion Disease Biomedical Literature
- Title(参考訳): PrionNER:プリオン病医学文献のためのエンティティ認識データセット
- Authors: An Dao, Nhan Ly, Thao Tran, Yuji Matsumoto, Akiko Aizawa,
- Abstract要約: 生物医学文献から幅広い臨床関連物質を捉えるために設計されたデータセットは公開されていない。
PubMed抄録にプリオン病臨床情報のための手動アノテーション付きエンティティ認識データセットPrionNERを紹介する。
現在のリリースでは、317の要約、2,943の文、6,955のテキストバウンドエンティティアノテーションが15の粗い粒度と31の微細な臨床指向エンティティタイプにまたがっている。
- 参考スコア(独自算出の注目度): 16.849846089266684
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Prion diseases are rare, rapidly progressive, and fatal neurodegenerative disorders that remain difficult to diagnose, particularly in their early stages because of nonspecific clinical presentations. However, to our knowledge, there is no publicly available prion-disease-focused dataset designed to capture a broad range of clinically relevant entities from the biomedical literature. We introduce PrionNER, a manually annotated named entity recognition dataset for prion disease clinical information in PubMed abstracts. The current release comprises 317 abstracts, 2,943 sentences, and 6,955 text-bound entity annotations spanning 15 coarse-grained and 31 fine-grained clinically oriented entity types covering diseases, symptoms, diagnostics, findings, anatomy, treatments, and temporal and statistical evidence. Inter-annotator agreement reaches 81.78 exact-match F1, indicating strong annotation consistency. We benchmark supervised BERT baselines, W2NER, and zero-shot extractors on PrionNER. W2NER is the strongest supervised model, and Gemma-4-31B is the strongest zero-shot model, but the benchmark remains challenging, especially for structurally complex mentions and fine-grained clinically adjacent label distinctions. PrionNER provides a clinically grounded benchmark for prion-disease information extraction and supports research on rare-disease biomedical NLP under low-resource, fine-grained, and non-flat extraction conditions. The dataset, annotation guidelines, and evaluation scripts are available at https://github.com/daotuanan/PrionNER/.
- Abstract(参考訳): プリオン病は稀で、急速に進行し、致命的な神経変性疾患であり、診断が難しい。
しかし、我々の知る限り、バイオメディカル文献から幅広い臨床関連物質を捉えるために設計された、一般向けのプリオンフリーズ・データセットは存在しない。
PubMed抄録にプリオン病臨床情報のための手動アノテーション付きエンティティ認識データセットPrionNERを紹介する。
現在のリリースは、疾患、症状、診断、発見、解剖学、治療、時間的および統計的証拠をカバーする、15の粗い粒度と31の微細な臨床的指向のエンティティタイプにまたがる317の要約、2,943の文、および6,955のテキストバウンドエンティティアノテーションを含む。
アノテーション間の合意は81.78の正確な一致F1に達し、強いアノテーションの一貫性を示す。
我々は,PrionNER上でBERTベースライン,W2NER,ゼロショット抽出器のベンチマークを行った。
W2NERは最強の教師付きモデルであり、Gemma-4-31Bは最強のゼロショットモデルである。
PrionNERは、プリオン放出情報抽出のための臨床基盤化されたベンチマークを提供し、低リソース、微粒、非平坦な抽出条件下での希釈バイオメディカルNLPの研究を支援する。
データセット、アノテーションガイドライン、評価スクリプトはhttps://github.com/daotuanan/PrionNER/で公開されている。
関連論文リスト
- Learning Diagnostic Reasoning for Decision Support in Toxicology [34.623049546258294]
緊急毒性学への最初の強化学習(Reinforcement Learning, RL)であるDeToxRを提案する。
14種類の物質クラスにまたがる多ラベル予測のためのロバストなデータ融合エンジンを設計する。
臨床成績報酬を直接利用してモデルの推論を最適化する。
論文 参考訳(メタデータ) (2026-03-31T11:26:45Z) - Omni-iEEG: A Large-Scale, Comprehensive iEEG Dataset and Benchmark for Epilepsy Research [4.4167069169736655]
$textbf Omni-iEEG は $textbf302 患者$と $textbf178 時間高解像度記録を含む大規模で手術前の iEEG リソースである。
発作性発症ゾーン、切除、手術結果などの調和した臨床メタデータが含まれており、診断されたてんかん医によって検証されている。
臨床的に意味のあるタスクを定義し、臨床に関係のある環境でモデルの体系的な評価を可能にする。
論文 参考訳(メタデータ) (2026-02-17T22:55:11Z) - An Explainable Hybrid AI Framework for Enhanced Tuberculosis and Symptom Detection [55.35661671061754]
結核は、特に資源に制限された遠隔地において、重要な世界的な健康問題である。
本稿では, 胸部X線による疾患および症状の検出を, 2つの頭部と自己監督頭部を統合することで促進する枠組みを提案する。
本モデルでは, 新型コロナウイルス, 結核, 正常症例の鑑別で98.85%の精度が得られ, マルチラベル症状検出では90.09%のマクロF1スコアが得られた。
論文 参考訳(メタデータ) (2025-10-21T17:18:55Z) - RaTEScore: A Metric for Radiology Report Generation [59.37561810438641]
本稿では,Radiological Report (Text) Evaluation (RaTEScore) として,新しい実体認識尺度を提案する。
RaTEScoreは、診断結果や解剖学的詳細などの重要な医療機関を強調し、複雑な医学的同義語に対して堅牢であり、否定表現に敏感である。
我々の評価は、RaTEScoreが既存の指標よりも人間の嗜好とより密接に一致していることを示し、確立された公開ベンチマークと、新たに提案したRaTE-Evalベンチマークの両方で検証した。
論文 参考訳(メタデータ) (2024-06-24T17:49:28Z) - Extraction of Medication and Temporal Relation from Clinical Text using
Neural Language Models [7.698164945017469]
textbfMedTemプロジェクトは、BiLSTM-CRFやCNN-BiLSTMなどの先進的な学習構造を使用している。
CNN-BiLSTMは、i2b2-2009 臨床 NER タスクにおいて、精度、リコール、F1 スコアに対して 75.67, 77.83, 78.17 の BiLSTM-CRF モデルにわずかに勝っている。
BERT-CNNモデルは、マクロAvgを使用してP/R/F1の64.48、67.17、65.03の評価スコアも生成した。
論文 参考訳(メタデータ) (2023-10-03T17:37:22Z) - DICE: Data-Efficient Clinical Event Extraction with Generative Models [93.49354508621232]
臨床領域のイベント抽出は、未調査の研究領域である。
臨床イベント抽出のための堅牢でデータ効率の良い生成モデルであるDICEを紹介する。
臨床およびニュース領域イベント抽出におけるDICEの最先端性能について実験を行った。
論文 参考訳(メタデータ) (2022-08-16T23:12:04Z) - Ontology-Driven and Weakly Supervised Rare Disease Identification from
Clinical Notes [13.096008602034086]
機械学習やドメインの専門家によるデータアノテーションの必要性から、希少な疾患の特定は困難である。
両方向変換器(例えばBERT)からの事前学習した文脈表現を用いた脳と弱い監督手法を提案する。
弱教師付きアプローチは、ドメインの専門家による注釈付きデータなしで、テキスト-UMLSリンクを改善するための確認表現型モデルを学ぶために提案される。
論文 参考訳(メタデータ) (2022-05-11T17:38:24Z) - Intelligent Sight and Sound: A Chronic Cancer Pain Dataset [74.77784420691937]
本稿では,Intelligent Sight and Sound (ISS) 臨床試験の一環として収集された,最初の慢性ガン痛データセットを紹介する。
これまで収集されたデータは29の患者、509のスマートフォンビデオ、189,999のフレーム、そして自己報告された感情と活動の痛みのスコアから成っている。
静的画像とマルチモーダルデータを用いて、自己報告された痛みレベルを予測する。
論文 参考訳(メタデータ) (2022-04-07T22:14:37Z) - CREATe: Clinical Report Extraction and Annotation Technology [53.731999072534876]
臨床症例報告は、特定の臨床症例の特異な側面を記述した記述である。
これらのレポートを注釈付け、インデックス付け、あるいはキュレートするエンドツーエンドシステムを開発する試みはない。
本稿では,新たな計算資源プラットフォームを提案し,臨床事例レポートの内容の抽出,索引付け,照会を行う。
論文 参考訳(メタデータ) (2021-02-28T16:50:14Z) - Semi-supervised Medical Image Classification with Relation-driven
Self-ensembling Model [71.80319052891817]
医用画像分類のための関係駆動型半教師付きフレームワークを提案する。
これは、摂動下で与えられた入力の予測一貫性を促進することでラベルのないデータを利用する。
本手法は,シングルラベルおよびマルチラベル画像分類のシナリオにおいて,最先端の半教師付き学習手法よりも優れる。
論文 参考訳(メタデータ) (2020-05-15T06:57:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。