論文の概要: Enhancing Biomedical Named Entity Recognition using GLiNER-BioMed with Targeted Dictionary-Based Post-processing for BioASQ 2025 task 6
- arxiv url: http://arxiv.org/abs/2510.08588v1
- Date: Fri, 03 Oct 2025 18:35:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 00:38:47.002464
- Title: Enhancing Biomedical Named Entity Recognition using GLiNER-BioMed with Targeted Dictionary-Based Post-processing for BioASQ 2025 task 6
- Title(参考訳): BioASQ 2025タスク6におけるGLiNER-BioMedによるバイオメディカル名前付きエンティティ認識の強化
- Authors: Ritesh Mehta,
- Abstract要約: 本研究では,BioASQデータセット上でGLiNER-BioMedモデルを評価する。
一般的な誤分類に対処するために,辞書ベースのポストプロセッシング戦略を導入する。
この研究は、事前訓練されたBioNERモデルの辞書ベースの改良の可能性を強調するが、開発データに過度に適合するという重要な課題を浮き彫りにしている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Biomedical Named Entity Recognition (BioNER), task6 in BioASQ (A challenge in large-scale biomedical semantic indexing and question answering), is crucial for extracting information from scientific literature but faces hurdles such as distinguishing between similar entity types like genes and chemicals. This study evaluates the GLiNER-BioMed model on a BioASQ dataset and introduces a targeted dictionary-based post-processing strategy to address common misclassifications. While this post-processing approach demonstrated notable improvement on our development set, increasing the micro F1-score from a baseline of 0.79 to 0.83, this enhancement did not generalize to the blind test set, where the post-processed model achieved a micro F1-score of 0.77 compared to the baselines 0.79. We also discuss insights gained from exploring alternative methodologies, including Conditional Random Fields. This work highlights the potential of dictionary-based refinement for pre-trained BioNER models but underscores the critical challenge of overfitting to development data and the necessity of ensuring robust generalization for real-world applicability.
- Abstract(参考訳): Biomedical Named Entity Recognition (BioNER), Task6 in BioASQ (A challenge in large-scale biomedical semantic indexing and question answering)は、科学文献から情報を抽出するために重要であるが、遺伝子や化学物質のような類似のエンティティタイプを区別するといったハードルに直面している。
本研究では、BioASQデータセット上でGLiNER-BioMedモデルを評価し、共通の誤分類に対処するための辞書ベースの後処理戦略を提案する。
この後処理アプローチは, マイクロF1スコアを0.79から0.83に向上させるとともに, マイクロF1スコアを0.79から0.77に引き上げることに成功したが, この拡張はブラインドテストセットに一般化されず, 後処理モデルでは0.77のマイクロF1スコアをベースラインに比べて達成した。
また、条件付ランダムフィールドを含む代替方法論の探求から得られた知見についても論じる。
この研究は、事前訓練されたBioNERモデルの辞書ベースの改良の可能性を強調しながら、開発データに過度に適合することの難しさと、現実の応用性に対する堅牢な一般化の確保の必要性を浮き彫りにしている。
関連論文リスト
- GLiNER-BioMed: A Suite of Efficient Models for Open Biomedical Named Entity Recognition [0.06554326244334868]
GLiNER-BioMedは、バイオメディシンに特化したジェネラリストモデルと軽量モデル(GLiNER)のドメイン適応スイートである。
従来の手法とは対照的に、GLiNERは任意のエンティティ型を推論するために自然言語ラベルを使用するため、ゼロショット認識が可能である。
いくつかのバイオメディカルデータセットの実験では、GLiNER-BioMedは両方のゼロショットシナリオで最先端を達成している。
論文 参考訳(メタデータ) (2025-04-01T11:40:50Z) - Augmenting Biomedical Named Entity Recognition with General-domain Resources [47.24727904076347]
ニューラルネットワークに基づくバイオメディカル名前付きエンティティ認識(BioNER)モデルのトレーニングは通常、広範囲でコストのかかる人的アノテーションを必要とする。
GERBERAは、一般ドメインのNERデータセットをトレーニングに利用した、単純なyet効率の手法である。
我々は,81,410インスタンスからなる8つのエンティティタイプの5つのデータセットに対して,GERBERAを体系的に評価した。
論文 参考訳(メタデータ) (2024-06-15T15:28:02Z) - Multi-level biomedical NER through multi-granularity embeddings and
enhanced labeling [3.8599767910528917]
本稿では,複数のモデルの強みを統合するハイブリッドアプローチを提案する。
BERTは、文脈化された単語の埋め込み、文字レベルの情報キャプチャのための事前訓練されたマルチチャネルCNN、およびテキスト内の単語間の依存関係のシーケンスラベリングとモデル化のためのBiLSTM + CRFを提供する。
我々は、ベンチマークi2b2/2010データセットを用いて、F1スコア90.11を達成する。
論文 参考訳(メタデータ) (2023-12-24T21:45:36Z) - BiomedGPT: A Generalist Vision-Language Foundation Model for Diverse Biomedical Tasks [68.39821375903591]
汎用AIは、さまざまなデータ型を解釈する汎用性のために、制限に対処する可能性を秘めている。
本稿では,最初のオープンソースかつ軽量な視覚言語基盤モデルであるBiomedGPTを提案する。
論文 参考訳(メタデータ) (2023-05-26T17:14:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。