論文の概要: Analysing Lightweight Large Language Models for Biomedical Named Entity Recognition on Diverse Ouput Formats
- arxiv url: http://arxiv.org/abs/2604.25920v1
- Date: Fri, 27 Mar 2026 09:36:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 02:32:14.219455
- Title: Analysing Lightweight Large Language Models for Biomedical Named Entity Recognition on Diverse Ouput Formats
- Title(参考訳): 生物医学的名前付きエンティティ認識のための軽量大言語モデルの解析
- Authors: Pierre Epron, Adrien Coulet, Mehwish Alam,
- Abstract要約: 大規模言語モデル(LLM)は計算的に要求され、微調整のためにかなりのリソースを必要とする。
本稿では,軽量LCMを用いた生物医学的名前付きエンティティ認識に焦点をあてた実験的検討を行う。
- 参考スコア(独自算出の注目度): 1.7205106391379026
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Despite their strong linguistic capabilities, Large Language Models (LLMs) are computationally demanding and require substantial resources for fine-tuning, which is unadapted to privacy and budget constraints of many healthcare settings. To address this, we present an experimental analysis focused on Biomedical Named Entity Recognition using lightweight LLMs, we evaluate the impact of different output formats on model performance. The results reveal that lightweight LLMs can achieve competitive performance compared to the larger models, highlighting their potential as lightweight yet effective alternatives for biomedical information extraction. Our analysis shows that instruction tuning over many distinct formats does not improve performance, but identifies several format consistently associated with better performance.
- Abstract(参考訳): その強力な言語能力にもかかわらず、LLM(Large Language Models)は計算的に要求されており、多くの医療設定のプライバシーや予算の制約に適応しない微調整のためにかなりのリソースを必要としている。
そこで本研究では,軽量LCMを用いたバイオメディカル名前付きエンティティ認識に着目し,異なる出力形式がモデル性能に与える影響を実験的に評価する。
その結果,軽量LCMは大規模モデルと比較して競争性能が向上し,バイオメディカル情報抽出のための軽量で効果的な代替手段としての可能性を強調した。
分析の結果,多くの異なるフォーマットでの命令チューニングは性能向上には至らず,性能向上に一貫した複数のフォーマットを識別できることがわかった。
関連論文リスト
- Can Large Language Models Challenge CNNs in Medical Image Analysis? [3.1406146587437904]
本研究では,医療診断画像の正確な分類を目的としたマルチモーダルAIフレームワークを提案する。
提案システムは、畳み込みニューラルネットワーク(CNN)と異なる大言語モデル(LLM)の強みを比較する。
論文 参考訳(メタデータ) (2025-05-29T14:48:09Z) - CollectiveSFT: Scaling Large Language Models for Chinese Medical Benchmark with Collective Instructions in Healthcare [12.218718086529462]
本研究は中国における総合医療ベンチマーク(CMB)に焦点を当てる。
私たちは、より大きなモデルに匹敵するスコアを得るために、より小さなベースモデルをトレーニングしました。
幅広い指導内容を統合することで,データ品質の不整合などの潜在的な問題に対処する。
論文 参考訳(メタデータ) (2024-07-29T05:00:48Z) - Large Language Model Distilling Medication Recommendation Model [58.94186280631342]
大規模言語モデル(LLM)の強力な意味理解と入力非依存特性を利用する。
本研究は, LLMを用いて既存の薬剤推奨手法を変換することを目的としている。
これを軽減するため,LLMの習熟度をよりコンパクトなモデルに伝達する機能レベルの知識蒸留技術を開発した。
論文 参考訳(メタデータ) (2024-02-05T08:25:22Z) - Quantifying Language Models' Sensitivity to Spurious Features in Prompt Design or: How I learned to start worrying about prompt formatting [68.19544657508509]
言語モデル(LLM)は、言語技術の基本コンポーネントとして採用されている。
いくつかの広く使われているオープンソースLLMは、数ショット設定でプロンプトフォーマットの微妙な変更に対して非常に敏感であることがわかった。
本稿では,与えられたタスクに対して有効なプロンプトフォーマットのサンプルセットを迅速に評価するアルゴリズムを提案し,モデル重み付けにアクセスせずに期待性能の間隔を報告する。
論文 参考訳(メタデータ) (2023-10-17T15:03:30Z) - Interpretable Medical Diagnostics with Structured Data Extraction by
Large Language Models [59.89454513692417]
タブラルデータはしばしばテキストに隠され、特に医学的診断報告に使用される。
本稿では,TEMED-LLM と呼ばれるテキスト医療報告から構造化表状データを抽出する手法を提案する。
本手法は,医学診断における最先端のテキスト分類モデルよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-08T09:12:28Z) - Scaling Vision-Language Models with Sparse Mixture of Experts [128.0882767889029]
提案手法は, 等価計算コストの高密度モデルに対して, 様々なベンチマークにおいて, 最先端性能を実現することができることを示す。
我々の研究は、MoEモデルのトレーニングの安定化、モデル解釈可能性に対するMoEの影響の理解、ビジョン言語モデルをスケールする際の計算性能間のトレードオフのバランスに関する貴重な洞察を提供する。
論文 参考訳(メタデータ) (2023-03-13T16:00:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。