論文の概要: JEBS: A Fine-grained Biomedical Lexical Simplification Task
- arxiv url: http://arxiv.org/abs/2506.12898v1
- Date: Sun, 15 Jun 2025 16:01:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-17 17:28:47.093507
- Title: JEBS: A Fine-grained Biomedical Lexical Simplification Task
- Title(参考訳): JEBS: きめ細かいバイオメディカル・レキシカル・シンプリケーション・タスク
- Authors: William Xia, Ishita Unde, Brian Ondov, Dina Demner-Fushman,
- Abstract要約: バイオメディカル・シンプリケーションのための粒度の細かい語彙的単純化タスクとデータセットであるJargon Explanationsを提案する。
JEBSタスクは複雑な用語を識別し、置換する方法を分類し、置換テキストを生成する。
データセットには、400のバイオメディカルな抽象化と手動で単純化されたバージョンを含む10,314の10,595の置換が含まれている。
- 参考スコア(独自算出の注目度): 12.085266746338796
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Online medical literature has made health information more available than ever, however, the barrier of complex medical jargon prevents the general public from understanding it. Though parallel and comparable corpora for Biomedical Text Simplification have been introduced, these conflate the many syntactic and lexical operations involved in simplification. To enable more targeted development and evaluation, we present a fine-grained lexical simplification task and dataset, Jargon Explanations for Biomedical Simplification (JEBS, https://github.com/bill-from-ri/JEBS-data ). The JEBS task involves identifying complex terms, classifying how to replace them, and generating replacement text. The JEBS dataset contains 21,595 replacements for 10,314 terms across 400 biomedical abstracts and their manually simplified versions. Additionally, we provide baseline results for a variety of rule-based and transformer-based systems for the three sub-tasks. The JEBS task, data, and baseline results pave the way for development and rigorous evaluation of systems for replacing or explaining complex biomedical terms.
- Abstract(参考訳): オンライン医療文献は、健康情報をこれまで以上に利用できるようにしたが、複雑な医療ジャーゴンの障壁は、一般大衆の理解を妨げている。
バイオメディカルテキスト単純化のための並列かつ同等のコーパスが導入されたが、これらは単純化に関わる多くの構文的および語彙的操作を詳述している。
よりターゲットを絞った開発と評価を実現するため,Jargon Explanations for Biomedical Simplification (JEBS, https://github.com/bill-from-ri/JEBS-data)を提案する。
JEBSタスクは複雑な用語を識別し、置換する方法を分類し、置換テキストを生成する。
JEBSデータセットには、400のバイオメディカル・抽象化と手動で単純化されたバージョンで10,314語を置き換えた21,595語が含まれている。
さらに,3つのサブタスクに対して,ルールベースおよびトランスフォーマーベースシステムのベースライン結果を提供する。
JEBSタスク、データ、ベースラインの結果は、複雑なバイオメディカル用語を置き換えたり、説明したりするシステムの開発と厳密な評価の道を開く。
関連論文リスト
- Society of Medical Simplifiers [7.4751114996742]
本稿では,SOM(Society of Mind)哲学に触発された新しい枠組みであるSociety of Medical Simplifiersを紹介する。
提案手法では,LLMの長所を,レイパーソン,Simplifier,メディカルエキスパート,Language Clarifier,Redundancy Checkerの5つの異なる役割に割り当てることで活用する。
我々のフレームワークは最先端の手法に匹敵し、優れた可読性とコンテンツ保存を実現する。
論文 参考訳(メタデータ) (2024-10-12T19:52:56Z) - BioT5+: Towards Generalized Biological Understanding with IUPAC Integration and Multi-task Tuning [77.90250740041411]
本稿では,BioT5フレームワークの拡張であるBioT5+を紹介する。
BioT5+ には、分子理解のための IUPAC 名の統合、bioRxiv や PubChem などのソースからの広範なバイオテキストと分子データの統合、タスク間の汎用性のためのマルチタスク命令チューニング、数値データの処理を改善する数値トークン化技術など、いくつかの新機能が含まれている。
論文 参考訳(メタデータ) (2024-02-27T12:43:09Z) - SurgicalPart-SAM: Part-to-Whole Collaborative Prompting for Surgical Instrument Segmentation [66.21356751558011]
Segment Anything Model (SAM)は、ジェネリックオブジェクトセグメンテーションの約束を示し、様々なアプリケーションに可能性を提供します。
既存の方法では、SAMベースのフレームワークを手術データにチューニングすることで、手術器具セグメンテーション(SIS)にSAMを適用している。
本稿では,楽器構造知識をSAMの汎用知識と明確に統合する新しいSAM効率的なチューニング手法であるStuial Part-SAMを提案する。
論文 参考訳(メタデータ) (2023-12-22T07:17:51Z) - Diversifying Knowledge Enhancement of Biomedical Language Models using
Adapter Modules and Knowledge Graphs [54.223394825528665]
我々は、軽量なアダプターモジュールを用いて、構造化された生体医学的知識を事前訓練された言語モデルに注入するアプローチを開発した。
バイオメディカル知識システムUMLSと新しいバイオケミカルOntoChemの2つの大きなKGと、PubMedBERTとBioLinkBERTの2つの著名なバイオメディカルPLMを使用している。
計算能力の要件を低く保ちながら,本手法がいくつかの事例において性能改善につながることを示す。
論文 参考訳(メタデータ) (2023-12-21T14:26:57Z) - High-throughput Biomedical Relation Extraction for Semi-Structured Web Articles Empowered by Large Language Models [1.9665865095034865]
関係抽出タスクを大言語モデルのバイナリ分類として定式化する。
メインタイトルをテールエンティティとして指定し、コンテキストに明示的に組み込む。
長い内容はテキストチャンクにスライスされ、埋め込みされ、追加の埋め込みモデルで検索される。
論文 参考訳(メタデータ) (2023-12-13T16:43:41Z) - Multilingual Simplification of Medical Texts [49.469685530201716]
4つの言語で医療領域のための文章整列型多言語テキスト単純化データセットであるMultiCochraneを紹介する。
これらの言語にまたがる微調整およびゼロショットモデルの評価を行い,人間による評価と分析を行った。
モデルは、実行可能な単純化されたテキストを生成することができるが、このデータセットが扱う可能性のある、卓越した課題を特定する。
論文 参考訳(メタデータ) (2023-05-21T18:25:07Z) - BigBIO: A Framework for Data-Centric Biomedical Natural Language
Processing [13.30221348538759]
バイオメディカルNLPデータセット126以上のコミュニティライブラリであるBigBIOを紹介する。
BigBIOは、データセットとそのメタデータへのプログラムアクセスを通じて、再現可能なメタデータキュレーションを容易にする。
本稿では,タスクスキーマ,データ監査,コントリビューションガイドライン,および2つの実証的ユースケースの概要について論じる。
論文 参考訳(メタデータ) (2022-06-30T07:15:45Z) - Slot Filling for Biomedical Information Extraction [0.5330240017302619]
バイオメディカルIEの課題に対してスロットフィリングアプローチを提案する。
我々は、トランフォーマベースのバイエンコーダDense Passage RetrievalをTransformerベースのリーダーモデルと結合する提案パラダイムに従う。
論文 参考訳(メタデータ) (2021-09-17T14:16:00Z) - Paragraph-level Simplification of Medical Texts [35.650619024498425]
手動の簡略化は生物医学文献の急速に成長する体にスケールしません。
異なる臨床トピックに関連するすべての公開された証拠の技術的およびレイアウト要約からなる英語での平行テキストの新しいコーパスを紹介します。
本研究では,科学テキストを前提としたマスキング型言語モデルから,確率スコアに基づく新たな指標を提案する。
論文 参考訳(メタデータ) (2021-04-12T18:56:05Z) - MGD-GAN: Text-to-Pedestrian generation through Multi-Grained
Discrimination [96.91091607251526]
本稿では, 人的部分に基づく識別器と自己対応型識別器を併用した多点識別拡張生成適応ネットワークを提案する。
HPDモジュールには、多彩な外観と鮮明な詳細を強制するために、きめ細かい単語レベルの注意機構が採用されている。
様々な測定値に対する大幅な改善は、MGD-GANがテキストからペデストリアン合成シナリオに有効であることを示す。
論文 参考訳(メタデータ) (2020-10-02T12:24:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。