論文の概要: PERCS: Persona-Guided Controllable Biomedical Summarization Dataset
- arxiv url: http://arxiv.org/abs/2512.03340v1
- Date: Wed, 03 Dec 2025 01:13:56 GMT
- ステータス: 情報取得中
- システム内更新日: 2025-12-04 12:10:08.337152
- Title: PERCS: Persona-Guided Controllable Biomedical Summarization Dataset
- Title(参考訳): PERCS:ペルソナ誘導制御可能な生体医用要約データセット
- Authors: Rohan Charudatt Salvi, Chirag Chawla, Dhruv Jain, Swapnil Panigrahi, Md Shad Akhtar, Shweta Yadav,
- Abstract要約: PERCSは、4人のペルソナに合わせた要約と組み合わせたバイオメディカル抽象のデータセットである。
これらのペルソナは、医療リテラシーと情報ニーズのレベルが異なる。
技術的検証は、人格間での読みやすさ、語彙、内容の深さの明確な違いを示している。
- 参考スコア(独自算出の注目度): 14.620290128367012
- License:
- Abstract: Automatic medical text simplification plays a key role in improving health literacy by making complex biomedical research accessible to diverse readers. However, most existing resources assume a single generic audience, overlooking the wide variation in medical literacy and information needs across user groups. To address this limitation, we introduce PERCS (Persona-guided Controllable Summarization), a dataset of biomedical abstracts paired with summaries tailored to four personas: Laypersons, Premedical Students, Non-medical Researchers, and Medical Experts. These personas represent different levels of medical literacy and information needs, emphasizing the need for targeted, audience-specific summarization. Each summary in PERCS was reviewed by physicians for factual accuracy and persona alignment using a detailed error taxonomy. Technical validation shows clear differences in readability, vocabulary, and content depth across personas. Along with describing the dataset, we benchmark four large language models on PERCS using automatic evaluation metrics that assess comprehensiveness, readability, and faithfulness, establishing baseline results for future research. The dataset, annotation guidelines, and evaluation materials are publicly available to support research on persona-specific communication and controllable biomedical summarization.
- Abstract(参考訳): 医療用テキストの簡易化は、多様な読者に複雑な生物医学研究を提供することによって、健康リテラシー向上に重要な役割を担っている。
しかし、既存のリソースの多くは単一の汎用的なオーディエンスを前提としており、医療リテラシーとユーザグループ間の情報ニーズの幅広いバリエーションを見越している。
この制限に対処するため, PERCS (Persona-guided Controllable Summarization) を導入し, 4人のペルソナに合わせた要約と組み合わせたバイオメディカル・抽象のデータセットについて紹介した。
これらのペルソナは、異なるレベルの医療リテラシーと情報ニーズを表しており、ターゲットとなるオーディエンス固有の要約の必要性を強調している。
PERCSの各要約は、医師によって、詳細な誤り分類法を用いて、事実の正確さとペルソナアライメントについてレビューされた。
技術的検証は、人格間での読みやすさ、語彙、内容の深さの明確な違いを示している。
データセットの記述とともに,包括性,可読性,忠実性を評価する自動評価指標を用いて,PERCS上の4つの大規模言語モデルをベンチマークし,今後の研究のベースラインとなる結果を確立する。
このデータセット、アノテーションガイドラインおよび評価資料は、ペルソナ固有のコミュニケーションと制御可能な生体医学要約の研究を支援するために公開されている。
関連論文リスト
- A Survey of Medical Vision-and-Language Applications and Their Techniques [48.268198631277315]
医療ビジョン・アンド・ランゲージモデル(MVLM)は、複雑な医療データを解釈するための自然言語インタフェースを提供する能力から、大きな関心を集めている。
本稿では,MVLMの概要と適用した各種医療課題について概観する。
また、これらのタスクに使用するデータセットについても検討し、標準化された評価指標に基づいて異なるモデルの性能を比較した。
論文 参考訳(メタデータ) (2024-11-19T03:27:05Z) - LLaVA-Med: Training a Large Language-and-Vision Assistant for
Biomedicine in One Day [85.19963303642427]
本稿では,バイオメディカルイメージのオープンな研究課題に答えられる視覚言語対話アシスタントを訓練するための費用効率のよいアプローチを提案する。
モデルはまず、フィギュア・キャプションのペアを使ってバイオメディカル・ボキャブラリをアライメントし、その後、オープンエンドの会話意味論を習得する。
これにより、バイオメディジンのための大規模言語と視覚アシスタントを15時間以内で(8つのA100で)訓練することができる。
論文 参考訳(メタデータ) (2023-06-01T16:50:07Z) - BiomedGPT: A Generalist Vision-Language Foundation Model for Diverse Biomedical Tasks [68.39821375903591]
汎用AIは、さまざまなデータ型を解釈する汎用性のために、制限に対処する可能性を秘めている。
本稿では,最初のオープンソースかつ軽量な視覚言語基盤モデルであるBiomedGPTを提案する。
論文 参考訳(メタデータ) (2023-05-26T17:14:43Z) - Readability Controllable Biomedical Document Summarization [17.166794984161964]
バイオメディカル文書の可読性制御のための新しいタスクを提案する。
ユーザの可読性要求を認識し、ニーズに合った要約を生成することを目的としている。
論文 参考訳(メタデータ) (2022-10-10T14:03:20Z) - Towards more patient friendly clinical notes through language models and
ontologies [57.51898902864543]
本稿では,単語の単純化と言語モデリングに基づく医療用テキストの自動作成手法を提案する。
我々は,公開医療文のデータセットペアと,臨床医による簡易化版を用いている。
本手法は,医学フォーラムデータに基づく言語モデルを用いて,文法と本来の意味の両方を保存しながら,より単純な文を生成する。
論文 参考訳(メタデータ) (2021-12-23T16:11:19Z) - Self-supervised Answer Retrieval on Clinical Notes [68.87777592015402]
本稿では,ドメイン固有パスマッチングのためのトランスフォーマー言語モデルをトレーニングするためのルールベースのセルフスーパービジョンであるCAPRを紹介する。
目的をトランスフォーマーベースの4つのアーキテクチャ、コンテキスト文書ベクトル、ビ-、ポリエンコーダ、クロスエンコーダに適用する。
本稿では,ドメイン固有パスの検索において,CAPRが強いベースラインを上回り,ルールベースおよび人間ラベル付きパスを効果的に一般化することを示す。
論文 参考訳(メタデータ) (2021-08-02T10:42:52Z) - Automated Lay Language Summarization of Biomedical Scientific Reviews [16.01452242066412]
健康リテラシーは適切な健康判断と治療結果の確保において重要な要素として浮上している。
医療用語とこのドメインの専門言語の複雑な構造は、健康情報を解釈するのが特に困難にします。
本稿では,生物医学的レビューの要約を自動生成する新しい課題について紹介する。
論文 参考訳(メタデータ) (2020-12-23T10:01:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。