Fugu-MT 論文翻訳(概要): Biomedical Data-to-Text Generation via Fine-Tuning Transformers

論文の概要: Biomedical Data-to-Text Generation via Fine-Tuning Transformers

arxiv url: http://arxiv.org/abs/2109.01518v1
Date: Fri, 3 Sep 2021 13:42:30 GMT
ステータス: 翻訳完了
システム内更新日: 2021-09-06 16:58:04.354452
Title: Biomedical Data-to-Text Generation via Fine-Tuning Transformers
Title（参考訳）: 微調整変換器によるバイオメディカルデータ・テキスト生成
Authors: Ruslan Yermakov, Nicholas Drago, Angelo Ziletti
Abstract要約: バイオメディカル領域のデータから、微調整トランスフォーマーが現実的な多文テキストを生成することができることを示す。また、バイオメディカルドメインでD2T生成モデルをベンチマークするための新しいデータセット(BioLeaflets)もリリースしています。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Data-to-text (D2T) generation in the biomedical domain is a promising - yet mostly unexplored - field of research. Here, we apply neural models for D2T generation to a real-world dataset consisting of package leaflets of European medicines. We show that fine-tuned transformers are able to generate realistic, multisentence text from data in the biomedical domain, yet have important limitations. We also release a new dataset (BioLeaflets) for benchmarking D2T generation models in the biomedical domain.
Abstract（参考訳）: バイオメディカル領域におけるデータ・ツー・テキスト(d2t)生成は有望な研究分野である。ここでは,ヨーロッパ医学のパッケージリーフレットからなる実世界のデータセットに,d2t生成のためのニューラルモデルを適用する。我々は、微調整トランスフォーマーがバイオメディカル領域のデータから現実的な多文テキストを生成することができるが、重要な制限があることを示した。また、バイオメディカルドメインでD2T生成モデルをベンチマークするための新しいデータセット(BioLeaflets)もリリースしています。

関連論文リスト

MedMax: Mixed-Modal Instruction Tuning for Training Biomedical Assistants [28.04215981636089]
混合モーダル基礎モデルのための大規模マルチモーダルバイオメディカルインストラクションチューニングデータセットであるMedMaxについて述べる。 1.47万のインスタンスを持つMedMaxは、インターリーブ画像テキスト生成、バイオメディカル画像キャプションと生成、ビジュアルチャット、レポート理解など、さまざまなタスクを含んでいる。我々は、MedMaxデータセットの混合モーダル基礎モデルを微調整し、大幅なパフォーマンス改善を実現した。
論文参考訳（メタデータ） (2024-12-17T08:30:00Z)
Language Model Powered Digital Biology [5.309032614374711]
本稿では,バイオインフォマティクス検索データ(BRAD)デジタルアシスタントのプロトタイプについて述べる。 BRADは、コード実行からオンライン検索まで、バイオインフォマティクスタスクを処理する一連のツールを統合するロボットとエージェントシステムである。我々は,(1)検索拡張生成(RAG)による質問・回答の改善,(2)複雑なソフトウェアパイプラインの実行能力,(3)エージェントパイプラインにおけるタスクの整理・配布能力を通じて,その能力を実証する。
論文参考訳（メタデータ） (2024-09-04T16:43:14Z)
Multi-objective Representation for Numbers in Clinical Narratives: A CamemBERT-Bio-Based Alternative to Large-Scale LLMs [0.9208007322096533]
本稿では,数値の理解におけるトランスフォーマーモデルの限界について検討する。医学文書から抽出した数値を,CamemBERT-bioを用いて8つの特定の生理カテゴリーに分類することを目的とする。
論文参考訳（メタデータ） (2024-05-28T01:15:21Z)
BMRetriever: Tuning Large Language Models as Better Biomedical Text Retrievers [48.21255861863282]
BMRetrieverは、バイオメディカル検索を強化するための一連の密集したレトリバーである。 BMRetrieverは強力なパラメータ効率を示し、410Mの派生型はベースラインを最大11.7倍まで上回っている。
論文参考訳（メタデータ） (2024-04-29T05:40:08Z)
BiomedJourney: Counterfactual Biomedical Image Generation by Instruction-Learning from Multimodal Patient Journeys [99.7082441544384]
本稿では,インストラクション学習によるバイオメディカル画像生成のための新しい手法であるBiomedJourneyを紹介する。我々は、GPT-4を用いて、対応する画像レポートを処理し、疾患進行の自然言語記述を生成する。得られた三重項は、反現実的なバイオメディカル画像生成のための潜伏拡散モデルを訓練するために使用される。
論文参考訳（メタデータ） (2023-10-16T18:59:31Z)
BioAug: Conditional Generation based Data Augmentation for Low-Resource Biomedical NER [52.79573512427998]
低リソースBioNERのための新しいデータ拡張フレームワークであるBioAugを紹介する。 BioAugは、選択的マスキングと知識増強に基づく新しいテキスト再構築タスクを解決するために訓練されている。 5つのベンチマークBioNERデータセットに対するBioAugの有効性を示す。
論文参考訳（メタデータ） (2023-05-18T02:04:38Z)
P-Transformer: A Prompt-based Multimodal Transformer Architecture For Medical Tabular Data [2.6487114372147182]
本稿では,P-Transformerを提案する。このフレームワークは、構造化データと非構造化データの両方から、多彩なモダリティを調和した言語意味空間に効率的にエンコードする。 P-Transformerは、RMSE/MAEで10.9%/11.0%、RMSE/MAEで0.5%/2.2%、BACC/AUROCで1.6%/0.8%、予測可能性でSOTA(State-of-the-art)ベースラインと比較して改善した。
論文参考訳（メタデータ） (2023-03-30T14:25:44Z)
BiomedCLIP: a multimodal biomedical foundation model pretrained from fifteen million scientific image-text pairs [48.376109878173956]
PMC-15Mは,既存のバイオメディカル・マルチモーダル・データセットよりも2桁大きい新しいデータセットである。 PMC-15Mは440万の科学論文から収集された1500万のバイオメディカル画像テキスト対を含んでいる。 PMC-15Mに基づいて,生物医学的視覚言語処理に適したドメイン固有適応を備えた多モーダル基礎モデルであるBiomedCLIPを事前訓練した。
論文参考訳（メタデータ） (2023-03-02T02:20:04Z)
BioGPT: Generative Pre-trained Transformer for Biomedical Text Generation and Mining [140.61707108174247]
本稿では,大規模生物医学文献に基づいて事前学習したドメイン固有生成型トランスフォーマー言語モデルであるBioGPTを提案する。 BC5CDRでは44.98%、38.42%、40.76%のF1スコア、KD-DTIとDDIの関係抽出タスクでは78.2%、PubMedQAでは78.2%の精度が得られた。
論文参考訳（メタデータ） (2022-10-19T07:17:39Z)
AlignTransformer: Hierarchical Alignment of Visual Regions and Disease Tags for Medical Report Generation [50.21065317817769]
本稿では,Align Hierarchical Attention (AHA)とMulti-Grained Transformer (MGT)モジュールを含むAlign Transformerフレームワークを提案する。パブリックなIU-XrayとMIMIC-CXRデータセットの実験は、AlignTransformerが2つのデータセットの最先端メソッドと競合する結果が得られることを示している。
論文参考訳（メタデータ） (2022-03-18T13:43:53Z)
SciFive: a text-to-text transformer model for biomedical literature [0.9482369543628087]
本稿では,大規模なバイオメディカルコーパスで事前学習したドメイン固有T5モデルであるSciFiveを紹介する。本研究は,より困難なテキスト生成タスクの探索と,本領域における新しい手法の開発を支援する。
論文参考訳（メタデータ） (2021-05-28T06:09:23Z)
BioALBERT: A Simple and Effective Pre-trained Language Model for Biomedical Named Entity Recognition [9.05154470433578]
既存のBioNERアプローチはこれらの問題を無視し、最先端(SOTA)モデルを直接採用することが多い。本稿では,大規模バイオメディカルコーパスを用いた効果的なドメイン固有言語モデルであるALBERTを提案する。
論文参考訳（メタデータ） (2020-09-19T12:58:47Z)
A Multilingual Neural Machine Translation Model for Biomedical Data [84.17747489525794]
生物医学領域におけるテキストの翻訳に使用できる多言語ニューラルマシン翻訳モデルをリリースする。このモデルは5つの言語(フランス語、ドイツ語、イタリア語、韓国語、スペイン語)から英語に翻訳できる。ドメインタグを使用して、大量のジェネリックおよびバイオメディカルデータをトレーニングする。
論文参考訳（メタデータ） (2020-08-06T21:26:43Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。