Fugu-MT 論文翻訳(概要): CARE: Extracting Experimental Findings From Clinical Literature

論文の概要: CARE: Extracting Experimental Findings From Clinical Literature

arxiv url: http://arxiv.org/abs/2311.09736v1
Date: Thu, 16 Nov 2023 10:06:19 GMT
ステータス: 翻訳完了
システム内更新日: 2023-11-17 15:07:13.707613
Title: CARE: Extracting Experimental Findings From Clinical Literature
Title（参考訳）: CARE:臨床文献から実験的発見を抽出する
Authors: Aakanksha Naik, Bailey Kuehl, Erin Bransom, Doug Downey, Tom Hope
Abstract要約: CAREは文献から臨床所見を抽出するためのIEデータセットである。我々は,エンティティと属性間のn-ary関係として微細な発見をキャプチャする新しいアノテーションスキーマを開発した。我々は、データセット上で様々な最先端のIEシステムの性能をベンチマークする。
参考スコア（独自算出の注目度）: 31.932111815835412
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Extracting fine-grained experimental findings from literature can provide massive utility for scientific applications. Prior work has focused on developing annotation schemas and datasets for limited aspects of this problem, leading to simpler information extraction datasets which do not capture the real-world complexity and nuance required for this task. Focusing on biomedicine, this work presents CARE (Clinical Aggregation-oriented Result Extraction) -- a new IE dataset for the task of extracting clinical findings. We develop a new annotation schema capturing fine-grained findings as n-ary relations between entities and attributes, which includes phenomena challenging for current IE systems such as discontinuous entity spans, nested relations, and variable arity n-ary relations. Using this schema, we collect extensive annotations for 700 abstracts from two sources: clinical trials and case reports. We also benchmark the performance of various state-of-the-art IE systems on our dataset, including extractive models and generative LLMs in fully supervised and limited data settings. Our results demonstrate the difficulty of our dataset -- even SOTA models such as GPT4 struggle, particularly on relation extraction. We release our annotation schema and CARE to encourage further research on extracting and aggregating scientific findings from literature.
Abstract（参考訳）: 文献から詳細な実験結果を抽出することは、科学的応用に多大な有用性をもたらす。以前の作業では、この問題の限られた側面のためのアノテーションスキーマとデータセットの開発に重点を置いており、より単純な情報抽出データセットは、このタスクに必要な現実世界の複雑さとニュアンスを捉えていない。バイオメディシンに焦点を当てた本研究は,臨床所見抽出のための新しいIEデータセットであるCARE(Clinical Agrregation-oriented Result extract)を提示する。我々は,非連続的なエンティティスパン,ネスト関係,可変arity n-ary関係など,現在のIEシステムにおいて困難な現象を含む,エンティティと属性間のn-ary関係として微細な発見をキャプチャする新しいアノテーションスキーマを開発した。このスキーマを用いて,臨床試験とケースレポートの2つのソースから,700の抽象概念に対する広範なアノテーションを収集した。また、データセット上での様々な最先端IEシステムの性能をベンチマークし、完全な教師付きおよび制限されたデータ設定において、抽出モデルと生成LDMを含む。その結果,gpt4 などの sota モデル,特に関係抽出において,データセットの難易度が示された。文献からの科学的知見の抽出と集約に関するさらなる研究を奨励するために、アノテーションスキーマとCAREをリリースする。

関連論文リスト

Self-Supervised Anatomical Consistency Learning for Vision-Grounded Medical Report Generation [61.350584471060756]
医用画像の臨床的に正確な記述を作成することを目的とした医用レポート生成。本稿では, 自己監督型解剖学的一貫性学習(SS-ACL)を提案し, 生成された報告を対応する解剖学的領域と整合させる。 SS-ACLは、ヒト解剖学の不変のトップダウン包摂構造にインスパイアされた階層的な解剖学的グラフを構築する。
論文参考訳（メタデータ） (2025-09-30T08:59:06Z)
HySemRAG: A Hybrid Semantic Retrieval-Augmented Generation Framework for Automated Literature Synthesis and Methodological Gap Analysis [55.2480439325792]
HySemRAGは、Extract, Transform, Load (ETL)パイプラインとRetrieval-Augmented Generation (RAG)を組み合わせたフレームワークである。システムは、マルチ層アプローチを通じて既存のRAGアーキテクチャの制限に対処する。
論文参考訳（メタデータ） (2025-08-01T20:30:42Z)
An Empirical Study of Validating Synthetic Data for Text-Based Person Retrieval [51.10419281315848]
我々は,テキストベース人検索(TBPR)研究における合成データの可能性を探るため,実証的研究を行った。本稿では,自動プロンプト構築戦略を導入するクラス間画像生成パイプラインを提案する。我々は、画像のさらなる編集に生成AIモデルを応用した、クラス内画像拡張パイプラインを開発する。
論文参考訳（メタデータ） (2025-03-28T06:18:15Z)
Causal Discovery from Data Assisted by Large Language Models [50.193740129296245]
知識駆動発見のために、実験データと事前のドメイン知識を統合することが不可欠である。本稿では、高分解能走査透過電子顕微鏡(STEM)データと大規模言語モデル(LLM)からの洞察を組み合わせることで、このアプローチを実証する。 SmドープBiFeO3(SmBFO)におけるChatGPTをドメイン固有文献に微調整することにより、構造的、化学的、分極的自由度の間の因果関係をマッピングするDAG(Directed Acyclic Graphs)の隣接行列を構築する。
論文参考訳（メタデータ） (2025-03-18T02:14:49Z)
SciER: An Entity and Relation Extraction Dataset for Datasets, Methods, and Tasks in Scientific Documents [49.54155332262579]
我々は,科学論文のデータセット,メソッド,タスクに関連するエンティティに対して,新たなエンティティと関係抽出データセットをリリースする。我々のデータセットには、24k以上のエンティティと12kの関係を持つ106の注釈付きフルテキストの科学出版物が含まれています。
論文参考訳（メタデータ） (2024-10-28T15:56:49Z)
Decoding MIE: A Novel Dataset Approach Using Topic Extraction and Affiliation Parsing [0.0]
本研究は,医療情報学ヨーロッパ(MIE)会議の手続きから得られた新しいデータセットを紹介する。我々は,「健康技術・情報学研究」誌の4,606論文からメタデータと要約を抽出し,分析した。
論文参考訳（メタデータ） (2024-10-06T19:34:23Z)
Dynamic Graph Enhanced Contrastive Learning for Chest X-ray Report Generation [92.73584302508907]
コントラスト学習を用いた医療レポート作成を支援するために,動的構造とノードを持つ知識グラフを提案する。詳しくは、グラフの基本構造は一般知識から事前構築される。各イメージ機能は、レポート生成のためにデコーダモジュールに入力する前に、独自の更新グラフに統合される。
論文参考訳（メタデータ） (2023-03-18T03:53:43Z)
PcMSP: A Dataset for Scientific Action Graphs Extraction from Polycrystalline Materials Synthesis Procedure Text [1.9573380763700712]
このデータセットは、実験段落から抽出された合成文と、エンティティの言及と文内関係を同時に含んでいる。 PcMSPコーパスの品質を保証する2段階の人間アノテーションとアノテーション間合意研究を行った。本稿では,4つの自然言語処理タスクを紹介する。文分類,名前付きエンティティ認識,関係分類,エンティティと関係の合同抽出である。
論文参考訳（メタデータ） (2022-10-22T09:43:54Z)
ImDrug: A Benchmark for Deep Imbalanced Learning in AI-aided Drug Discovery [79.08833067391093]
現実世界の医薬品のデータセットは、しばしば高度に不均衡な分布を示す。 ImDrugはオープンソースのPythonライブラリを備えたベンチマークで、4つの不均衡設定、11のAI対応データセット、54の学習タスク、16のベースラインアルゴリズムで構成されています。ドラッグ発見パイプラインの幅広い範囲にまたがる問題やソリューションに対して、アクセス可能でカスタマイズ可能なテストベッドを提供する。
論文参考訳（メタデータ） (2022-09-16T13:35:57Z)
EBOCA: Evidences for BiOmedical Concepts Association Ontology [55.41644538483948]
本論文は,生物医学領域の概念とそれらの関連性を記述するオントロジーであるEBOCAと,それらの関連性を支持するエビデンスを提案する。 DISNETのサブセットから得られるテストデータとテキストからの自動アソシエーション抽出が変換され、実際のシナリオで使用できる知識グラフが作成されるようになった。
論文参考訳（メタデータ） (2022-08-01T18:47:03Z)
Discovering Drug-Target Interaction Knowledge from Biomedical Literature [107.98712673387031]
人体における薬物と標的(DTI)の相互作用は、生物医学や応用において重要な役割を担っている。毎年何百万もの論文がバイオメディカル分野で出回っているので、文学からDTIの知識を自動的に発見することは、業界にとって急激な需要となっている。生成的アプローチを用いて,この課題に対する最初のエンドツーエンドソリューションについて検討する。我々はDTI三重項をシーケンスとみなし、Transformerベースのモデルを使ってエンティティや関係の詳細なアノテーションを使わずに直接生成する。
論文参考訳（メタデータ） (2021-09-27T17:00:14Z)
CREATe: Clinical Report Extraction and Annotation Technology [53.731999072534876]
臨床症例報告は、特定の臨床症例の特異な側面を記述した記述である。これらのレポートを注釈付け、インデックス付け、あるいはキュレートするエンドツーエンドシステムを開発する試みはない。本稿では,新たな計算資源プラットフォームを提案し,臨床事例レポートの内容の抽出,索引付け,照会を行う。
論文参考訳（メタデータ） (2021-02-28T16:50:14Z)
Self-Supervised Learning for Visual Summary Identification in Scientific Publications [21.26121265868308]
要約に基づいて、出版物の視覚的な要約として機能する数字を選択するための新しいベンチマークデータセットを作成します。図形キャプション付き図形へのインライン参照のマッチングに基づいて,自己教師付き学習手法を開発する。生物医学およびコンピュータ科学の分野の実験は私達のモデルが芸術の状態を上回ることができることを示します。
論文参考訳（メタデータ） (2020-12-21T09:48:58Z)
The SOFC-Exp Corpus and Neural Approaches to Information Extraction in the Materials Science Domain [11.085048329202335]
我々は, 固体酸化物燃料電池に関する実験に関する情報を, 科学的出版物にマーキングするためのアノテーション・スキームを開発した。コーパスとアノテーション間の合意研究は、提案されたエンティティ認識の複雑さを実証する。我々は、新しいデータセットに基づいて対処できる様々なタスクに対して、強力なニューラルネットワークベースのモデルを提示します。
論文参考訳（メタデータ） (2020-06-04T17:49:34Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。