論文の概要: Sectioning of Biomedical Abstracts: A Sequence of Sequence
Classification Task
- arxiv url: http://arxiv.org/abs/2201.07112v1
- Date: Tue, 18 Jan 2022 16:41:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-19 13:44:29.378771
- Title: Sectioning of Biomedical Abstracts: A Sequence of Sequence
Classification Task
- Title(参考訳): バイオメディカル抽象化のセクション化:シーケンス分類タスクのシーケンス
- Authors: Mehmet Efruz Karabulut, K. Vijay-Shanker
- Abstract要約: 本研究では,SSN-4モデルと呼ぶ最先端のディープラーニングモデルについて検討する。
我々は、このモデルがRandomized Controlled Trials(RCT)データセット以外の新しいデータセットにどのように一般化するかを検討する。
その結果, SSN-4 モデルでは RCT データセットをはるかに超えた一般化は得られなかった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Rapid growth of the biomedical literature has led to many advances in the
biomedical text mining field. Among the vast amount of information, biomedical
article abstracts are the easily accessible sources. However, the number of the
structured abstracts, describing the rhetorical sections with one of
Background, Objective, Method, Result and Conclusion categories is still not
considerable. Exploration of valuable information in the biomedical abstracts
can be expedited with the improvements in the sequential sentence
classification task. Deep learning based models has great performance/potential
in achieving significant results in this task. However, they can often be
overly complex and overfit to specific data. In this project, we study a
state-of-the-art deep learning model, which we called SSN-4 model here. We
investigate different components of the SSN-4 model to study the trade-off
between the performance and complexity. We explore how well this model
generalizes to a new data set beyond Randomized Controlled Trials (RCT)
dataset. We address the question that whether word embeddings can be adjusted
to the task to improve the performance. Furthermore, we develop a second model
that addresses the confusion pairs in the first model. Results show that SSN-4
model does not appear to generalize well beyond RCT dataset.
- Abstract(参考訳): 生物医学文献の急速な成長は、生物医学のテキスト採掘分野において多くの進歩をもたらした。
膨大な情報のうち、生体医学的な記事の要約は簡単にアクセスできる情報源である。
しかし, 背景, 対象, 方法, 結果, 結論のカテゴリの1つを含む修辞的部分を記述する構造化抽象文の数は, いまだに少なからず少ない。
生物医学的要約における貴重な情報の探索は、逐次文分類タスクの改善により、迅速に行うことができる。
ディープラーニングベースのモデルは、このタスクで重要な結果を得る上で、優れたパフォーマンス/ポテンシャルを持つ。
しかし、それらはしばしば複雑すぎ、特定のデータに過度に適合する。
本稿では,SSN-4モデルと呼ぶ最先端のディープラーニングモデルについて検討する。
ssn-4モデルの様々なコンポーネントを調査し,性能と複雑性のトレードオフについて検討した。
我々は、このモデルがRandomized Controlled Trials(RCT)データセット以外の新しいデータセットにどのように一般化するかを検討する。
我々は、パフォーマンスを改善するために、単語埋め込みをタスクに調整できるかどうかという疑問に対処します。
さらに,第1モデルの混乱を解消する第2モデルを開発した。
その結果, SSN-4 モデルでは RCT データセットをはるかに超えた一般化は得られなかった。
関連論文リスト
- NeuroSym-BioCAT: Leveraging Neuro-Symbolic Methods for Biomedical Scholarly Document Categorization and Question Answering [0.14999444543328289]
本稿では,最適化されたトピックモデリングフレームワークであるOVB-LDAとBI-POP CMA-ES最適化技術を統合し,学術文書の抽象分類を強化した新しい手法を提案する。
我々は、ドメイン固有データに基づいて微調整された蒸留MiniLMモデルを用いて、高精度な回答抽出を行う。
論文 参考訳(メタデータ) (2024-10-29T14:45:12Z) - PathInsight: Instruction Tuning of Multimodal Datasets and Models for Intelligence Assisted Diagnosis in Histopathology [7.87900104748629]
6つの異なるタスクをカバーする約45,000のケースのデータセットを慎重にコンパイルしました。
特にLLaVA, Qwen-VL, InternLMを微調整したマルチモーダル大規模モデルで, このデータセットを用いて命令ベースの性能を向上させる。
論文 参考訳(メタデータ) (2024-08-13T17:05:06Z) - Universal and Extensible Language-Vision Models for Organ Segmentation and Tumor Detection from Abdominal Computed Tomography [50.08496922659307]
本稿では、単一のモデルであるUniversal Modelが複数の公開データセットに対処し、新しいクラスに適応することを可能にするユニバーサルフレームワークを提案する。
まず,大規模言語モデルからの言語埋め込みを利用した新しい言語駆動パラメータ生成手法を提案する。
第二に、従来の出力層は軽量でクラス固有のヘッドに置き換えられ、ユニバーサルモデルでは25の臓器と6種類の腫瘍を同時に分割することができる。
論文 参考訳(メタデータ) (2024-05-28T16:55:15Z) - BioREx: Improving Biomedical Relation Extraction by Leveraging
Heterogeneous Datasets [7.7587371896752595]
生物医学的関係抽出(RE)は、生物医学的自然言語処理(NLP)研究における中心的な課題である。
本稿では、個々のデータセットのデータの均一性を体系的に解決し、それらを大きなデータセットに組み合わせるための新しいフレームワークを提案する。
評価の結果,BioRExは個々のデータセットでトレーニングしたベンチマークシステムよりも大幅に高い性能を示すことがわかった。
論文 参考訳(メタデータ) (2023-06-19T22:48:18Z) - Competence-based Multimodal Curriculum Learning for Medical Report
Generation [98.10763792453925]
本稿では,コンピテンスベースのマルチモーダルカリキュラム学習フレームワーク(CMCL)を提案する。
具体的には、CMCLは放射線学者の学習過程をシミュレートし、段階的にモデルを最適化する。
パブリックIU-XrayとMIMIC-CXRデータセットの実験は、CMCLを既存のモデルに組み込んでパフォーマンスを向上させることができることを示している。
論文 参考訳(メタデータ) (2022-06-24T08:16:01Z) - One Model is All You Need: Multi-Task Learning Enables Simultaneous
Histology Image Segmentation and Classification [3.8725005247905386]
組織領域のセグメンテーションと分類のためのマルチタスク学習手法を提案する。
一つのネットワークで同時予測を可能にする。
また,機能共有の結果,学習した表現が下流タスクの改善に有効であることを示す。
論文 参考訳(メタデータ) (2022-02-28T20:22:39Z) - Towards an Automatic Analysis of CHO-K1 Suspension Growth in
Microfluidic Single-cell Cultivation [63.94623495501023]
我々は、人間の力で抽象化されたニューラルネットワークをデータレベルで注入できる新しい機械学習アーキテクチャを提案する。
具体的には、自然データと合成データに基づいて生成モデルを同時に訓練し、細胞数などの対象変数を確実に推定できる共有表現を学習する。
論文 参考訳(メタデータ) (2020-10-20T08:36:51Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Modeling Shared Responses in Neuroimaging Studies through MultiView ICA [94.31804763196116]
被験者の大規模なコホートを含むグループ研究は、脳機能組織に関する一般的な結論を引き出す上で重要である。
グループ研究のための新しい多視点独立成分分析モデルを提案し、各被験者のデータを共有独立音源と雑音の線形結合としてモデル化する。
まず、fMRIデータを用いて、被験者間の共通音源の同定における感度の向上を示す。
論文 参考訳(メタデータ) (2020-06-11T17:29:53Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。