論文の概要: Large-scale fine-grained semantic indexing of biomedical literature
based on weakly-supervised deep learning
- arxiv url: http://arxiv.org/abs/2301.09350v1
- Date: Mon, 23 Jan 2023 10:33:22 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-24 13:54:29.184628
- Title: Large-scale fine-grained semantic indexing of biomedical literature
based on weakly-supervised deep learning
- Title(参考訳): 弱教師付き深層学習に基づく生物医学文献の大規模細粒度意味インデクス
- Authors: Anastasios Nentidis, Thomas Chatzopoulos, Anastasia Krithara,
Grigorios Tsoumakas, Georgios Paliouras
- Abstract要約: 本研究では,概念レベルでのアノテーションの自動修正手法を提案する。
提案手法は拡張された大規模レトロスペクティブシナリオに基づいて評価される。
その結果, 自動記述子には概念発生が強く, 辞書ベースの記述子と組み合わせればさらに拡張できる可能性が示唆された。
- 参考スコア(独自算出の注目度): 3.422873244787516
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Semantic indexing of biomedical literature is usually done at the level of
MeSH descriptors, representing topics of interest for the biomedical community.
Several related but distinct biomedical concepts are often grouped together in
a single coarse-grained descriptor and are treated as a single topic for
semantic indexing. This study proposes a new method for the automated
refinement of subject annotations at the level of concepts, investigating deep
learning approaches. Lacking labelled data for this task, our method relies on
weak supervision based on concept occurrence in the abstract of an article. The
proposed approach is evaluated on an extended large-scale retrospective
scenario, taking advantage of concepts that eventually become MeSH descriptors,
for which annotations become available in MEDLINE/PubMed. The results suggest
that concept occurrence is a strong heuristic for automated subject annotation
refinement and can be further enhanced when combined with dictionary-based
heuristics. In addition, such heuristics can be useful as weak supervision for
developing deep learning models that can achieve further improvement in some
cases.
- Abstract(参考訳): バイオメディカル文献のセマンティックインデックス化は通常、バイオメディカルコミュニティの関心事を表すMeSH記述子のレベルで行われる。
いくつかの関連するが異なる生体医学の概念は、しばしば単一の粗い粒度の記述子にまとめられ、セマンティックインデックスの単一のトピックとして扱われる。
本研究では,概念レベルにおける主題アノテーションの自動改良手法を提案し,深層学習手法について検討する。
このタスクにはラベル付きデータがないため、論文の要約における概念発生に基づく弱い監督に依存する。
提案手法は,MEDLINE/PubMedでアノテーションが利用可能になるMeSH記述子となる概念を活かして,拡張された大規模なレトロスペクティブシナリオで評価される。
以上の結果から,概念の出現は,自動アノテーション改良のための強いヒューリスティックであり,辞書に基づくヒューリスティックと組み合わせることでさらに拡張できることが示唆された。
さらに、このようなヒューリスティックは、深層学習モデルを開発するための弱い監督として有用であり、場合によってはさらなる改善を達成できる。
関連論文リスト
- NeuroExplainer: Fine-Grained Attention Decoding to Uncover Cortical
Development Patterns of Preterm Infants [77.56132757244211]
我々はNeuroExplainerと呼ばれる説明可能な幾何学的深層ネットワークを提案する。
NeuroExplainerは、早産に伴う幼児の皮質発達パターンの解明に使用される。
論文 参考訳(メタデータ) (2023-01-01T12:48:12Z) - Discriminative Attribution from Counterfactuals [64.94009515033984]
本稿では,特徴属性と反実的説明を組み合わせたニューラルネットワークの解釈可能性について述べる。
本手法は,特徴属性法の性能を客観的に評価するために有効であることを示す。
論文 参考訳(メタデータ) (2021-09-28T00:53:34Z) - Self-Supervised Detection of Contextual Synonyms in a Multi-Class
Setting: Phenotype Annotation Use Case [11.912581294872767]
文脈的単語埋め込みは文脈的同義語を検出する強力なツールである。
本研究では,浅部マッチングによって生成されたデータに基づいて,概念の文脈的同義性を検出できる自己教師付き事前学習手法を提案する。
論文 参考訳(メタデータ) (2021-09-04T21:35:01Z) - Fine-tuning Pretrained Language Models with Label Attention for
Explainable Biomedical Text Classification [1.066048003460524]
PTMの微調整プロセスに意味ラベル記述を注入するための改良されたラベルアテンションに基づくアーキテクチャを開発した。
2つの公開医療データセットの結果、提案手法は従来の微調整PTMと先行技術モデルよりも優れていた。
論文 参考訳(メタデータ) (2021-08-26T14:23:06Z) - Paragraph-level Simplification of Medical Texts [35.650619024498425]
手動の簡略化は生物医学文献の急速に成長する体にスケールしません。
異なる臨床トピックに関連するすべての公開された証拠の技術的およびレイアウト要約からなる英語での平行テキストの新しいコーパスを紹介します。
本研究では,科学テキストを前提としたマスキング型言語モデルから,確率スコアに基づく新たな指標を提案する。
論文 参考訳(メタデータ) (2021-04-12T18:56:05Z) - Few-shot Medical Image Segmentation using a Global Correlation Network
with Discriminative Embedding [60.89561661441736]
医療画像分割のための新しい手法を提案する。
深層畳み込みネットワークを用いた数ショット画像セグメンタを構築します。
深層埋め込みの識別性を高め,同一クラスの特徴領域のクラスタリングを促進する。
論文 参考訳(メタデータ) (2020-12-10T04:01:07Z) - NINEPINS: Nuclei Instance Segmentation with Point Annotations [2.19221864553448]
本稿では,ポイントアノテーションから自動生成される擬似ラベルセグメンテーションを用いたサンプルセグメンテーションのアルゴリズムを提案する。
生成されたセグメンテーションマスクを用いて、提案手法は、インスタンスセグメンテーションを実現するために、HoVer-Netモデルの修正版を訓練する。
実験結果から,提案手法はポイントアノテーションの不正確性に対して頑健であり,完全注釈付きインスタンスマスクを用いたHover-Netと比較すると,セグメンテーション性能の劣化が必ずしも組織分類などの高次タスクの劣化を意味するとは限らないことが示唆された。
論文 参考訳(メタデータ) (2020-06-24T08:28:52Z) - Weakly supervised multiple instance learning histopathological tumor
segmentation [51.085268272912415]
スライド画像全体のセグメント化のための弱教師付きフレームワークを提案する。
トレーニングモデルに複数のインスタンス学習スキームを利用する。
提案するフレームワークは,The Cancer Genome AtlasとPatchCamelyonデータセットのマルチロケーションとマルチ中心公開データに基づいて評価されている。
論文 参考訳(メタデータ) (2020-04-10T13:12:47Z) - Exemplar Auditing for Multi-Label Biomedical Text Classification [0.4873362301533824]
我々は、最近提案されたゼロショットシーケンスラベリング手法「畳み込み分解による教師付きラベリング」を一般化する。
この手法は"イントロスペクション(introspection)"と分類され、推論時間予測のきめ細かい特徴を最も近い隣人に関連付ける。
提案手法は,医療従事者に対して,モデルの予測を駆動する健全な特徴を理解する上で,競争力のある分類モデルと尋問メカニズムの両方を提供する。
論文 参考訳(メタデータ) (2020-04-07T02:54:20Z) - Salience Estimation with Multi-Attention Learning for Abstractive Text
Summarization [86.45110800123216]
テキスト要約のタスクでは、単語、フレーズ、文のサリエンス推定が重要な要素である。
本稿では,サラレンス推定のための2つの新しい注目学習要素を含むマルチアテンション学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-04-07T02:38:56Z) - Panoptic Feature Fusion Net: A Novel Instance Segmentation Paradigm for
Biomedical and Biological Images [91.41909587856104]
本稿では,本研究における意味的特徴とインスタンス的特徴を統一するPanoptic Feature Fusion Net(PFFNet)を提案する。
提案するPFFNetには,インスタンス予測を意味的特徴に組み込むための残注意特徴融合機構が組み込まれている。
様々なバイオメディカルおよび生物学的データセットにおいて、最先端のいくつかの手法を上回ります。
論文 参考訳(メタデータ) (2020-02-15T09:19:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。