論文の概要: Large-scale investigation of weakly-supervised deep learning for the
fine-grained semantic indexing of biomedical literature
- arxiv url: http://arxiv.org/abs/2301.09350v2
- Date: Thu, 5 Oct 2023 14:17:39 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-06 23:05:33.179993
- Title: Large-scale investigation of weakly-supervised deep learning for the
fine-grained semantic indexing of biomedical literature
- Title(参考訳): 生体医学文献の細粒度意味インデクシングのための弱教師付き深層学習の大規模研究
- Authors: Anastasios Nentidis, Thomas Chatzopoulos, Anastasia Krithara,
Grigorios Tsoumakas, Georgios Paliouras
- Abstract要約: 本研究では,MeSH概念のレベルでのアノテーションの自動修正手法を提案する。
提案手法は,デクリプタに促進された概念に基づいて,大規模なふりかえりシナリオに基づいて評価する。
- 参考スコア(独自算出の注目度): 7.171698704686836
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Objective: Semantic indexing of biomedical literature is usually done at the
level of MeSH descriptors with several related but distinct biomedical concepts
often grouped together and treated as a single topic. This study proposes a new
method for the automated refinement of subject annotations at the level of MeSH
concepts. Methods: Lacking labelled data, we rely on weak supervision based on
concept occurrence in the abstract of an article, which is also enhanced by
dictionary-based heuristics. In addition, we investigate deep learning
approaches, making design choices to tackle the particular challenges of this
task. The new method is evaluated on a large-scale retrospective scenario,
based on concepts that have been promoted to descriptors. Results: In our
experiments concept occurrence was the strongest heuristic achieving a macro-F1
score of about 0.63 across several labels. The proposed method improved it
further by more than 4pp. Conclusion: The results suggest that concept
occurrence is a strong heuristic for refining the coarse-grained labels at the
level of MeSH concepts and the proposed method improves it further.
- Abstract(参考訳): 目的: バイオメディカル文献のセマンティックインデックス化は通常、MeSH記述子のレベルで行われ、関連するが異なるいくつかの生体医学概念がまとめられ、単一のトピックとして扱われる。
本研究では,メッシュ概念のレベルにおける主題アノテーションの自動改良手法を提案する。
方法: ラベル付きデータの欠落は, 論文の要約における概念発生に基づく弱い監督に依存し, 辞書に基づくヒューリスティックスによって強化される。
さらに、ディープラーニングのアプローチを調査し、このタスクの特定の課題に取り組むためにデザインの選択を行います。
提案手法は,記述子に昇格した概念に基づいて,大規模なレトロスペクティブシナリオに基づいて評価する。
結果: 実験では複数のラベルで約0.63のマクロF1スコアを達成できた。
提案法によりさらに4pp以上改善した。
結論: 提案手法は,MeSH概念のレベルで粗粒度ラベルを精製する上で, 概念発生が強いヒューリスティックであることが示唆された。
関連論文リスト
- NovoBench: Benchmarking Deep Learning-based De Novo Peptide Sequencing Methods in Proteomics [58.03989832372747]
Emphde novoペプチドシークエンシングのための初となるNovoBenchベンチマークを報告する。
多様な質量スペクトルデータ、統合モデル、総合的な評価指標から構成される。
DeepNovo、PointNovo、Casanovo、InstaNovo、AdaNovo、$pi$-HelixNovoといった最近の手法が私たちのフレームワークに統合されています。
論文 参考訳(メタデータ) (2024-06-16T08:23:21Z) - Entangled Relations: Leveraging NLI and Meta-analysis to Enhance Biomedical Relation Extraction [35.320291731292286]
そこで我々は,NLIの原理を応用し,関係抽出を強化したMetaEntail-REを提案する。
我々のアプローチは、関係クラスをクラス指示仮説に言語化することで過去の研究に追従する。
実験の結果,MetaEntail-REはバイオメディカルドメインと一般ドメインの両方で性能向上を示した。
論文 参考訳(メタデータ) (2024-05-31T23:05:04Z) - Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - Multi-task Explainable Skin Lesion Classification [54.76511683427566]
少ないラベル付きデータでよく一般化する皮膚病変に対する数発のショットベースアプローチを提案する。
提案手法は,アテンションモジュールや分類ネットワークとして機能するセグメンテーションネットワークの融合を含む。
論文 参考訳(メタデータ) (2023-10-11T05:49:47Z) - Biomedical Named Entity Recognition via Dictionary-based Synonym
Generalization [51.89486520806639]
本研究では,入力テキストに含まれる生物医学的概念をスパンベース予測を用いて認識する,新しいSynGenフレームワークを提案する。
提案手法を広範囲のベンチマークで広範囲に評価し,SynGenが従来の辞書ベースモデルよりも顕著なマージンで優れていることを確認した。
論文 参考訳(メタデータ) (2023-05-22T14:36:32Z) - Rethinking Semi-Supervised Medical Image Segmentation: A
Variance-Reduction Perspective [51.70661197256033]
医用画像セグメンテーションのための階層化グループ理論を用いた半教師付きコントラスト学習フレームワークARCOを提案する。
まず、分散還元推定の概念を用いてARCOを構築することを提案し、特定の分散還元技術が画素/ボクセルレベルのセグメンテーションタスクにおいて特に有用であることを示す。
5つの2D/3D医療データセットと3つのセマンティックセグメンテーションデータセットのラベル設定が異なる8つのベンチマークで、我々のアプローチを実験的に検証する。
論文 参考訳(メタデータ) (2023-02-03T13:50:25Z) - A reproducible experimental survey on biomedical sentence similarity: a
string-based method sets the state of the art [0.0]
本報告では,生物医学的文章類似性に関する再現可能な実験結果として,最大かつ初めて紹介する。
本研究の目的は,問題の現状を解明し,現状の手法の評価を未然に防ぐことにある。
実験の結果,前処理段階と NER ツールの選択が文類似性手法の性能に大きく影響していることが確認された。
論文 参考訳(メタデータ) (2022-05-18T06:20:42Z) - Self-Supervised Detection of Contextual Synonyms in a Multi-Class
Setting: Phenotype Annotation Use Case [11.912581294872767]
文脈的単語埋め込みは文脈的同義語を検出する強力なツールである。
本研究では,浅部マッチングによって生成されたデータに基づいて,概念の文脈的同義性を検出できる自己教師付き事前学習手法を提案する。
論文 参考訳(メタデータ) (2021-09-04T21:35:01Z) - Exemplar Auditing for Multi-Label Biomedical Text Classification [0.4873362301533824]
我々は、最近提案されたゼロショットシーケンスラベリング手法「畳み込み分解による教師付きラベリング」を一般化する。
この手法は"イントロスペクション(introspection)"と分類され、推論時間予測のきめ細かい特徴を最も近い隣人に関連付ける。
提案手法は,医療従事者に対して,モデルの予測を駆動する健全な特徴を理解する上で,競争力のある分類モデルと尋問メカニズムの両方を提供する。
論文 参考訳(メタデータ) (2020-04-07T02:54:20Z) - Panoptic Feature Fusion Net: A Novel Instance Segmentation Paradigm for
Biomedical and Biological Images [91.41909587856104]
本稿では,本研究における意味的特徴とインスタンス的特徴を統一するPanoptic Feature Fusion Net(PFFNet)を提案する。
提案するPFFNetには,インスタンス予測を意味的特徴に組み込むための残注意特徴融合機構が組み込まれている。
様々なバイオメディカルおよび生物学的データセットにおいて、最先端のいくつかの手法を上回ります。
論文 参考訳(メタデータ) (2020-02-15T09:19:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。