論文の概要: Priberam at MESINESP Multi-label Classification of Medical Texts Task
- arxiv url: http://arxiv.org/abs/2105.05614v1
- Date: Wed, 12 May 2021 12:14:16 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-13 12:33:12.508820
- Title: Priberam at MESINESP Multi-label Classification of Medical Texts Task
- Title(参考訳): MESINESPにおける医療用テキストタスクの多ラベル分類
- Authors: Ruben Cardoso, Zita Marinho, Afonso Mendes, Sebasti\~ao Miranda
- Abstract要約: この研究は、BioASQ タスク Mesinesp における Priberam の参加を示している。
4つの異なるモデルを用いて,大規模マルチラベル分類問題に対処する。
その結果,3つのモデルすべてが良好に動作し,最良性能はアンサンブルによって達成されることがわかった。
- 参考スコア(独自算出の注目度): 3.195417382176902
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Medical articles provide current state of the art treatments and diagnostics
to many medical practitioners and professionals. Existing public databases such
as MEDLINE contain over 27 million articles, making it difficult to extract
relevant content without the use of efficient search engines. Information
retrieval tools are crucial in order to navigate and provide meaningful
recommendations for articles and treatments. Classifying these articles into
broader medical topics can improve the retrieval of related articles. The set
of medical labels considered for the MESINESP task is on the order of several
thousands of labels (DeCS codes), which falls under the extreme multi-label
classification problem. The heterogeneous and highly hierarchical structure of
medical topics makes the task of manually classifying articles extremely
laborious and costly. It is, therefore, crucial to automate the process of
classification. Typical machine learning algorithms become computationally
demanding with such a large number of labels and achieving better recall on
such datasets becomes an unsolved problem.
This work presents Priberam's participation at the BioASQ task Mesinesp. We
address the large multi-label classification problem through the use of four
different models: a Support Vector Machine (SVM), a customised search engine
(Priberam Search), a BERT based classifier, and a SVM-rank ensemble of all the
previous models. Results demonstrate that all three individual models perform
well and the best performance is achieved by their ensemble, granting Priberam
the 6th place in the present challenge and making it the 2nd best team.
- Abstract(参考訳): 医学記事は、多くの医療従事者や専門家に、芸術的治療と診断の現状を提供する。
MEDLINEのような既存の公開データベースには2700万以上の記事があり、効率的な検索エンジンを使わずに関連コンテンツを抽出することは困難である。
情報検索ツールは、記事や治療に有意義なレコメンデーションをナビゲートし提供するために不可欠である。
これらの項目を幅広い医療トピックに分類することで、関連記事の検索を改善することができる。
MESINESPタスクに考慮された医療ラベルのセットは数千のラベル(DeCSコード)の順序に基づいており、これは極端なマルチラベル分類問題に該当する。
医療トピックの不均一で階層的な構造は、手動で記事の分類を極端に面倒で費用がかかる。
したがって、分類のプロセスを自動化することが不可欠である。
一般的な機械学習アルゴリズムは、このような大量のラベルで計算的に要求され、そのようなデータセットでより良いリコールを達成することは、未解決の問題となる。
この研究は、BioASQ タスク Mesinesp における Priberam の参加を示している。
サポートベクトルマシン(SVM)、カスタマイズされた検索エンジン(Priberam Search)、BERTベースの分類器、および以前のモデルのSVMランクアンサンブルの4つのモデルを用いて、大規模なマルチラベル分類問題に対処する。
その結果、すべての3つのモデルがうまく動作し、最高のパフォーマンスはアンサンブルによって達成され、priberamが現在のチャレンジで6位となり、2番目に優れたチームとなった。
関連論文リスト
- Auxiliary Knowledge-Induced Learning for Automatic Multi-Label Medical Document Classification [22.323705343864336]
3つのアイデアを取り入れた新しいICDインデクシング手法を提案する。
臨床ノートから情報を収集するために,多レベル深部拡張残差畳み込みエンコーダを用いた。
我々はICD分類の課題を医療記録の補助的知識で定式化する。
論文 参考訳(メタデータ) (2024-05-29T13:44:07Z) - Multi-task Explainable Skin Lesion Classification [54.76511683427566]
少ないラベル付きデータでよく一般化する皮膚病変に対する数発のショットベースアプローチを提案する。
提案手法は,アテンションモジュールや分類ネットワークとして機能するセグメンテーションネットワークの融合を含む。
論文 参考訳(メタデータ) (2023-10-11T05:49:47Z) - DKEC: Domain Knowledge Enhanced Multi-Label Classification for Diagnosis Prediction [4.94752151268185]
本稿では,診断予測のためのドメイン知識強化分類であるDKECについて述べる。
3つのオンライン医療知識源を用いてDKECを構築し,現実の救急医療サービス(EMS)データセットと電子健康記録(EHR)データセットで評価する。
その結果、DKECは、最先端のラベルワイドアテンションネットワークや、異なるサイズのトランスフォーマーモデルよりも優れていた。
論文 参考訳(メタデータ) (2023-10-10T22:53:15Z) - KenMeSH: Knowledge-enhanced End-to-end Biomedical Text Labelling [19.321887243319924]
現在、MeSH(Messical Subject Headings)は、PubMedデータベースに記録されたすべてのバイオメディカル記事に手動で割り当てられ、関連する情報の検索を容易にする。
我々は、新しいテキスト機能と動的textbfKnowledge-textbfenhancedマスクアテンションを組み合わせたエンドツーエンドモデルであるKenMeSHを提案する。
論文 参考訳(メタデータ) (2022-03-14T03:09:56Z) - An Analysis of a BERT Deep Learning Strategy on a Technology Assisted
Review Task [91.3755431537592]
文書検診はEvidenced Based Medicineにおける中心的な課題である。
本稿では,BERT や PubMedBERT を組み込んだ DL 文書分類手法と DL 類似性検索経路を提案する。
2017年と2018年のCLEF eHealth コレクションにおいて,私の DL 戦略の検索の有効性を検証し,評価した。
論文 参考訳(メタデータ) (2021-04-16T19:45:27Z) - Active learning for medical code assignment [55.99831806138029]
臨床領域における多ラベルテキスト分類におけるアクティブラーニング(AL)の有効性を示す。
MIMIC-IIIデータセットにICD-9コードを自動的に割り当てるために、よく知られたALメソッドのセットを適用します。
その結果、有益なインスタンスの選択は、大幅に減少したトレーニングセットで満足のいく分類を提供する。
論文 参考訳(メタデータ) (2021-04-12T18:11:17Z) - A Meta-embedding-based Ensemble Approach for ICD Coding Prediction [64.42386426730695]
国際疾病分類 (icd) は、世界中で臨床コーディングに使われているデファクトコードである。
これらのコードにより、医療提供者は償還を請求し、診断情報の効率的な保管と検索を容易にします。
提案手法は,日常的な医学データと科学論文の外部知識を用いて,効果的に単語ベクトルを訓練することにより,神経モデルの性能を高める。
論文 参考訳(メタデータ) (2021-02-26T17:49:58Z) - Collaborative Unsupervised Domain Adaptation for Medical Image Diagnosis [102.40869566439514]
我々は、Unsupervised Domain Adaptation (UDA)を通じて、対象タスクにおける学習を支援するために、関連ドメインからの豊富なラベル付きデータを活用しようとしている。
クリーンなラベル付きデータやサンプルを仮定するほとんどのUDAメソッドが等しく転送可能であるのとは異なり、協調的教師なしドメイン適応アルゴリズムを革新的に提案する。
提案手法の一般化性能を理論的に解析し,医用画像と一般画像の両方で実験的に評価する。
論文 参考訳(メタデータ) (2020-07-05T11:49:17Z) - Interaction Matching for Long-Tail Multi-Label Classification [57.262792333593644]
既存のマルチラベル分類モデルにおいて,制約に対処するためのエレガントで効果的なアプローチを提案する。
ソフトなn-gram相互作用マッチングを実行することで、ラベルと自然言語記述をマッチングする。
論文 参考訳(メタデータ) (2020-05-18T15:27:55Z) - Exemplar Auditing for Multi-Label Biomedical Text Classification [0.4873362301533824]
我々は、最近提案されたゼロショットシーケンスラベリング手法「畳み込み分解による教師付きラベリング」を一般化する。
この手法は"イントロスペクション(introspection)"と分類され、推論時間予測のきめ細かい特徴を最も近い隣人に関連付ける。
提案手法は,医療従事者に対して,モデルの予測を駆動する健全な特徴を理解する上で,競争力のある分類モデルと尋問メカニズムの両方を提供する。
論文 参考訳(メタデータ) (2020-04-07T02:54:20Z) - Seeing The Whole Patient: Using Multi-Label Medical Text Classification
Techniques to Enhance Predictions of Medical Codes [2.158285012874102]
18,50,155ラベルの多ラベル医療用テキスト分類問題について報告する。
不均衡なデータに対して、頻繁に発生するラベルは、埋め込みに組み込まれた追加機能から最も恩恵を受けることを示す。
この研究の高次元埋め込みは公共用途に利用可能である。
論文 参考訳(メタデータ) (2020-03-29T02:19:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。