論文の概要: Biomedical Concept Relatedness -- A large EHR-based benchmark
- arxiv url: http://arxiv.org/abs/2010.16218v1
- Date: Fri, 30 Oct 2020 12:20:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-01 15:52:03.859686
- Title: Biomedical Concept Relatedness -- A large EHR-based benchmark
- Title(参考訳): バイオメディカルコンセプト関連性 -- EHRベースの大規模ベンチマーク
- Authors: Claudia Schulz and Josh Levy-Kramer and Camille Van Assel and Miklos
Kepes and Nils Hammerla
- Abstract要約: 医療へのAIの有望な応用は、電子健康記録から情報を取得することである。
このようなアプリケーションに対するAI手法の適合性は、概念の関連性を既知の関連性スコアで予測することによって検証される。
既存の医療概念関連データセットはすべて小さく、手書きのコンセプトペアで構成されている。
これらの問題を克服する新しい概念関連性ベンチマークをオープンソースとして公開しています。
- 参考スコア(独自算出の注目度): 10.133874724214984
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A promising application of AI to healthcare is the retrieval of information
from electronic health records (EHRs), e.g. to aid clinicians in finding
relevant information for a consultation or to recruit suitable patients for a
study. This requires search capabilities far beyond simple string matching,
including the retrieval of concepts (diagnoses, symptoms, medications, etc.)
related to the one in question. The suitability of AI methods for such
applications is tested by predicting the relatedness of concepts with known
relatedness scores. However, all existing biomedical concept relatedness
datasets are notoriously small and consist of hand-picked concept pairs. We
open-source a novel concept relatedness benchmark overcoming these issues: it
is six times larger than existing datasets and concept pairs are chosen based
on co-occurrence in EHRs, ensuring their relevance for the application of
interest. We present an in-depth analysis of our new dataset and compare it to
existing ones, highlighting that it is not only larger but also complements
existing datasets in terms of the types of concepts included. Initial
experiments with state-of-the-art embedding methods show that our dataset is a
challenging new benchmark for testing concept relatedness models.
- Abstract(参考訳): 医療へのAIの有望な応用は、電子健康記録(EHR)から情報を検索することである。
これは単純な文字列マッチングをはるかに超える検索機能を必要とし、問題となっている概念(診断、症状、薬品など)の検索を含む。
このようなアプリケーションに対するAI手法の適合性は、概念の関連性を既知の関連性スコアで予測することによって検証される。
しかし、既存の生体医学的概念関連データセットはすべて小さく、ハンドピックされた概念ペアで構成されている。
既存のデータセットの6倍の大きさであり、コンセプトペアはEHRの共起に基づいて選択され、関心の応用に対するそれらの関連性を保証する。
我々は、新しいデータセットを詳細に分析し、既存のデータセットと比較し、それがより大きなだけでなく、含まれている概念のタイプの観点から既存のデータセットを補完していることを強調する。
最先端の埋め込み手法による最初の実験は、我々のデータセットが概念関連性モデルをテストするための挑戦的な新しいベンチマークであることを示している。
関連論文リスト
- Recent Advances in Predictive Modeling with Electronic Health Records [73.31880579203012]
EHRデータを予測モデリングに利用すると、その特徴からいくつかの課題が生じる。
深層学習は、医療を含む様々な応用においてその優位性を示している。
論文 参考訳(メタデータ) (2024-02-02T00:31:01Z) - Zero-Shot Medical Information Retrieval via Knowledge Graph Embedding [27.14794371879541]
本稿では、ゼロショット医療情報検索(MIR)の新しいアプローチであるMedFusionRankを紹介する。
提案手法は、学習済みのBERTスタイルのモデルを用いて、コンパクトだが情報的なキーワードを抽出する。
これらのキーワードは、医療知識グラフ内の概念エンティティにリンクすることで、ドメイン知識に富む。
論文 参考訳(メタデータ) (2023-10-31T16:26:33Z) - Ontology Enrichment from Texts: A Biomedical Dataset for Concept
Discovery and Placement [22.074094839360413]
新しい概念のメンションはテキストに定期的に現れ、収穫とそれらを知識ベースに配置するために自動化されたアプローチを必要とする。
既存のデータセットは3つの問題に悩まされており、(i)新しい概念が事前に発見され、KB外の参照発見をサポートできないことを前提にしている。
我々は,最近のLarge Language Modelベースの手法である発見と概念配置について,アウト・オブ・KBを参照するためのデータセットを用いて評価を行う。
論文 参考訳(メタデータ) (2023-06-26T13:54:47Z) - ACI-BENCH: a Novel Ambient Clinical Intelligence Dataset for
Benchmarking Automatic Visit Note Generation [4.1331432182859436]
訪問対話からAIによるノート生成の問題に対処する上で,これまでで最大のデータセットを提示する。
また、いくつかの一般的な最先端手法のベンチマーク性能を示す。
論文 参考訳(メタデータ) (2023-06-03T06:42:17Z) - Huatuo-26M, a Large-scale Chinese Medical QA Dataset [29.130166934474044]
本稿では,2600万対のQAペアを用いた医療質問応答(QA)データセットをリリースする。
検索と生成の両方の観点から、データセットの既存のアプローチをベンチマークします。
このデータセットは、医学研究に貢献するだけでなく、患者と臨床医の両方にも役立ちます。
論文 参考訳(メタデータ) (2023-05-02T15:33:01Z) - Rethinking Complex Queries on Knowledge Graphs with Neural Link
Predictors [65.56849255423866]
本稿では,証明可能な推論能力を備えた複雑なクエリを用いたエンドツーエンド学習を支援するニューラルシンボリック手法を提案する。
これまでに検討されていない10種類の新しいクエリを含む新しいデータセットを開発する。
提案手法は,新しいデータセットにおいて先行手法を著しく上回り,既存データセットにおける先行手法を同時に上回っている。
論文 参考訳(メタデータ) (2023-04-14T11:35:35Z) - EBOCA: Evidences for BiOmedical Concepts Association Ontology [55.41644538483948]
本論文は,生物医学領域の概念とそれらの関連性を記述するオントロジーであるEBOCAと,それらの関連性を支持するエビデンスを提案する。
DISNETのサブセットから得られるテストデータとテキストからの自動アソシエーション抽出が変換され、実際のシナリオで使用できる知識グラフが作成されるようになった。
論文 参考訳(メタデータ) (2022-08-01T18:47:03Z) - Multimodal Machine Learning in Precision Health [10.068890037410316]
本総説は, この分野を要約し, 今後の研究に欠かせない話題を特定するものである。
コンテンツ分析と文献検索を組み合わせて,2011年から2021年にかけてPubMed, Google Scholar, IEEEXploreの検索文字列とデータベースを構築した。
情報融合の最も一般的な形態は、初期の融合であり、特に、異種データ融合を行う予測性能の改善があった。
論文 参考訳(メタデータ) (2022-04-10T21:56:07Z) - Semantic Search for Large Scale Clinical Ontologies [63.71950996116403]
本稿では,大規模臨床語彙検索システムを構築するための深層学習手法を提案する。
本稿では,意味学習データに基づくトレーニングデータを生成するTriplet-BERTモデルを提案する。
このモデルは,5つの実ベンチマークデータセットを用いて評価され,提案手法は自由テキストから概念,概念まで,概念語彙の検索において高い結果が得られることを示す。
論文 参考訳(メタデータ) (2022-01-01T05:15:42Z) - Semi-supervised Medical Image Classification with Relation-driven
Self-ensembling Model [71.80319052891817]
医用画像分類のための関係駆動型半教師付きフレームワークを提案する。
これは、摂動下で与えられた入力の予測一貫性を促進することでラベルのないデータを利用する。
本手法は,シングルラベルおよびマルチラベル画像分類のシナリオにおいて,最先端の半教師付き学習手法よりも優れる。
論文 参考訳(メタデータ) (2020-05-15T06:57:54Z) - Predictive Modeling of ICU Healthcare-Associated Infections from
Imbalanced Data. Using Ensembles and a Clustering-Based Undersampling
Approach [55.41644538483948]
本研究は,集中治療室における危険因子の同定と医療関連感染症の予測に焦点をあてる。
感染発生率の低減に向けた意思決定を支援することを目的とする。
論文 参考訳(メタデータ) (2020-05-07T16:13:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。