論文の概要: Interpretability from a new lens: Integrating Stratification and Domain
knowledge for Biomedical Applications
- arxiv url: http://arxiv.org/abs/2303.09322v1
- Date: Wed, 15 Mar 2023 12:02:02 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-17 15:22:06.189488
- Title: Interpretability from a new lens: Integrating Stratification and Domain
knowledge for Biomedical Applications
- Title(参考訳): 新しいレンズからの解釈可能性:生医学応用のための成層と領域知識の統合
- Authors: Anthony Onoja, Francesco Raimondi
- Abstract要約: 本稿では, バイオメディカル問題データセットの k-fold cross-validation (CV) への階層化のための新しい計算手法を提案する。
このアプローチはモデルの安定性を改善し、信頼を確立し、トレーニングされたIMLモデルによって生成された結果の説明を提供する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The use of machine learning (ML) techniques in the biomedical field has
become increasingly important, particularly with the large amounts of data
generated by the aftermath of the COVID-19 pandemic. However, due to the
complex nature of biomedical datasets and the use of black-box ML models, a
lack of trust and adoption by domain experts can arise. In response,
interpretable ML (IML) approaches have been developed, but the curse of
dimensionality in biomedical datasets can lead to model instability. This paper
proposes a novel computational strategy for the stratification of biomedical
problem datasets into k-fold cross-validation (CVs) and integrating domain
knowledge interpretation techniques embedded into the current state-of-the-art
IML frameworks. This approach can improve model stability, establish trust, and
provide explanations for outcomes generated by trained IML models.
Specifically, the model outcome, such as aggregated feature weight importance,
can be linked to further domain knowledge interpretations using techniques like
pathway functional enrichment, drug targeting, and repurposing databases.
Additionally, involving end-users and clinicians in focus group discussions
before and after the choice of IML framework can help guide testable
hypotheses, improve performance metrics, and build trustworthy and usable IML
solutions in the biomedical field. Overall, this study highlights the potential
of combining advanced computational techniques with domain knowledge
interpretation to enhance the effectiveness of IML solutions in the context of
complex biomedical datasets.
- Abstract(参考訳): バイオメディカル分野における機械学習(ML)技術の利用は、特にCOVID-19パンデミックの余波によって生成される大量のデータによって、ますます重要になっている。
しかし、バイオメディカルデータセットの複雑な性質とブラックボックスMLモデルの使用により、信頼の欠如とドメインの専門家による採用が生じる可能性がある。
これに対し、解釈可能なML(IML)アプローチが開発されているが、バイオメディカルデータセットにおける次元性の呪いは、モデル不安定につながる可能性がある。
本稿では, バイオメディカル問題データセットを k-fold cross-validation (CV) に階層化し, ドメイン知識解釈技術を統合するための新しい計算手法を提案する。
このアプローチはモデルの安定性を改善し、信頼を確立し、トレーニングされたIMLモデルによって生成された結果の説明を提供する。
具体的には、集約された特徴量の重要性のようなモデルの結果は、経路機能強化、薬物ターゲティング、データベースの再利用といった技術を使って、さらなるドメイン知識の解釈に関連付けられる。
さらに、imlフレームワークの選択前後のフォーカスグループディスカッションにエンドユーザと臨床関係者を巻き込むことで、テスト可能な仮説のガイド、パフォーマンスメトリクスの改善、生体医学分野における信頼性と有用性を備えたimlソリューションの構築に役立ちます。
本研究は、複雑なバイオメディカルデータセットの文脈において、AIMソリューションの有効性を高めるために、高度な計算技術とドメイン知識解釈を組み合わせる可能性を強調した。
関連論文リスト
- An Evaluation of Large Language Models in Bioinformatics Research [52.100233156012756]
本研究では,大規模言語モデル(LLM)の性能について,バイオインフォマティクスの幅広い課題について検討する。
これらのタスクには、潜在的なコーディング領域の同定、遺伝子とタンパク質の命名されたエンティティの抽出、抗微生物および抗がんペプチドの検出、分子最適化、教育生物情報学問題の解決が含まれる。
以上の結果から, GPT 変種のような LLM がこれらのタスクの多くをうまく処理できることが示唆された。
論文 参考訳(メタデータ) (2024-02-21T11:27:31Z) - XAI for In-hospital Mortality Prediction via Multimodal ICU Data [57.73357047856416]
マルチモーダルICUデータを用いて病院内死亡率を予測するための,効率的で説明可能なAIソリューションを提案する。
我々は,臨床データから異種入力を受信し,意思決定を行うマルチモーダル・ラーニングを我々のフレームワークに導入する。
我々の枠組みは、医療研究において重要な要素の発見を容易にする他の臨床課題に容易に移行することができる。
論文 参考訳(メタデータ) (2023-12-29T14:28:04Z) - Diversifying Knowledge Enhancement of Biomedical Language Models using
Adapter Modules and Knowledge Graphs [54.223394825528665]
我々は、軽量なアダプターモジュールを用いて、構造化された生体医学的知識を事前訓練された言語モデルに注入するアプローチを開発した。
バイオメディカル知識システムUMLSと新しいバイオケミカルOntoChemの2つの大きなKGと、PubMedBERTとBioLinkBERTの2つの著名なバイオメディカルPLMを使用している。
計算能力の要件を低く保ちながら,本手法がいくつかの事例において性能改善につながることを示す。
論文 参考訳(メタデータ) (2023-12-21T14:26:57Z) - High-throughput Biomedical Relation Extraction for Semi-Structured Web
Articles Empowered by Large Language Models [2.323261444126253]
関係抽出タスクをChatGPTのような大規模言語モデルの単純なバイナリ分類問題として定式化する。
本手法は,主タイトルをテールエンティティとして指定した半構造化ウェブ記事に適合する。
長さのコンテンツはテキストチャンクにスライスされ、埋め込みされ、追加の埋め込みモデルで検索される。
論文 参考訳(メタデータ) (2023-12-13T16:43:41Z) - UMLS-KGI-BERT: Data-Centric Knowledge Integration in Transformers for
Biomedical Entity Recognition [4.865221751784403]
この研究は、UMLSからテキストシーケンスを抽出することにより、バイオメディカルトランスフォーマーエンコーダLMの言語表現を強化するためのデータ中心パラダイムに寄与する。
予め訓練したLMの拡張およびスクラッチからのトレーニングによる実験の結果から,複数の生物医学的,臨床的な名前付きエンティティ認識(NER)タスクにおける下流性能の向上が示された。
論文 参考訳(メタデータ) (2023-07-20T18:08:34Z) - Interpretable Medical Diagnostics with Structured Data Extraction by
Large Language Models [59.89454513692417]
タブラルデータはしばしばテキストに隠され、特に医学的診断報告に使用される。
本稿では,TEMED-LLM と呼ばれるテキスト医療報告から構造化表状データを抽出する手法を提案する。
本手法は,医学診断における最先端のテキスト分類モデルよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-08T09:12:28Z) - BioADAPT-MRC: Adversarial Learning-based Domain Adaptation Improves
Biomedical Machine Reading Comprehension Task [4.837365865245979]
本稿では,生物医学機械読解作業のための逆学習に基づくドメイン適応フレームワークを提案する。
BioADAPT-MRCは、一般的なドメインデータセットとバイオメディカルドメインデータセットの間の限界分布の相違に対処するニューラルネットワークベースの手法である。
論文 参考訳(メタデータ) (2022-02-26T16:14:27Z) - Scientific Language Models for Biomedical Knowledge Base Completion: An
Empirical Study [62.376800537374024]
我々は,KG の完成に向けた科学的 LM の研究を行い,生物医学的リンク予測を強化するために,その潜在知識を活用できるかどうかを探る。
LMモデルとKG埋め込みモデルを統合し,各入力例をいずれかのモデルに割り当てることを学ぶルータ法を用いて,性能を大幅に向上させる。
論文 参考訳(メタデータ) (2021-06-17T17:55:33Z) - Boosting Low-Resource Biomedical QA via Entity-Aware Masking Strategies [25.990479833023166]
バイオメディカル質問応答(QA)は、膨大な科学文献から高品質な情報を提供する能力に注目が集まっている。
バイオメディカル・エンティティ・アウェア・マスキング(BEM)と呼ばれるシンプルなアプローチを提案する。
マスク付き言語モデルにより、ドメインを特徴づける重要なエンティティに基づいてエンティティ中心の知識を学び、それらのエンティティをLM微調整の推進に活用します。
実験結果から, バイオメディカルQAデータセットにおける最先端モデルと同等の性能を示す。
論文 参考訳(メタデータ) (2021-02-16T18:51:13Z) - Machine Learning in Nano-Scale Biomedical Engineering [77.75587007080894]
ナノスケールバイオメディカルエンジニアリングにおける機械学習の利用に関する既存の研究について概説する。
ML問題として定式化できる主な課題は、3つの主要なカテゴリに分類される。
提示された方法論のそれぞれについて、その原則、応用、制限に特に重点を置いている。
論文 参考訳(メタデータ) (2020-08-05T15:45:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。