論文の概要: Interpretability from a new lens: Integrating Stratification and Domain
knowledge for Biomedical Applications
- arxiv url: http://arxiv.org/abs/2303.09322v1
- Date: Wed, 15 Mar 2023 12:02:02 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-17 15:22:06.189488
- Title: Interpretability from a new lens: Integrating Stratification and Domain
knowledge for Biomedical Applications
- Title(参考訳): 新しいレンズからの解釈可能性:生医学応用のための成層と領域知識の統合
- Authors: Anthony Onoja, Francesco Raimondi
- Abstract要約: 本稿では, バイオメディカル問題データセットの k-fold cross-validation (CV) への階層化のための新しい計算手法を提案する。
このアプローチはモデルの安定性を改善し、信頼を確立し、トレーニングされたIMLモデルによって生成された結果の説明を提供する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The use of machine learning (ML) techniques in the biomedical field has
become increasingly important, particularly with the large amounts of data
generated by the aftermath of the COVID-19 pandemic. However, due to the
complex nature of biomedical datasets and the use of black-box ML models, a
lack of trust and adoption by domain experts can arise. In response,
interpretable ML (IML) approaches have been developed, but the curse of
dimensionality in biomedical datasets can lead to model instability. This paper
proposes a novel computational strategy for the stratification of biomedical
problem datasets into k-fold cross-validation (CVs) and integrating domain
knowledge interpretation techniques embedded into the current state-of-the-art
IML frameworks. This approach can improve model stability, establish trust, and
provide explanations for outcomes generated by trained IML models.
Specifically, the model outcome, such as aggregated feature weight importance,
can be linked to further domain knowledge interpretations using techniques like
pathway functional enrichment, drug targeting, and repurposing databases.
Additionally, involving end-users and clinicians in focus group discussions
before and after the choice of IML framework can help guide testable
hypotheses, improve performance metrics, and build trustworthy and usable IML
solutions in the biomedical field. Overall, this study highlights the potential
of combining advanced computational techniques with domain knowledge
interpretation to enhance the effectiveness of IML solutions in the context of
complex biomedical datasets.
- Abstract(参考訳): バイオメディカル分野における機械学習(ML)技術の利用は、特にCOVID-19パンデミックの余波によって生成される大量のデータによって、ますます重要になっている。
しかし、バイオメディカルデータセットの複雑な性質とブラックボックスMLモデルの使用により、信頼の欠如とドメインの専門家による採用が生じる可能性がある。
これに対し、解釈可能なML(IML)アプローチが開発されているが、バイオメディカルデータセットにおける次元性の呪いは、モデル不安定につながる可能性がある。
本稿では, バイオメディカル問題データセットを k-fold cross-validation (CV) に階層化し, ドメイン知識解釈技術を統合するための新しい計算手法を提案する。
このアプローチはモデルの安定性を改善し、信頼を確立し、トレーニングされたIMLモデルによって生成された結果の説明を提供する。
具体的には、集約された特徴量の重要性のようなモデルの結果は、経路機能強化、薬物ターゲティング、データベースの再利用といった技術を使って、さらなるドメイン知識の解釈に関連付けられる。
さらに、imlフレームワークの選択前後のフォーカスグループディスカッションにエンドユーザと臨床関係者を巻き込むことで、テスト可能な仮説のガイド、パフォーマンスメトリクスの改善、生体医学分野における信頼性と有用性を備えたimlソリューションの構築に役立ちます。
本研究は、複雑なバイオメディカルデータセットの文脈において、AIMソリューションの有効性を高めるために、高度な計算技術とドメイン知識解釈を組み合わせる可能性を強調した。
関連論文リスト
- Explainable AI Methods for Multi-Omics Analysis: A Survey [3.885941688264509]
マルチオミクス(multi-omics)とは、複数の「オム」から派生したデータの積分解析である。
深層学習の手法は、マルチオミクスデータの統合や、分子間相互作用の洞察、複雑な疾患の研究の強化にますます活用されている。
これらのモデルは、多くの相互接続層と非線形関係を持ち、しばしばブラックボックスとして機能し、意思決定プロセスにおける透明性を欠いている。
このレビューでは、マルチオミクス研究において、xAIが深層学習モデルの解釈可能性を改善する方法について検討し、臨床医に明確な洞察を与える可能性を強調した。
論文 参考訳(メタデータ) (2024-10-15T05:01:17Z) - Large Language Models in Drug Discovery and Development: From Disease Mechanisms to Clinical Trials [49.19897427783105]
大規模言語モデル(LLM)の創薬・開発分野への統合は、重要なパラダイムシフトである。
これらの先進的な計算モデルが、ターゲット・ディスリーズ・リンクを明らかにし、複雑なバイオメディカルデータを解釈し、薬物分子設計を強化し、薬物の有効性と安全性を予測し、臨床治験プロセスを促進する方法について検討する。
論文 参考訳(メタデータ) (2024-09-06T02:03:38Z) - A Survey for Large Language Models in Biomedicine [31.719451674137844]
このレビューは、PubMed、Web of Science、arXivなどのデータベースから得られた484の出版物の分析に基づいている。
我々は、診断支援、薬物発見、パーソナライズドメディカル医療を含む幅広いバイオメディカル・タスクにおいて、ゼロショット学習におけるLLMの能力について検討する。
データプライバシの懸念、限定されたモデル解釈可能性、データセットの品質の問題、倫理など、LLMがバイオメディシック領域で直面する課題について論じる。
論文 参考訳(メタデータ) (2024-08-29T12:39:16Z) - LLMs-in-the-loop Part-1: Expert Small AI Models for Bio-Medical Text Translation [0.0]
本研究では,医療用テキストに最適化された教師ありニューラルマシン翻訳モデルを開発するために,新しい"LLMs-in-the-loop"アプローチを提案する。
6つの言語での独自の平行コーパスは、科学論文、人工的に生成された臨床文書、医療文書から編纂された。
MarianMTベースのモデルは、Google Translate、DeepL、GPT-4-Turboより優れている。
論文 参考訳(メタデータ) (2024-07-16T19:32:23Z) - Interpretable Machine Learning for Survival Analysis [3.618561939712435]
解釈可能な機械学習(IML)や説明可能な人工知能(XAI)はこの10年でますます重要になっている。
簡単に利用できるIML手法の欠如は、公衆衛生における医療実践者や政策立案者が機械学習の潜在能力を最大限に活用することを妨げる可能性がある。
一般のIML分類学の文脈における生存分析のためのIML法に関する限られた既存の研究成果について概説する。
論文 参考訳(メタデータ) (2024-03-15T12:38:00Z) - An Evaluation of Large Language Models in Bioinformatics Research [52.100233156012756]
本研究では,大規模言語モデル(LLM)の性能について,バイオインフォマティクスの幅広い課題について検討する。
これらのタスクには、潜在的なコーディング領域の同定、遺伝子とタンパク質の命名されたエンティティの抽出、抗微生物および抗がんペプチドの検出、分子最適化、教育生物情報学問題の解決が含まれる。
以上の結果から, GPT 変種のような LLM がこれらのタスクの多くをうまく処理できることが示唆された。
論文 参考訳(メタデータ) (2024-02-21T11:27:31Z) - XAI for In-hospital Mortality Prediction via Multimodal ICU Data [57.73357047856416]
マルチモーダルICUデータを用いて病院内死亡率を予測するための,効率的で説明可能なAIソリューションを提案する。
我々は,臨床データから異種入力を受信し,意思決定を行うマルチモーダル・ラーニングを我々のフレームワークに導入する。
我々の枠組みは、医療研究において重要な要素の発見を容易にする他の臨床課題に容易に移行することができる。
論文 参考訳(メタデータ) (2023-12-29T14:28:04Z) - Diversifying Knowledge Enhancement of Biomedical Language Models using
Adapter Modules and Knowledge Graphs [54.223394825528665]
我々は、軽量なアダプターモジュールを用いて、構造化された生体医学的知識を事前訓練された言語モデルに注入するアプローチを開発した。
バイオメディカル知識システムUMLSと新しいバイオケミカルOntoChemの2つの大きなKGと、PubMedBERTとBioLinkBERTの2つの著名なバイオメディカルPLMを使用している。
計算能力の要件を低く保ちながら,本手法がいくつかの事例において性能改善につながることを示す。
論文 参考訳(メタデータ) (2023-12-21T14:26:57Z) - UMLS-KGI-BERT: Data-Centric Knowledge Integration in Transformers for
Biomedical Entity Recognition [4.865221751784403]
この研究は、UMLSからテキストシーケンスを抽出することにより、バイオメディカルトランスフォーマーエンコーダLMの言語表現を強化するためのデータ中心パラダイムに寄与する。
予め訓練したLMの拡張およびスクラッチからのトレーニングによる実験の結果から,複数の生物医学的,臨床的な名前付きエンティティ認識(NER)タスクにおける下流性能の向上が示された。
論文 参考訳(メタデータ) (2023-07-20T18:08:34Z) - Interpretable Medical Diagnostics with Structured Data Extraction by
Large Language Models [59.89454513692417]
タブラルデータはしばしばテキストに隠され、特に医学的診断報告に使用される。
本稿では,TEMED-LLM と呼ばれるテキスト医療報告から構造化表状データを抽出する手法を提案する。
本手法は,医学診断における最先端のテキスト分類モデルよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-08T09:12:28Z) - Machine Learning in Nano-Scale Biomedical Engineering [77.75587007080894]
ナノスケールバイオメディカルエンジニアリングにおける機械学習の利用に関する既存の研究について概説する。
ML問題として定式化できる主な課題は、3つの主要なカテゴリに分類される。
提示された方法論のそれぞれについて、その原則、応用、制限に特に重点を置いている。
論文 参考訳(メタデータ) (2020-08-05T15:45:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。